建议分析(Prescription Analysis)

建议分析(Prescription Analysis)

对症抓药- 建议分析(Prescription Analysis)的强大力量

数据科学的核心是机器学习。但在现实环境中,教科书式的问题如;分析谁会购买,评估网页排名或预测系统将崩溃,如此简单明白的课题往往是不存在的。而在这篇文章中,我们会从更实际的情景来讨论数据科学的使用, 而建议分析(Prescriptions Analysis)作为将【机器学习】和【全局优化】相结合的技术,在解决日常中实际的问题如何扮演一个重要的角色。

建议分析-该做什么,而不是将要发生什么

这个部分,我最喜欢的用RM创始人之一的 Igno Mierswa所引用例子来解释的了 。假设你有一个机器学习模型,它预测明天会下雨,这对你意味着什么?你是开车去上班还是骑自行车?嗯,我开车吧。但大家都知道要下雨,所以你不可能是唯一一个开车的人。结果可能是交通堵塞了一个小时。尽管下雨,可能还是还是继续骑自行车好吧,对吗?这个时候你的决定不只有天气,可能也要包括交通的预测,来对于之后的行动做出最好的决定。如何做呢?


方法是首先定义一个合适度函数(Fitness Function),作为判断方案的和适度。然后将天气预测(可能是根据历史资料做的回归分析),预期的交通状况(可能是依照路况做分类分析)和您的个人喜好(这个可能是决策树分析)。把所有的考量模型都放入其中,而后调整输入的变量(雨量大小,出发时间,等等。。)而后找到一个最优化的解决的条件(如;早上9点高峰前开车出发,躲雨又不堵塞),这就是建议分析!这样做的目的不仅是预测将要发生的事情,还可以就该做什么提出最优化的建议。

在实际的世界中,很多时候其实的状况多是如此,没有一个简单的问题,然后用某个数据分析的方式就解决了。就算是使用所谓的QBQ/CRISP-DM 的思考框架,也通常是没有办法单纯化成几个简单数据分析而方式解决。 必须在考虑上做全局的规划,平衡多个并行的模型之后而细部的分析,综合全部的状况而提出最优化的建议。

实际做法 明白其中的概念,帮助实际的问题

用一个例子来说明;我们希望找到产品的最优价格。首先我们可以用不同的价格,然后评估客户接受我们的报价的信心度大于0.75(自己定义的阈值)来做评估。首先我们建立一个目标公式,也就是使用自定义的和适度(Fitness)作为量化标准,而后公式如下:

         Fitness = Price – IF([confidence(accept)]<0.75, (0.75-[confidence(accept)])*,0)[1]


这个公式的意思是当我们每一次变动价格(例如上调0.1元),我们评估(依照之前某个客户的接受度回归模型)的接受意愿的机率。在IF的方程式;【如果小于0.75->【条件成立】->【一个大复数值】->【因为导致Fitness下降】。反之就为零(但注意 Fitness上升因为价格调涨了)。其在Rapid Miner 中的实现是如此:


上面描述的Rapid Miner的流程是;首先得出一个用来预测客户接受度预测的回归模型。接下来,我们进入优化操作,Optimizer输入我们要优化的参考数据,还有设置阈值和回归模型。在优化操作元的自动循环运算中,不断调整其Fitness 的数值。由于优化是单变种,我们可以使用二维的网格做分析。计算方式可以使用 CMA-ESBYOBA 或进化优化(Evolution Optimization。而结果是下图:


从图中可以看到,Fintess(也就是价格)的度数首先上升与价格同时上涨,然后下降,因为信心低于0.75,这个可以直观的理解价格愈高,其Fitness的数值就越低呢。最后可以判断出的最优价格为:976元。

学霸和奸商 - 找到最有效的平衡,才能实际发挥作用

所以建议分析可以说是在商务和技术之间,所能得到的最有效的数据分析结果。其侧重于在现有数据中寻找最佳操作方案,强调可执行的建议和最优化的结果,而不是单纯的数据分析,而这个在RapidMiner中有特别的操作元和外挂(Extension,专门负责这类型的操作

建议分析在业界中使用非常广泛,包括从股票基金的买卖,市场价格的判断,都已经是非常成熟且完备。但是不论如何,其基础的部分,仍然建构在所有的数据分析模型之上。所以学习数据分析,必须能对于实用考量和技术能力之间,取得全面的了解,才是真正平衡学术和实用的数据科学家。




    • Related Articles

    • 营销的灵魂拷问

      所有公司在营销方面基本都面临三大挑战:客户理解、 ROI优化和潜客转换。到底是哪些人为什么会购买我们的产品?投入的营销费用到底效果如何最优化?如何把有可能的潜客最有效的转为购买顾客?而这三大灵魂拷问一直困扰着营销人员。 如要解答这些深刻的问题,必须首先要明白客户的购买需经过一个称之为客户历程(Customer Journey)的流程,能对其中不同的阶段,进行清楚确定、量化分析、确实理解并强化效应,这才是真正营销要考量的核心,而能有意义的回答以上的问题。 ...