用大数据和机器学习探索智慧定价
曾奇志
作者单位:西门子(中国)有限公司智能基础设施集团销售商务总监
【摘要】每个公司都有自己的产品定价体系,会根据市场、客户、产品等特点,以及结合历史数据和经验来定价。但传统的定价模式总会忽略一些影响定价的相关因素,或难以获取相关因素的完整数据、或数据量太大很难计算。本文介绍了利用大数据和机器学习从传统定价模式向新型智慧定价模式转型的思考与实践。通过对业务价值链上所有对定价可能产生相关影响的因素梳理,对不同的产品系列做出了不同的智慧定价模型的探索与尝试。
【关键词】大数据;机器学习;探索;智慧定价
一、传统定价方式及所遇困惑
一个企业产品的售价是一个复杂的体系,通常会根据产品的成本、功能、目标客户群、竞争态势、业务战略以及市场供需情况的预测等因素对产品定价。传统的定价方式有“竞争导向定价法”“目标利润定价法”“认知价值定价法”“成本加成定价法”等。
竞争导向定价法是指企业通过研究竞争对手的生产条件、服务状况、价格水平等因素,依据自己的竞争实力,参考成本和供求状况来确定产品的价格;以市场上竞争者的类似产品的价格作为本企业产品定价的参照系的一种定价方法。主要适用于竞争激烈或者产品同质化程度较高的行业。这种定价方法往往过分关注了价格竞争,却忽略了自身产品存在差异化的竞争优势,且容易引起竞争者的报复,甚至恶性竞价,导致毫无利润可言。
目标利润定价法,是根据企业预期的总销量与总成本来确定一个目标利润的定价法。适用于在市场上具有一定影响力、市场占有率较高或具有垄断性质的企业,核心是要找出损益平衡点。这种定价方式更多是从企业自身的利益来考虑的,没有太顾及市场竞争、现实的供需情况以及产品的成本结构差异,而且不一定能保证企业预测的销售量的实现。
认知价值定价法,是企业根据购买者对产品的认知价值来制定价格的一种方式。适用于新产品、尤其是新技术产品的定价。这种方式的基础理论是认为某一产品的性能、质量、服务、品牌、包装和价格在消费者的心目中都有一定的认知和评价,是从市场消费者的心理出发,根据他们的认可度来看他们愿意出多少钱来购买,而不是从产品本身的成本费用水平来考虑定价。
成本加成定价法,是指按产品单位成本加上一定比例的利润来制定产品价格的方法,这是企业较常用的定价方法,适用于非竞争产品。它的好处是能保证企业的成本费用得到补偿后还有利润可赚,价格在一定时期内也相对稳定,而且计算简单。但是考虑的因素太单一,忽略了市场供求、竞争态势、周期性变化等等,这样可能会导致产品的销售无法灵活应对市场的变化,不利于提高企业的经济效益。
总之,我们不难发现,传统的定价方法有多种,但是无论用哪种方法人们在实际商战中总会感觉到有些欠缺和困惑:面对不同的最终用户、不同的业务场景、不同的竞争对手,到底我们的价格是否有竞争力?当今已是数字经济时代,我们决定与时俱进,用高科技手段来进行探索。
二、用大数据和机器学习来推荐价格
1.立项与目标
首先,我们思考了是否应该正式立项并且投入去探索。
数据现如今已渗透到了每个行业及领域,成为了重要的生产因素。它的应用不仅成为了国家的重要战略,也是企业发展的重要战略。数据是具有价值的,通过数据分析可以把看似杂乱无章的数据背后隐藏的信息和洞察力被揭示出来,帮助我们找出事物间的内在规律,为我们的业务决策提供有力的证据。人工智能在大数据时代下也以突飞猛进的速度在发展,它更是一门集数学、计算机科学、控制论、信息论、神经心理学、哲学、语言等多学科研究上发展起来的一门综合性交叉学科。这是一门引领未来的科学,可以渗透到人类生产、生活的诸多方面。它的研究与应用包括了机器感知、机器思维、机器学习、机器行为、计算智能、智能应用等方面。
我们想做的探索是把传统的统计学的抽样学习向全体数据的学习做出转变。这不仅需要专业人士投入时间精力,还需要真金白银投入软硬件,但也一定是具有划时代意义的一种新工作方式的尝试,于是公司决定正式立项。由商务部牵头,联合销售部、市场部、产品研发部以及数据科学家成立了项目组。
我们目标明确:数据建模、智能运算,既要通过历史分析,又要结合当下市场及每一个订单的业务背景考虑,对售价做出预测建议,供价格审批者参考。机器学习的输出结果必须是在线实时的,能根据订单的更改调整,及时反馈结果。
该目标无论对硬件网络、数据仓的开发、搭建,还是建立智慧定价模型算法的探究,都提出了很高的要求,项目难度非常大。于是项目组分成了两个小组,一组负责硬件;另一组同事负责搭建智慧定价模型。
2.建模与算法
无疑,建立定价模型是这个项目的第一核心任务。我们花费两个多月,对销售端到端价值链上参与价格审批的间接和直接的环节以及人员进行了详细地调研和梳理,确立了定价考虑的几大方面:业务场景、客户情况、销售渠道、历史订单等。
对于业务场景我们会考虑该业务项目发生的区域、行业等要素;对于客户情况,我们会考虑客户的采购量级、新老客户等要素;对于销售渠道,我们会考虑是分销业务还是直销业务等要素;对于历史订单,我们会考虑订单价格、产品系列及数量、毛利等要素;除此之外,我们还会考虑竞争态势、宏观经济情况等因素。这些维度,经过拓展分析,提取特征值,最终我们总结了上百个可度量指标。同时我们计划提取过去年度的订单数据。用传统的方式根本无法处理这样海量的数据。在这种情况下,利用大数据和机器学习的方式来智慧推测定价是势在必行的。
接下来我们需要寻找合适的算法模型。但是哪一种算法是适合我们项目的呢?我们需要从上百种变量中去找寻它们对定价的相关性,不断地在模型上学习迭代,给出一个合理的价格或是价格区间的建议。这是我们项目的第二核心任务。模型的选择需要结合业务实际情况,首先,它需要处理大量特征值;其次,它要高效运行并减少内存占用,能实时输出结果。
经过与数据科学家的讨论,我们对不同的产品系列,做出了不同的尝试。比如针对某些系列的产品,我们用了Light GBM 算法(Light Gradient Boosting Machine“轻量级梯度提升机”)。它的特点是效率高、运行速度快,处理大规模数据时表现出色,且占用的内存少。它属于“决策树”类型,既是回归又加分类的一种算法。它利用基于树的学习算法,通过梯度提示框架来构建和优化模型,以提高预测的准确性,在金融、工业、商业等领域受到广泛的青睐。Light GBM针对特征多的情况采用了互斥特征捆绑算法,对特征进行最小程度损耗合并;针对运算速度和内存优化问题,它利用直方图的算法,通过将连续特征值分段为 discrete bins来加快训练的速度并减少内存的使用。
针对有些系列的产品,我们尝试了 NMF(Neural Matrix Factorization “神经网络矩阵分解”)算法。这是一种将高维矩阵降维分解,机器深度学习的一种算法。当人们试图研究多个指标的问题时,会发现由于变量太多,使得研究过程变得非常复杂;与此同时,不同的变量之间又会存在一定的关联性,使得观测数据在一定程度上有信息重叠,这无疑会降低运算效率。于是数据科学家建议我们尝试矩阵分解。它的核心办法是将一个高维矩阵降维分解为两个低维矩阵的乘积,提高神经网络在处理数据时的效率和准确性。在我们的项目中,我们就是要让机器能从历史数据中挖掘到和当前订单的客户吻合度极高的类似客户曾经购买过该系列产品的卖价来推荐当下订单的卖价。
3.输出与验证
数据模型组历时 8个月,在处理了大量的数据与多轮测试之后,有了输出结果。针对有些产品系列,我们是给出价格推荐区间:正常、中低、极低。当销售申请的价格落在正常价格区域,价格审批者可以批准;而落在中低或极低区域的价格申请,价格审批者就需要格外谨慎。但这并不意味着审批者要拒掉所有的中低或极低的价格,他可以综合考虑订单的实际情况或是同意或是另给建议价格。针对有些产品系列,我们的模型给出的是价格绝对值的建议。
最终批复的价格及备注的理由都会被系统记录,传到云端,供机器不断学习。这种新的操作方式跟过去相比,最大的不同是,过去审批者是基于经验和有限的历史参考值相对主观地对价格做出判断,而现在是基于大量的数据和更多的业务因素特征值与定价的相关性更客观科学地来审批价格。
为了验证模型的输出结果,我们取了过去 3年的实际订单价格进行比对,看模型输出结果和实际订单价格的偏离。例如在 Light GBM 模型下,我们得到的RMSE(Root Mean Squared Error)均方根误差显示偏移值0.021,平均误差在 1.5%。RMSE越接近 0越表明模型的预测更准确,所以这个结果大家都很满意。接下来希望模型通过对更多数据的学习迭代,偏离越来越小。
4.实施与监控
有了模型和测算结果,就到了万事俱备只欠东风的时候。东风是什么?那就是我们需要的硬件环境。我们的数据大致有两类:一类是历史数据,另一类是价格审批平台的实时数据。两类数据都会被送到云端,供我们的智慧定价模型运算学习,之后将结果数据传回到价格审批平台。这是一个周而复始的工作。
在我们数据建模组工作的同时,硬件小组的同事们也在紧锣密鼓地进行数据仓和云环境的部署。对于数据同步以及频率,我们也做了精心的测算和策划。当所有的硬件软件接通的那一刻我们终于迎来了智慧定价项目的成功实施。
然而,实施成功并不意味着项目就此结束,我们还必须对事后数据进行监控和分析。于是我们开发了一个商业智能可视化报告来反映价格审批的情况,比如审批者采纳建议价格与否?比如新方法对订单是否带来了负面影响等。值得一提的是,我们在项目实施后的半年跟踪发现订单不仅没有因此下滑,反而有节约资金的潜能。这颠覆了多数人认为丢单都是价格不好导致的,或者是低价才能中标的认知。而且在模型把众多的影响定价因素对于价格的相关性做了排序之后,我们惊讶地发现,过去根据经验认为很重要的一些因素在客观数据面前的排位并没有我们心目中那么高,这是非常有意思的事情,值得我们进一步分析研究。我们也会根据此次的经验将模型逐步扩展应用到更多的产品系列去做进一步的智慧定价探索和尝试。
大数据、机器学习和 AI等技术是时代发展的伟大产物,它们为我们的业务管理开辟了更新的方向,提供了更多元的思路,拓展了更科学的维度。数据被称作新商业时代的货币,拥有它显然还远远不够,我们要利用它、分析它,使其创造价值,提高决策者的洞察能力,从而制定更正确的战略。作为企业管理者,我们应将这些高科技手段不断且全面地推广到管理的各个方面,以科技创新驱动业务发展,相信我们未来的管理水平会站上新的台阶。
参考文献
[1]姚根兴 .世界 500强企业管理层最钟爱的管理工具 .人民邮电出版社,2020.
[2][挪 ]拉金德拉 ·阿卡拉卡(Rajendra Akerkar)、[印 ]普里蒂 ·斯里尼瓦斯·萨加(Priti Srinivas Sajja)著,毕冉译 .大数据分析与算法(Intelligent Techniques for Data Science).机械出版社, 2018.
[3]林正炎、张朋、梁克维、庞天晓 .大数据教程——数据分析原理和方法 .科学出版社,2020.
[4]费敏锐、孟添 .人工智能应用 .中国人事初版社,2023.
[5]王彦、马进 .数据分析基础 .中国人事出版社 .2023.
[6]Light GBM中文文档 https://lightgbm.cn/docs/4/
[7]mob64ca1404ed659(作者署名).神经网络矩阵分解 神经网络 分类算法——51CTO博客.2023.10.29(网络文章).
[8]禅与计算机程序设计艺术(作者署名).矩阵分解与神经网络——CSDN博客 .2024.01.09(网络文章 ).