为什么每个营销人都应该考虑增量模型?
原创:MarTechApe
在现代市场营销从业者的机器学习技术工具包中,增量模型是一个越来越重要的工具。增量模型虽然适用于各种商业应用程序,但对营销人员来说尤其强大,因为它们解决了营销的核心目标之一:每个客户将如何回应特定的营销活动?在本文中,我们讨论了增量模型的营销案例,并在公共数据集上比较了各种常见的提升算法的性能。
指导性数据:从信息到优化
现代营销团队有各种各样的数据科学和机器学习技术可供使用。这些技术通常可以分为三类:描述性的、预测性的或指导性的。增量模型属于指导性模型,它向市场营销从业者提供了他们应该对每个用户该用何种营销策略的指导。
增量模型是什么?
增量模型是一种指导性的技术,它可以预测每个客户对营销活动可能产生的反应。基于这些预测,营销团队可以确定哪些客户可能是目标客户,以最大化对他们的进行的营销活动的投资回报率。
定义增量预测需要首先明确两个概念:
干预(Intervention):你希望衡量哪些营销活动的影响?
结果(Outcome):你的营销干预想要影响的转化活动是什么?
例如,如果我们考虑以推动客户交易(结果)为目标提供折扣(干预),我们对客户A的提升预测可能会告诉我们:“与不提供折扣相比,折扣将增加客户A 10%购买的可能性。”
为了建立一个增量模型,我们必须有来自随机对照试验的数据,其中一组随机的客户被作为干预对象(“实验组”),另一组随机的客户没有作为干预对象(“对照组”)。增量模型使用这一信息来区分四种类型的用户(见下图)。如果该模型能够准确地识别Persuadables(对营销活动敏感的人群)和Sleeping Dogs(营销活动会起到反作用的人群),那么营销人员就可以确定目标客户,以通过进行营销活动推动增量转换。
Persuadables:不发券就不购买、发券才会购买的人群,即优惠券(对营销)敏感人群
Sure Thing:无论是否发券,都会购买,自然转化
Lost Causes:无论是否发券都不会购买,这类用户实在难以触达到,直接放弃
Sleeping Dogs:与Persuadables相反,对营销活动比较反感,不发券的时候会有购买行为,但发券后不会再购买。
一些真实的例子
增量模型的优势可以延伸到许多常见的营销问题中,下面列出了一些常见的例子:
比较不同增量算法的性能
虽然增量建模是一种相对较新的技术,但有几种算法已被证明在实际环境中表现良好。我们比较了这些算法在X5和Retail Hero主办的竞赛中获得的公开数据集上的性能,以评估它们的相对性能。竞赛的目的是通过预测谁的购买概率会因短信活动而显著提升,从而确定哪些客户应该通过短信活动定位。
如何评价增量模型的性能
一个评估增量模型的挑战是来自于缺乏事实根据。也就是说,我们观察实验组中某一特定顾客的结果,但我们不知道如果该顾客在对照组中,结果会是怎样。为了克服这种反事实思维的限制,我们通过对某一组顾客设置测试集,对增量模型的性能进行评估。
一种常见的评估方式通过“增量分组”图(见下面的图1)进行可视化。这些图标通过三个步骤创建:
将所有测试集客户按预期上升降序排序。将用户分成k个等宽的堆(bin),其中#1的堆表示预测提升最高的用户,#k的堆表示预测提升最低的用户。
在每个堆内,计算两个转化率:(1)堆内接受测试的用户(实验转化率),(2)堆内未接受实验的用户(控制转化率)。
通过实验转化率-控制转化率做差计算每个堆内的实际增量。请注意,实际的增量是用百分比的差异表示的。
高质量的增量模型将显示在不同的堆之间最增量呈单调递减的趋势。如果我们看到这种模式,就表明我们观察到高预测增益的用户有很大的正向增量,而低预测增益的用户有很小(甚至是负向的)增量。
图1中的5个堆的柱状图说明了这种模式。bin1和bin2表示出正向的增量,表明在这些堆中的用户(Persuadables)在处理时转化率更高。bin3和bin4的增量可以忽略不计,这表明干预对这些使用者基本上没有影响(sure thing和lost causes)。bin 5呈负上升,表明干预降低了这些使用者转化的可能性(sleeping dogs)。
常见的增量算法
下面我们来介绍各种增量算法。这些算法并不是全部,因为大量的研究人员还在积极开发新的增量算法。
#1 单独模型 (Solo Model )
训练单个分类器来预测我们所感兴趣的结果,其中包括一个用来表示每个用户是否接受过干预的虚拟变量。在推论过程中,每个用户都会获得两次评分:一次是将干预的值设置为1,一次是将其设置为0。用户A的增益预测就是:当用户A在接受影响干预情况下的预测概率减去当用户A不接受营销干预时的预测概率。
#2 差分响应模型(Two Models)
训练两个分类器来预测的结果。分类器 #1仅使用干预组进行训练,而分类器 #2仅使用对照组进行训练。用户A的增益预测为用户A从分类器 #1的预测概率减去用户A从分类器 #2的预测概率。了解更多。
#3 类别转化法 (Class Transformation)
基于修改后的类标签Z训练单个分类器:
Z = 1 如果干预 = 1 & 转化 = 1
Z = 1 如果干预 = 0 & 转化 = 0
Z = 0 如果干预 = 1 & 转化 = 0
Z = 0 如果干预 = 0 & 转化 = 1
这个修改过的标签确保所有的对营销活动敏感人群都在正面标签组,而所有对营销活动比较反感人群都在负面标签组。用户A的增量预测被定义为用户A在这个分类器的预测。
#4 回归转换(Regression Transformation )
基于修改的类标签Z训练单个回归模型:
Z = 2 如果干预 = 1 & 转化 = 1
Z = 0 如果干预 = 0 & 转化 = 0
Z = -2 如果干预 = 1 & 转化 = 0
Z = 0 如果干预 = 0 & 转化 = 1
这个修改过的标签确保对营销活动敏感人群与对营销活动比较反感的人群不同。用户A的增量预测就是用户A对该模型的预测。
#5 倾向偏差 (Propensity Deviation)
训练根据以下标签为干预组的用户的单个回归模型:
假设Wi = 用户i在干预之前的先验转化概率(即概率分类器的输出)。
令Ci = 用户是否最终转换后干预的二进制结果
用户i的回归标签为Wi — C。
如果用户的预测转换偏离了他们的实际转换,那么这个标签属性会偏离处理。用户A的增量预测为用户A对该模型的预测。
结果
为了相对平滑,报告展现了五次运行的平均表现值,其中每次运行都随机选取了80% 的数据作为训练集训练,其余20% 的数据作为测试集进行表现的评估。
图2:增量条形图。对于这个数据集来说,回归转化法的总体表现较强(实际增益从Bin#1到Bin#5的极速减少)。尽管五种算法都能从数据中提取信息,但倾向偏差法相对来说最不成功。在几乎每个条形图中观察到的增益都是正的,这表明模型发现了相对较少的“对营销活动比较反感人群”。不同的算法可能最适合的问题/数据集不同,但是需要更多的研究来了解每种方法什么时候最有效。
什么时候增量模型最有效?
尽管增量模型在广泛的营销案例中表现得比较好,但它们在某些条件下往往会效果最好。当以下情况出现时,增量模型会有最好表现:
当营销团队的目标是影响短期用户行为 (例如交易)时。相反的,如果目标是影响像CLV这样的长期指标,增量模型可能效果不佳。
当团队拥有强大的营销激励措施时。如果干预不能有效地影响客户行为,那么即使是最好的模型也可能不会有任何增量。
结论
增量建模在数据科学界仍然是一个非常活跃的研究领域,但是它的实际应用在市场营销领域正在迅速发展。Uber、Wayfair等公司在越来越多依赖提增量模型。许多有关增量的技术已经在推动营销人员的投资回报率方面展现出显著的前景,并且随着更多创新企业在探索这种方法,进展很可能会加速。
了解了增量建模后,想要上手企业级项目,培养科技公司必备的商业思维,加入科技大厂产品/营销团队吗?MarTechApe的《A/B测试企业级实战训练营》以真实商业场景中的复杂A/B测试问题为项目背景,让学员在两个月的时间里,使用百万量级原始数据,搭建完整的A/B测试流程!
在过去开办的四期《训练营》中,我们为顶尖科技公司输送数据能力强、实验经验丰富、统计基础扎实的数据人才。不论你本来是什么背景,都能通过这门课程,打开盛行“测试文化”的互联网高科技公司的大门!
以下为往期学员的战绩榜:
🔥目前,MarTechApe《A/B测试企业级实战训练营》正式火热报名第5期!🔥
每一期训练营,我们只招收20名学生。
👇点击下方按钮,了解项目详情!👇