就像是那些最好的电影一样,数据也可以讲述很好的故事——你只需要知道怎样去分析、可以用哪些方法。
有许多高级的统计分析技术可以用来帮助发现那些乍一看没什么特别的数据背后隐藏的故事和价值。
在这篇文章里,我们将通过一个例子来讲述三种统计分析方法——因子分析(factor analysis)、聚类分析(cluster analysis)和CHAID分析(卡方自动交互检测法,Chi-square Automatic Interaction Detector)。这三种统计分析方法通过更好地归类数量庞大的变量,定义出不同用户细分,从而帮助我们解锁市场中关于消费者额外有价值的信息,方便我们更清楚地观察消费者。
在这个例子中,我们将根据电影爱好者是如何判断新上映电影是否值得他们一看,来把这些电影迷归类到不同的群组中,并对每个群组进行具有代表性的定义。而实际上我们在这个例子中用到的方法和工具同样可以很方便地应用到任何市场细分问题中。
什么是市场细分(market segmentation)?市场细分是通过市场调研,通过理解关于消费者需求、他们在选择和购买商品的过程中是如何抉择的这一系列购买行为方面存在的差异,把某一产品或服务的市场划分成针对若干消费者群体的市场分类过程。每一个归类成的消费者群体就是一个细分市场。通过市场细分,我们可以建立一组具有相似条件或属性的用户画像。有了这些信息,公司就可以识别出那些最适合他们产品或服务的消费者群体,并投其所好。比如在查找关于新电影的信息的时候,电影迷们会有很多不同的方式。通过对这个市场进行细分,我们可以对不同类型的电影爱好者以及他们分别具有的特征搭建出一幅幅画像,以便在之后推广新电影时,可以提高我们如何与这些电影爱好者进行沟通的技巧和方式。细分的最终目标是如何获取并留住目标用户。良好的细分研究可以识别和描绘出有前途的目标市场,从而可以通过最佳的营销策略去触达。
高级的统计分析——尤其是因子、聚类和CHAID分析,可以帮助我们生成一个强大的细分,并对目标受众有一个清晰的认识。
因子分析:把一些信息重叠、彼此相关性较高的因子(在这个例子里总共有32个)归结为少数几个彼此互不相关的综合性因子,更方便后续分析中对变量的管理。CHAID分析:用来帮助我们更好描绘分出来的每个群组。
因子分析是通过简化变量因素以进行更集中的分析。这种统计方法被广泛用于检验各个属性之间的相关性。这允许我们将大量跟事件相关的属性,即变量因素,归纳并减少为几个具有代表性的概念。由于现在会分散我们注意的因素减少了,我们就可以更专注于最终的问题。
比如当问到关于影响电影选择的各种来源时,我们调查的电影爱好者表示Facebook评论、Twitter评论以及网上影评的一些评论会影响他们的观影选择。那么利用因子分析,我们就可以科学地把这些因素统一归成一个单独的因子——社交媒体评论。
通过这个方式,我们能够将这个例子中总共32种因素提炼成4类因子:
聚类分析将具有相似性的个体归到一起来展现一个细分群体。在我们做过因子分析,将32个因素减少、归纳为4类以后,我们接着就可以跑一下聚类分析了。聚类分析是一种用户分类方法,所谓“物以类聚”,这项技术揭露了此前不曾明确的数据中的联系和结构。它通过数学计算将消费者安排到不同群组中。其目标是建立一串群组,在同一个群组内的个体相比跟另一个群组的个体之间要有更多相似性。
这些群组需要有可以很容易描述出来的、区别明显的特征。群组数量的控制也要合理,分了太多组或太少组都会影响分析人员的判断。
值得注意的是,聚类分析作为一种数据缩减技术,跟来自同一家族的因子分析有些相似。然而,因子分析是寻求将所有属性或变量进行归纳,而聚类分析则关心将每个数据个体——在这个案例中就是指这些电影爱好者们,进行归纳分组。
当我们根据因子分析归出的四类因子进行聚类分析时,出现了三种不同的细分群体。在群组1中,受访者认为社交媒体上的评论和身边人推荐非常重要,对于奖项或提名则保持中间的态度,并觉得官方出版物的评价是最不重要的,所以我们将这一群体概括为“Word of Mouth”。群组2跟群组1不一样的是,他们给官方出版的评价给了更高的权重,给社交媒体评论和亲朋好友推荐的权重很少,我们管这部分人叫“Critically Acclaimed”。而群组3——“Hollywood”则对获奖提名和官方出版评价都很看重。
现在,有了这三类不同的电影爱好者的群组以后,我们可以使用CHAID分析来对每一群组有一个更深的理解。CHAID分析可以作为一种强有力的技术来帮助对细分群体进行描述。CHAID分析是决策树分析中最常见的一种类型,并被用来帮助理解不同变量如何去影响或预测结果。这项技术最主要的优势是其分析结果非常直观且易于解读(输出的是一个树状图形)。CHAID分析构建了一个模型,来帮助确定给定因变量情况下,自变量如何最好地合在一起解释结果,即根据给定的因变量和自变量对细分群组进行最优分割。大致方法是数据集会根据最显著变量不断被分割成两个或两个以上的类,直到再没有自变量剩下可以继续分割数据集为止。然后我们就会得到一幅关于每个群组中电影爱好者的特征画像,来帮助我们更深入地理解消费者。
典型的“Word of Mouth”群体具体是什么样的呢?当我们审查数据的时候,我们发现最能定义这个细分群体中的人的变量是电影院品牌。得到的数据分割结果之后引导我们根据年龄和收入再次分割,得到了对Word of Mouth这个细分群体更详细的描述——年龄在16到35岁,年收入少于三万五英镑,并且是去一些大型连锁电影院观影的群体。Critically Acclaimed群体是一群相比Word of Mouth来说,年龄更大,年收入高于六万五英镑,并且更喜欢去本土或一些小众电影院里观看电影的人。
而Hollywood群体的原型是一群通常居住在伦敦、伯明翰、曼彻斯特或利物浦,年收入低于五万五英镑,年龄在16到44岁之间且没有小孩的人们。根据可获得的数据以及分析的目标,市场细分可以通过许多不同的方法进行。这些统计分析方法帮助我们解锁了隐藏在数据背后的更多有价值的信息,让我们可以对消费者有一个更清楚的认识,从而制定更加可靠的营销计划去触达他们。至于如何衡量这些营销计划的效果如何,那就又是另一个故事了......
如果你觉得这些分析方法很有用,想系统学习专门针对市场营销、用户细分的更多分析方法,不要犹豫,快来报名MarTechApe《营销分析专项系列课程》吧!目前第三期已开始火热招生!囊括五大营销分析方法的MarTechApe精品课程《营销分析专项系列课》专注于提高营销人员的数据分析能力,提高营销人职场竞争力,已被1000+学员验证有效。由MarTechApe联合美国的一线营销分析和营销技术专家们共同研发推出,由以下美国名企管理层执教:
- 苹果公司硅谷总部(前Ebay资深数据分析师),营销数据科学家
- 美国最大家具电商平台Wayfair,营销数据科学经理
这门专项系列课由5个模块组成,涵盖了5种应用最广泛的营销和商业分析方法:
五大营销分析方法代表了Marketing Analytics领域最前沿的主流方法,是营销分析师/数据分析师为了测量营销效果必须掌握的重要方法和商业分析手段。 | 独角兽公司(共享民宿) 硅谷总部营销科技经理——《营销归因》 1. 什么是追踪?详细介绍不同的追踪方法: URL Tracking Pixel Tracking Deep Linking 3. 什么是营销归因?企业为什么有必要做营销归因? 4. 单触点归因模型的不同种类与做法 5. 多点归因模型的不同种类与做法 6. 用户生命周期总价值(Customer Life Time Value) 7. 营销归因中涉及到的各类高阶分析: 预测LTV 用户细分(User Segmentation) 同类群组分析(Cohort Analysis) 增量测试(Lift Test) 跨设备追踪(Cross Device Tracking) 全渠道分析(Full Funnel Analysis) |
| 全球最大媒介购买公司GroupM 纽约营销分析经理——《营销组合模型》 1. 营销组合模型(Marketing Mix Modeling)是什么,它为什么可以有效提高营销绩效? 2. 营销组合模型可以解释哪些业务指标?衡量哪些变量对业务指标的影响? 3. 如何评价一个营销组合模型的好坏? 4. 如何通过模型判断广告效果和营销收益?模型中的重要参数:Decay、Lag、Alpha都是什么? 5. 如何通过模型结果计算与比较媒介渠道效果? 6. 模型结果的解读: 模型分解 变量贡献 媒介有效性和媒介效率 7. 通过模型结果进一步获得商业洞察 8. 行业里流行的另一种解决方案——领先指标模型 9. 营销组合模型的典型面试问题 10. 营销分析师与营销分析经理的技能要求和典型一天 |
| 1. 什么是媒介测试与学习(Media Test & Learn)?为什么我们需要在广告营销领域使用这种方法? 2. 在实际工作中会做哪些关于广告的实验?有哪些测试的对象? 3. 如何设计一个实验,实验设计的6个步骤,在A/B测试设计中的注意事项
4. 检验实验数据的可靠性和完整性
5. 如何分析实验结果 6. 如何根据样本来估计整体均值或比例的置信区间 7. 如何针对某一指标/metrics来判断实验组和对照组的区别在统计上显著 8. 如果想同时测试多个指标,应该注意哪些事项? 9. 什么是PSA,为什么我们需要PSA,PSA的劣势 10. 什么是Ghost Ads?PSA和Ghost Ads的区别 11. 营销战役的ROI与增量 12. 选择偏差 13. 因果影响分析 14. A/B测试的局限
15. A/B测试的延伸:Universal Control Group与Multi-Armed Bandit |
| 美国最大家具电商Wayfair 波士顿营销数据科学经理——《增量模型》 1.什么是因果与因果推断? 2.有哪些因果研究方法? 3.增量在营销中指的是什么?什么是营销产生的收入(Incremental Revenue)? 4.增量模型将用户分成哪些类型?如何比较不同营销策略的效果? 5.什么是Heterogeneous Treatment Effects? 6.增量模型中的随机实验 7.增量模型与机器学习;增量模型要解决的挑战 8.增量模型的进阶技术 9.用一个案例来理解增量模型的完整流程
10.用Python来实现增量模型 |
| 美国电信巨头Verizon 纽约营销效果经理——《营销中的随机森林》 1. 什么是决策树?决策树在营销中的案例分析 2. 最常见的聚类分析:K-means与Hierarchical Clustering在营销中的应用。在R语言中实践两种不同的聚类分析方法与结果解读 3. 随机森林算法原理 4. 如何解读随机森林的结果,如何判断随机森林模型的好坏 5. 用一个案例来理解随机森林的完整流程 6. 在R语言环境中实现随机森林模型 7. 随机森林分类模型与随机森林回归模型 8. 其他机器学习算法在营销中的应用 9. 机器学习在营销分析岗位面试中的真题解析 |
(戳我可以了解课程设置详情)
报名方式
*我们提供标准Invoice,可用于企业报销
如果你曾购买过本专项中任意一门课程,请咨询小助手获得购买方式(如果你买的课程不在这五门之列,请勿扰)
小助手
朋友会在“发现-看一看”看到你“在看”的内容