Random Forest (随机森林)零基础入门
Random Forest (随机森林)零基础入门
作为在市场营销领域中新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用场景,既可以用来做市场营销模拟的建模,统计客户来源、保留和流失,又可以预测销售额、电影票房。
作为在市场营销领域中新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用场景,既可以用来做市场营销模拟的建模,统计客户来源、保留和流失,又可以预测销售额、电影票房。近年来,更是和Marketing Mix Modeling双剑合璧,一个是cross-sectional data的modeling方法(Random Foreest),一个则是time series的modeling(MMM),各有所长地解决不同的营销问题。
那为什么营销人都要学会Random Forest呢?
1. Random Forest随机森林
Email Marketing- 你会预测用户什么时候会Unsubscribe吗?
营销人尤其关心评估过去campaign的表现并以此预测未来的campaign。一个常见的metric就是客户流失率(churn)。这时你就可以建立一个有效的分类模型,利用历史数据和机器学习的方法(随机森林)来把客户分成会流失的不会流失的。公司基于模型结果可以用调整他们发出email的frequency或考虑使用其他传播渠道。
Sales Forecast- 你能预测公司6周后的Sales吗?
营销人经常会被要求提前预测销量。比如你在一个城市要新开几家新的店铺,每家店铺的sales都受到以下例如因素的影响:地理位置、促销活动、Holidays、seasonality、地域特征等等。你就可以利用随机森林模型来获得每个因素对sales的影响力。店铺可以根据模型结果来调增?
Recommendation System- 你知道要给客户推荐什么产品吗?
营销人面对的另一大难题就是,如何投其所好、给不同的用户推荐不同的产品?随机森林,与矩阵分解(Matrix Factoriza)、逻辑斯特回归(Logistic Regression)、 GBDT(Gradient Boosted Decision Trees)等机器学习方法,被Netflix等公司广泛运用到个性推荐系统中,为消费者个性化推荐新产品。
那说了这么多,那随机森林到底是怎样的一种算法呢?随机森林的本质属于机器学习的一大分支——集成学习(Ensemble Learning)。如果你接触过决策树(Decision Tree)的话,那么会很容易理解什么是随机森林。随机森林的基本单元就是决策树。一片森林就是由一棵棵的树组成的(是不是很形象)。每棵决策树都是一个分类器,讲input分成不同的类型。对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出。
文字的描述总是抽象的,所以MarTechApe携手Analytics Manager @ Verizon,继MMM、Attribution、A/B Testing等营销分析技术之后,再向营销人们推出重磅课程:《Random Forest 101》
接下来我们就来看看课程内容吧!
2.课程大纲
6节课,教你零基础入门Random Forest,并在R上教学!
What is a decision tree?
决策树入门介绍
决策树适合解决哪类问题?
决策树的关键指标
决策树的缺点与局限
Clustering
为什么要做Clustering
Clustering in R
常用的Clustering方法
K-means
Hierarchical clustering
Random Forest - Algorithm
随机森林的概念和算法原理
Random Forest - How to access the result
Random Forest model in R
如何解读随机森林的模型结果
解读结果的注意事项
Random Forest - Examples and applications
随机森林在营销中的应用
随机森林和Regression的比较
Other Machine Learning Algorithm
面试技巧
3. 课程主讲老师
7年Advanced Analytics工作经验、面试过上百候选人的领域专家主讲
前GroupM Senior Manager,现就职于Verizon
擅长Random Forest、Marketing Mix Modeling、Optimization等营销领域的数据建模、机器学习方法
4. 课程安排
课程由6节线上视频课组成,每节课均为录播视频。PPT、课件等材料均可下载,学员可在任意时间观看课程。
第1节课将在(6/29)美东时间本周五8pm上线;第2到第6节课会在每周五晚一一解锁。