MarTechApe

View Original

文科/社科/商科学生如何转型数据科学家?

近一个求职者问我,如果他的教育背景侧重于市场营销和社交媒体运营,而非传统的数据科学背景,他该怎样才能成为一名数据科学家呢?

他已经意识到自己的竞争对手是那些有着CS和数学背景的人,所以他只好奇两个问题:

  • 如果没有CS或者数学学位,他就不能成为数据科学家吗?

  • 为了成为一名数据科学家,哪些技能或者编程语言是他最先应该学的?

在回答他是否需要一个新的学位或者应该学习哪些编程语言之前,让我们先来想想一个最大的问题:没有传统的数据背景,我该如何找到一份数据科学家的工作呢?

想要达成这个目的,你需要做三件事:

  • 找到对的途径

  • 找到对的公司

  • 找到对的培训项目

1.找到对的途径

进入一家公司一般有两种途径——常规的人力资源(HR)途径和内推途径。HR途径就是通过招聘人员、公司招聘网站、招聘系统,或者申请实习来找到工作;而内推途径则是通过招聘经理或或者公司的现任员工来申请工作。

HR途径上会有很多的求职者与你竞争,可能在你被面试之前,这些人就已经被面试过一遍了。但在内推途径中,你通常能够直接地与决定是否录用你的人以及最终与你共事的人或团队打交道。

对于那些只拥有市场营销教育背景的求职者来说,获得一份数据科学家工作的最佳途径就是选择内推。因为传统的HR途径大多会首先剔除这些没有数学或cs学位的候选人。

接下来我会建议这一类型的求职者评估一下他们已有的技能与接触过的行业知识。下面是我认为具有相关性的:

  • 市场营销

  • 社交媒体营运

  • 社交媒体运营商

  • [其他曾涉足过的行业]

尽管以上这些内容相对宽泛,但至少为这些求职者提供了一个起点。因为他们已经对这四个领域的内容有很充分的了解,所以我会建议他们关注那些在垂直领域内已经拥有大量数据,正在招聘、或者是已经建立起数据科学团队的公司。

2. 找到对的公司

那什么公司会招聘和市场营销、社交媒体有关的数据科学家呢?

其实有不少公司其实是青睐有Marketing背景的数据科学候选人的。这里我们以Facebook为例。Facebook有一类职位叫做Decision Scientist(决策科学家),而这些决策科学家们可并不是都有数据科学或者计算机科学学位的。

我们有一位学员就是从Marketing Analytics研究生项目毕业后,在Agency从事Marketing Analyst,而后参加了我们的Marketing Mix Modeling Bootcamp,并成功加入Facebook成为决策科学家。

因为决策科学家与典型的“数据科学家”的角色略有不同。决策科学家针对市场营销进行分析——作为数据科学家,他们也使用数据科学的工具和方法来分析评估市场营销的有效性以支持Facebook的营销项目。在Facebook的团队中至少有20多名这样的科学家。他们共同归属于称为“洞察和分析”的研究部门,它包括市场营销和研究。

除了Facebook,Pinterest也有结合市场营销的数据岗位比如Insights Analyst,虽然它在职位上并不直接以数据科学家为称呼,但是工作内容却和数据科学家有很高的重合性,并且非常看重候选人的市场营销背景。

此外,在广告集团、广告代理商等公司中,也有大量的数据科学家岗位。比如GroupM就有关于营销归因模型与营销组合建模方面的数据科学家岗位。也有不少的AdTech公司雇佣大量的程序化广告算法数据科学家。

这些公司,全部都是想要转型数据科学的营销背景学生可以着重关注的对象。

3. 找到对的培训项目

为什么项目经历如此的重要:

并不是所有想往数据科学发展的人都已经从事过数据科学的工作,但每个人都可以将自己曾经做过的数据科学相关的项目整理到一起,以此来展示她在数据科学领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。

  • 首先,美国职场是高度认可项目经历的。不少专业的培训机构都提供类似于“训练营”Boot Camp这样的培训课程,这类课程会通过带领参与者做数据科学项目来让参与者完成技能的培训与经验的积累。

  • 与传统的“学位”Degree相比, Bootcamp的好处就是时间短、效率高、回报高。读完一个Degree可能需要2-4年时间,最快的至少也需要一年,且金额不菲。但是Bootcamp的时常一般集中于几个星期或者几个月,使学员能非常高效的在这段时间内掌握到某种技能,非常适合短期内想要实现转型或进入某个赛道的人。

  • 此外,完成一个项目表明你是一个有自我激励的人,会愿意主动去解决一些复杂的问题,表明你可以将数据科学技术应用到每天会遇到的实际问题中。

  • 这能够让你“充分展示”,而非“简单告诉”对方你对一个概念的理解与应用,这在面试时,比纸上谈兵更拥有实质内容。

  • 基于项目形式的学习方式是真正掌握数据科学技能,以及学习新工具的最快方法之一。

  • 如果项目研究的成果很有意义,这是可以堪比工作经历,甚至是比工作更有价值的经历。

  • 好的项目可以帮助你学习到必要的概念并敲开理想工作的大门

如何选择一个好的项目呢?

关于数据科学项目的选择,最重要的事情之一是它需要是非常有针对性且具有行业独特性。项目内容越具体、越紧密联系某个你感兴趣的行业,你就能越好地解释这个项目的意义。

选择的项目应该符合下列两个类别之一(或者两者都包括):

(1)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。

(2)这个项目对你来说是有趣的、有热情的——当你面试时,与面试官谈论起这段经历,这一点热情就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。

如果你对流媒体行业的数据科学感兴趣,你就应该积累一些流媒体数据项目;如果你想成为营销数据科学家,你就应该去做一些营销数据相关的数据科学项目。

好的数据科学项目需要包含哪些内容?

你选择的项目应该大致遵循以下这样一个流程,并且在做完项目后你需要能够详细地描述当中的每个步骤。

Step 1: 解决一个实际商业问题——项目背景是什么?是出于什么原因要去做这个项目?(商业问题举例:希望通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议)

Step 2: 数据收集——好的项目要有数据收集的过程,既可以是直接从数据源下载数据集,或者是从某个渠道去使用API爬取。(例如使用python从Twitter上获取tweets相关的数据。)

Step 3: 数据清洗和聚合——这一步实在太重要了。没有这一步的项目都不是“贴合实际工作情况“的好项目。它是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你需要通过项目去完全了解你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。(例如某些天因为技术问题,无法收集到营销支出的数据。)

Step 4: 变量探索——这部分对于一个好项目来说也非常重要。因为在这部分分析中,你要去审视每一个变量的特点。你需要深入研究每个变量(或者叫特征)的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)

Step 5: 数据探索性分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)

Step 6: 特征工程(或叫变量转换transformation)——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:(1)创建可以提高预测准确性的新特征变量;(2)改变数据的性质,使其更适合进行量化分析。好的项目会教你,在构建新特征变量时如何充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。(比如,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。)

Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。

(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)

Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)

Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)

总结

如果你是“非传统背景”的数据科学求职者,那么就像上文所说的,你应该遵循以下步骤:

  • 找到合适的求职途径——找人内推,而不只是给HR投简历。

  • 找到合适的公司——去那些看重营销背景的公司,发挥你的竞争优势。

  • 找到合适的培训项目——去参与Boot camp,做有针对性的数据科学项目。

MarTechApe《营销组合建模实战训练营》,完全符合文中一个优秀的项目的9大必备条件!携手全球最大广告集团WPP数据总监,真实还原企业中的营销数据科学项目流程,致力于培养营销数据科学家!项目经历可放在简历上提升履历背景。

从我们的项目中,毕业了将近200名学生,斩获各大公司数据岗位offer:

Marketing Mix Modeling Bootcamp往期学员拿到的面试机会以及全职工作OFFER包括Google、Facebook、Twitter、LinkedIn、Uber、Wayfair、Walmart、Accenture、Pepsi、Bloomberg、Square、Deloitte、Salesforce、AT&T、JP Morgan、Mediamath、GroupM等互联网科技公司、咨询公司、广告传媒公司、金融机构。

Marketing Mix Modeling Bootcamp往期学员拿到的面试机会以及全职工作OFFER包括Google、Facebook、Twitter、LinkedIn、Uber、Wayfair、Walmart、Accenture、Pepsi、Bloomberg、Square、Deloitte、Salesforce、AT&T、JP Morgan、Mediamath、GroupM等互联网科技公司、咨询公司、广告传媒公司、金融机构。

《营销组合建模企业级训练营》第11期的招募正在火热进行中!

1.营销组合模型训练营是什么?

营销组合模型训练营(Marketing Mix Modeling Bootcamp)是MarTechApe的宝藏项目,由全球最大广告集团 WPP美国办公室的数据总监以及营销分析经理共同授课。在训练营中,你将学习在真实商业情境中如何用营销组合模型解决广告营销最核心的问题——科学合理地评估不同广告对品牌和销售的影响,以统计模型的结果来科学优化广告预算。

训练营的学员收获了:

  • 真正意义上的“用数据和模型解决营销中最重要的问题”的经历。

  • 熟练掌握SQL、R、Tableau等时下最流行的数据处理语言,并用这些技能解决实际问题。

  • 大大提高Media/Advertising Industry的商业意识,熟悉不同媒介渠道的广告活动对不同商业指标的不同回报率(ROI)与有效性(Effectiveness),学会用“营销效果”的视角看待营销活动,理解各大公司市场营销部门、消费者洞察部门的痛点。

  • 跳出学校作业的框架,上手真正商业情境中、实际工作中的实战案例。让校园与实际工作无缝衔接。将学到的Analytics思维方式泛化到其他应用场景,面对Case Study建立系统性解决思路。

  • 提升项目演示Presentation技能,学会如何从原始数据中挖掘具有意义的故事。为客户解决实际问题,提高Business KPI。

  • 完成项目后,辅导老师将帮助你利用这一个惊艳的项目背景打造最引人注目的简历;所有学员获得内推机会,优秀学员获得一对一面试辅导。

2.学员对训练营评价如何?

Marketing Mix Modeling Bootcamp开办至今,收获了大量好评,学员们都觉得Bootcamp的质量非常高,在节课后给我们发来了很多让我们非常感动的评论:

3.训练营老师是谁?

1. 全球最大广告传媒集团WPP | 数据总监

  • 商业分析高级专家

  • 拥有7年数据分析经历

  • 各类SQL、Tableau疑难杂症的go-to person

2. 全球最大广告代理公司GroupM | 营销分析经理

  • 营销效果分析专家。为十多个每年广告预算上亿美元的大客户提供营销效果评估、销售预测等解决方案

  • 拥有6年Marketing Mix Modeling等高阶分析经验,具有丰富的训练新人和带领团队的经验

  • 毕业于Columbia University统计学系

4.在Bootcamp中可以学到哪些内容?

  • 整个bootcamp分为广告数据源概况、数据处理与可视化、统计建模、深度诊断,共计24小时课时,在两个月内完成。

  • 周末Online Live授课,课后完成老师布置的作业,助教团队在班级群随时答疑,直播录像永久回放。

  • 课程内容涵盖了数据分析岗位的完整工作流程(analytics cycle):

    • 数据收集 Data Acquisition

    • 数据处理和清洗 Data Processing

    • 数据可视化与商业洞察 Data Visualization & Data Story-telling

    • 统计建模 Modeling

    • 模型优化 Optimization

    • 销售预测 Simulation

    • 深度诊断 Side Diagnostics 

    • 结果展示 Presentation

  • 每位学员将有一套亲自做的Data成果作品和一套Model成果作品,以及一段完整的为客户解决实际问题的经历。

  • 结课后,每位学员获得提升简历的Project Experience完美描述,所有学员获得内推机会!优秀学员获得额外一对一面试辅导

  • 报名的学员可在开课前一周获得详细的Syllabus。

课程大纲:

学员在前四周会聚焦在数据处理和商业洞察上。学员会面对大量的营销活动数据(如Display、Search、Social、Video、TV等广告数据),根据Media Data的数据源与结构来处理纷繁复杂的数据。并用可视化来呈现出数据洞察。你将学会如何搭建一个数据库、如何利用SQL去处理未经处理的、大型原始数据集,并利用Tableau对数据进行可视化分析。你还将完成对一份数据的商业分析。简而言之,我们将以Data Processing >> Data Visualization >> Insights Generation这样一套体系,系统加强你的数据分析能力以及商业意识。 

在真实的世界里,模型用来回答各类不同的商业问题,帮助决策者作出最优的决策。在本次bootcamp的第四~第八周中,你将建立一个真正的Marketing Mix Model!掌握模型最核心的秘诀,调整各类模型参数、学会解读模型结果、优化营销预算、精准预测销售走势。在这个过程中,学会将商业问题翻译成模型问题,用不同的分析手段来回答不同的营销问题,真正做到数据驱动战略决策。

在向你的观众解释Marketing Mix Modeling的模型结果时,Side Diagnostics(深度 诊断)往往是一个让你的受众通过商业意义来理解模型结果的重要手段。模型的解释力以及与商业可行性的融合性是决定你的受众是否“买账”的关键因素。因此,Marketing Mix Modeling专门加入深度诊断部分,教你如何用统计的方法说服你的受众!

5.上完Bootcamp,有哪些成果可以展示?

从变量可视化分析、模型解读、营销渠道分析,到战略洞察、PPT演示,学员的精致作业就是他们最好的训练营成果,这一份拿的出手的高品质项目,无论是LinkedIn还是面试展示,都会是脱颖而出的最佳帮手!

学员作品

正是这些实打实的项目经验和能够直接拿到面试官面前展示的作品,让我们的学员在面试的时候信心倍增,让面试官刮目相看!

说了这么多,到底怎么报名这门干货十足物超所值的项目课程呢?

6.报名方式

长按二维码,添加小助手为好友,回复“MMM”,即可报名bootcamp:

小助手(微信ID:yvonne91_wsn)

价格规则 

熟悉我们的老用户,应该知道我们一直都是实行阶梯价格的,这次也不例外:

先到先得、越早报名越优惠(原价$1999美元)。以下价格单位为美元:

第1名~第5名:1299美元

第6名~第10名:1499美元

第11名~第15名:1599美元

第16名~第18名:1799美元

第19名~第20名:1999美元(原价)

你现在的努力决定了两年后你在什么位置,如果红遍全网的谷歌“厂妹”有勇气破釜沉舟投资自己,你为什么不愿意付出成本提高自己的职场竞争力?两倍薪水并不是遥不可及的事情,而只是你当下的眼界和选择。

我们的课程,准备就绪,等你到来!