什么样的项目可以帮你拿到数据科学家offer?
我坚定地认为一个人过去的项目/工作经历是他/她职业发展最好的“预言家”。许多数据科学经理也无比认同这一观点。因为并不是所有想往数据科学发展的人都已经从事过数据科学的工作,但每个人都可以将自己曾经做过的数据科学相关的项目整理到一起,以此来展示她在数据科学领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。
为什么项目经历如此的重要:
首先,这表明你是一个有自我激励的人,会愿意主动去解决一些复杂的问题。
这表明你可以将数据科学技术应用到每天会遇到的实际问题中。
这能够让你“充分展示”,而非“简单告诉”对方你对一个概念的理解。
因为你对项目的进展充分掌握主动权,所以可以充分利用项目经历来展示你想展示的技能。
基于项目形式的学习方式是真正掌握数据科学技能,以及学习新工具的最快方法之一。
如果项目研究的成果很有意义,这是可以堪比工作经历,甚至是比工作更有价值的经历。
如何选择一个好的项目呢?
关于数据科学项目的选择,最重要的事情之一是它需要是非常有针对性且独特的。项目内容越具体,你就能越好地解释这个项目的意义。独特的项目之所以好是因为它们展示了做项目的人的一些个性,而这一点是很难被复制的。很不幸的是我就遇到过一些候选人,他们在自己的github上把别人的项目或者大量的代码复制过来,却没有注明出处。
我认为你选择的项目应该符合下列两个类别之一(或者两者都包括):
(1)这个项目对你来说是有趣的、或者重要的——如果你对你的项目主题很感兴趣,你将会更乐意去把它做好。当你面试时,与面试官谈论起这段经历,这一点的重要性就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。
(2)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。
比方说,我做过的大部分项目都是关于体育的。这是我工作和激情的交汇所在。在我看来,这样的项目案例真是再好不过了。如果你对营销科技感兴趣,那么你可以去做一些营销领域的数据科学项目。
营销组合模型训练营(Marketing Mix Modeling Bootcamp)是MarTechApe的宝藏项目,由全球最大广告集团 WPP美国办公室的数据总监以及营销分析经理共同授课。在训练营中,你将学习在真实商业情境中如何用营销组合模型解决广告营销最核心的问题——科学合理地评估不同广告对品牌和销售的影响,以统计模型的结果来科学优化广告预算。
好的数据科学项目需要包含哪些内容?
尽管你需要选择有针对性和独特的项目,但所有好的数据科学项目也都有一些共同点。你选择的项目应该大致遵循以下这样一个流程,并且你需要能够详细地描述当中的每个步骤。
Step 1: 解决一个实际问题——项目背景是什么?是出于什么原因要去做这个项目?你并不会在一开始就知道最后将会发现什么,你希望试着用你的分析来回答或解决一个实际的问题。所以在项目开始的时候,你要明确这个项目需要解决的具体问题有哪些。
(例如是否有可能通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议?)
Step 2: 数据收集——网上有很多可以找到数据的好地方(比如Kaggle、谷歌、reddit等)。你既可以从这些地方直接选择一个数据集,也可以自己去爬取。我发现如果候选人能通过API来爬取数据,或者采用另一些更独特的方式来收集数据,会让他们更有竞争力。拥有别人不知道或获取不到的数据能让面试官眼前一亮,为你的能力加分。
(例如使用python从Twitter上获取tweets相关的数据。)
Step 3: 数据清洗和聚合——这一步的重要性经常被忽略,但其实却是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你应该要能够解释你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。
(例如某些天因为技术问题,无法收集到营销支出的数据。)
Step 4: 数据探索——在这部分分析中,重要的是展现你对数据在细节上的了解。它们互相之间存在怎样的联系?你需要深入研究每个特征的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。
(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)
Step 5: 数据分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。
(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)
Step 6: 特征工程——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:(1)创建可以提高预测准确性的新特征变量;(2)改变数据的性质,使其更适合进行量化分析。
在构建新特征变量时,你应该充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。我最喜欢举的一个例子是,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。
另一种类型的特征工程是简化数据特征,使得数据更适合于你的分析。许多人往往使用主成分分析(PCA)或者因子分析来减少数据中的特征数量。对于某些类型的模型,这么做可以减少多重共线性从而改善模型预测结果。对于其他一些分析,你还需要对数据进行进一步的测量。
(例如对包含许多有相关性的变量的数据集使用主成分分析,这样我们就可以使用线性模型来预测销售量。)
Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。
(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)
Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。
(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)
Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。
(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)
总结
在我列出的为什么数据科学项目很值得的原因中,我注意到这些项目实际上可能和真实的工作经验一样,甚至更好。我之所以这么说是因为,我见过许多数据科学项目产生了实际的流量、收入,甚至成为了一个新风投项目的基石。
好的项目可以帮助你学习到必要的概念并敲开理想工作的大门,但它们也有可能完全取代对一份工作的需求而直接创造出一份新的事业。
如果你也想从事数据科学的工作,成为一名优秀的数据科学家或数据分析师,但目前缺乏十分相关的工作和项目经历,不妨来报名MarTechApe的宝藏级数据分析实操项目《营销组合建模训练营》吧!
该项目历经7期学员认证,充分满足一个好的数据科学项目所需包含的所有要点,更帮助众多学员敲开了全美知名企业数据分析和商业分析工作的理想大门。
整个项目里会手把手带你经历全套的企业内营销分析流程,从数据源概况、数据处理与可视化,到统计建模、深度诊断。同时配备SQL面试辅导和简历指导。每位学员将有一套亲自打磨的Data成果作品和一套Model成果作品,以及一段完整的可以写在简历中为客户解决实际问题的经历。
现在项目第8期已开始招生,如果你希望通过这样一个项目在此番春招季中加速斩获理想Offer,就快来报名我们的《营销组合建模训练营》Marketing Mix Modeling Bootcamp吧!
以下是项目具体介绍:
从2018年起,我们已举办了共8期《营销组合建模训练营》,往期的学生们拿到了全美顶级的面试机会以及全职工作OFFER,组成了训练营的荣誉之墙:
1.营销组合模型训练营是什么?
营销组合模型训练营(Marketing Mix Modeling Bootcamp)是MarTechApe的宝藏项目,由全球最大广告集团 WPP美国办公室的数据总监以及营销分析经理共同授课。在训练营中,你将学习在真实商业情境中如何用营销组合模型解决广告营销最核心的问题——科学合理地评估不同广告对品牌和销售的影响,以统计模型的结果来科学优化广告预算。
训练营的学员收获了:
真正意义上的“用数据和模型解决营销中最重要的问题”的经历。
熟练掌握SQL、R、Tableau等时下最流行的数据处理语言,并用这些技能解决实际问题。
大大提高Media/Advertising Industry的商业意识,熟悉不同媒介渠道的广告活动对不同商业指标的不同回报率(ROI)与有效性(Effectiveness),学会用“营销效果”的视角看待营销活动,理解各大公司市场营销部门、消费者洞察部门的痛点。
跳出学校作业的框架,上手真正商业情境中、实际工作中的实战案例。让校园与实际工作无缝衔接。将学到的Analytics思维方式泛化到其他应用场景,面对Case Study建立系统性解决思路。
提升项目演示Presentation技能,学会如何从原始数据中挖掘具有意义的故事。为客户解决实际问题,提高Business KPI。
完成项目后,辅导老师将帮助你利用这一个惊艳的项目背景打造最引人注目的简历;所有学员获得内推机会,优秀学员获得一对一面试辅导。
2.学员对训练营评价如何?
Marketing Mix Modeling Bootcamp开办至今,收获了大量好评,学员们都觉得Bootcamp的质量非常高,在节课后给我们发来了很多让我们非常感动的评论:
3.训练营老师是谁?
1. 全球最大广告传媒集团WPP | 数据总监
商业分析高级专家
拥有7年数据分析经历
各类SQL、Tableau疑难杂症的go-to person
2. 全球最大广告代理公司GroupM | 营销分析经理
营销效果分析专家。为十多个每年广告预算上亿美元的大客户提供营销效果评估、销售预测等解决方案
拥有6年Marketing Mix Modeling等高阶分析经验,具有丰富的训练新人和带领团队的经验
毕业于Columbia University统计学系
现在Marketing Mix Modeling Bootcamp第九期
已正式开放报名!
我们的老规矩:小班教学,每一期Bootcamp只招收20名学生,先到先得!
接下来我们就看看训练营的具体课程内容吧!
4.在Bootcamp中可以学到哪些内容?
整个bootcamp分为广告数据源概况、数据处理与可视化、统计建模、深度诊断,共计24小时课时,在两个月内完成。
周末Online Live授课,课后完成老师布置的作业,助教团队在班级群随时答疑,直播录像永久回放。
课程内容涵盖了数据分析岗位的完整工作流程(analytics cycle):
数据收集 Data Acquisition
数据处理和清洗 Data Processing
数据可视化与商业洞察 Data Visualization & Data Story-telling
统计建模 Modeling
模型优化 Optimization
销售预测 Simulation
深度诊断 Side Diagnostics
结果展示 Presentation
每位学员将有一套亲自做的Data成果作品和一套Model成果作品,以及一段完整的为客户解决实际问题的经历。
结课后,每位学员获得提升简历的Project Experience完美描述,所有学员获得内推机会!优秀学员获得额外一对一面试辅导。
报名的学员可在开课前一周获得详细的Syllabus。
5.上完Bootcamp,有哪些成果可以展示?
从变量可视化分析、模型解读、营销渠道分析,到战略洞察、PPT演示,学员的精致作业就是他们最好的训练营成果,这一份拿的出手的高品质项目,无论是LinkedIn还是面试展示,都会是脱颖而出的最佳帮手!
正是这些实打实的项目经验和能够直接拿到面试官面前展示的作品,让我们的学员在面试的时候信心倍增,让面试官刮目相看!
说了这么多,到底怎么报名这门干货十足物超所值的项目课程呢?
6.报名方式
长按二维码,添加小助手为好友,回复“MMM”,即可报名bootcamp:
小助手(微信ID:yvonne91_wsn)
价格规则
熟悉我们的老用户,应该知道我们一直都是实行阶梯价格的,这次也不例外:
先到先得、越早报名越优惠(原价$1999美元)。以下价格单位为美元:
第1名~第5名:1299美元
第6名~第10名:1499美元
第11名~第15名:1599美元
第16名~第18名:1799美元
第19名~第20名:1999美元(原价)
2020年的你,是否能在更好的公司做更优秀的自己?投资自己,全方位提升能力,为自己增添被验证有效的宝藏项目经历!赶快报名吧!
本文来源:https://towardsdatascience.com/the-projects-you-should-do-to-get-a-data-science-job-457d3fe7d660