干货警告: Case Study案例分析面试攻略

原创:MarTechApe

IMG_0836.JPG

在数据科学面试过程中,很多面试官会提出一系列的商业问题,并和应聘者讨论使用数据科学来解决问题的方法。这是数据科学面试中十分典型的案例分析问题。根据应聘者的表现,面试官可以全面了解应聘者的批判性思维商业智能水平解决含糊的商业问题的能力以及数据科学模型和基础知识的实际运用能力。尽管这里提出的大多数问题都是开放式问题,没有一个正确的答案,但了解回答这些类型问题的方式以及如何快速形成结构化的答案却是很有用的。

在本文中,我们将讨论数据科学面试中案例分析问题的回答技巧。而且我们还针对面试的准备时间(长或短)进行了分类讨论。

干货警告⚠️你准备好了吗?

 
IMG_0837.PNG
 

01. 离面试还有很长时间时你可以做什么?

1. 训练商业思维

如果你离面试还有很长时间,或者想要提高商业思维意识以及训练自己将数据科学应用到商业环境中,关注技术公司的博客文章并定期阅读就是最好的方法

例如,Data Science at Microsoft,Walmart Global Tech,Tech at Instacart等。除了大众媒体,一些公司还会拥有自己的博客网站或YouTube频道,例如Google Data Science Blog,Uber Engineering等。如果你觉得阅读英文文献太慢,那可以关注公众号MarTechCareer,经常推送各类科技公司每天使用的数据科学应用案例。

作为没有数据科学全职经验的新毕业生,从阅读这些博客文章可以学到很多。它们可以指导你理解某些方法在实际商业问题中的应用,使你打开思维和眼界,跟踪了解数据科学领域的前沿研究技术。

 
IMG_0838.PNG
 

除了公司的博客,你还可以关注特定的主题并阅读相关文章。例如,如果你对计算用户生命周期值感兴趣,可以在大众媒体上看到很多出色的文章都在不同的业务环境中讨论这个问题。另外,StellarPeers是一个很值得推荐的刊物,其中发布了很多文章讨论不同产品和业务问题的解决方案。

值得注意的是,在阅读博客文章时,不要浪费太多时间在技术细节上,而是通过回答以下问题来总结你学到的知识:

  • 这篇文章解决的商业问题是什么?

  • 用的什么方法?这些方法对我来说是新的吗?

  • 他们如何评估所使用方法的表现?

  • 如何将其推广到其他类似的商业问题上?

 
IMG_0839.JPG
 

2. 明确专业术语

熟悉业务指标,关键绩效指标(KPI):

  • 用户流失率/保留率,客户增长率

  • 用户终生价值

  • 收入:每月经常性收入

  • 转化率

  • ...

习惯于讨论常见解决方案的专有名词:

  • 降维:PCA

  • 处理丢失的数据(Missing Value)

  • 处理异常值 (Outlier)

  • 因果推理技术 (Causal Inference)

  • 机器学习模型 (Machine Learning)

  • 评估模型性能 (Model Evaluation)

  • 实验设计 (Experimentation)

能够意识到影响统计结果的常见问题:

  • 样本偏差:选择偏差,响应偏差

  • 内生性

  • 相关性与因果关系之间的区别

  • 多重共线性

  • 过度拟合,拟合不足

 
control_group_1827285.jpg
 

02. 在面试之前

当面试准备时间有限时,进行针对岗位的研究,练习最有可能在面试中提出的问题是最有效的办法。

1. 对公司做研究:

⚠️面试官问的问题通常和他们自己每天处理的问题相关。在进行研究时,侧重以下方面:

  • 有关公司的一般信息:浏览公司的网站,Linkedin页面等,对公司有大体的了解:他们所处的行业是什么?他们有什么产品?他们的产品可能存在什么商业问题?

  • 浏览该公司的博客文章,以了解其数据科学家每天都在解决的问题以及解决方法。总结他们针对特定业务问题经常使用的一些技术。

2. 对公司的技术团队进行研究:

  • 他们的数据科学家正在解决的问题:关注公司的技术博客文章。许多公司的数据科学家和工程师会合作完成他们的项目,在博客中讨论用技术细节解决的问题。阅读这些文章可以帮你了解公司的业务面临的挑战以及数据科学技能在现实世界中的应用。

  • 你加入团队后,他们希望你解决的问题会是什么:熟悉职位描述来了解所申请的职位的具体要求,尝试分析职位要求并列出他们需要的所有技能。

  • 即使在同一家公司中,不同团队的数据科学家的日常任务也可能完全不同。如果你知道谁是你的面试官,试试通过在LinkedIn上搜索来找出你的面试官正在或曾经在哪个团队工作,然后问问你自己:他们解决了哪些业务问题,什么是你的解决方案。

 
IMG_0841.JPG
 

03. 在面试过程中

在面试的过程中,组织好你的答案,以最好地展示你解决问题的能力和批判性思维的能力是非常重要的。

1. 首先,在开始提出任何解决方案之前,要先明确问题!

需要用数据科学技术解决的业务问题通常是一些模糊的问题,比如,如何预测需求?如何通过市场活动等增加收入。首先弄清需要解决的问题是非常重要的。根据你被问到的某个问题,你可以从以下方面进行明确:

  • 这个问题有哪些前提?比如,如果有人问你如何降低客户流失率,你可以先问一下你正在评估的客户流失率的时间段。

  • 对现有数据做出合理假设:为了预测过去的订单,询问面试官我们是否有过去一个月订单的历史数据。

  • 定义问题中模糊的词:这是非常重要的,因为它将明确你答案的方向。例如,如果你被问到这个应用程序的新功能是否是一个“好”功能,首先你需要定义什么是“好”。“好”可以被定义为吸引更多的客户,更高的用户参与度,更高的收入,等等,取决于当时谈话的语境。“好”在短期和长期也是不同的。在开始解决这个问题之前,我们需要确定设定合理的目标。在其他情况下,我们可以在几个场景中详细讨论可能的解决方案,而不是只关注某一种情况。

  • 定义问题中使用的指标:如果问题中没有定义业务指标,那么你需要自己定义一个具体的、对目标敏感的指标。例如,当我们评估一个用户应用程序中的新功能的性能时,我们可以将指标定义为用户转化率、用户参与时间等。

  • 重复你对这个问题的理解,问面试官你是否正确理解了这个问题。这样你不仅可以确保你在正确的方向上前进,还可以为自己争取一些额外的时间来考虑解决方案。

 
IMG_0842.PNG
 

2. 提出解决问题的方案,从最简单的开始

在明确问题之后,你可以开始提出你的解决方案,展示你对数据科学技能合集的了解:是什么、如何使用以及为什么使用。你总是从最简单的解决方案开始展示,并给予更多的条件来改进它。例如,你可以从一个线性回归模型去了解数据,对你要解决的问题有一个模糊的印象,然后根据可能出现的结果和限制,转向一个更复杂的模型,讨论特征选择等等。

3. 解释解决方案背后的原因

解决方案本身并不是你答案的最主要部分,重点是你选择它的原因。要记得总是陈述为什么选择你的方法和为什么不选择其他可能的方法的原因。例如,在回答如何选择高峰价格期间的surge multiplier时,你可以说我想使用综合控制(synthetic control),因为像A/B测试这样的实验设计由于网络影响(指实验中两组被试之间可能存在互相联系,实验处理的相对独立性就会收到影响)在这种情况下并不适用。说明你选择这个问题的原因,并证明你的答案是正确的,同时向面试官表明你对这个问题有全面的了解是很重要的。

4. 评估你的解决方案:从技术的和非技术的角度

如何评估你的解决方案?首先从技术方面开始,比如模型的准确性、精度、分类模型的召回率、R方、回归模型的MSE。将这些技术层面的指标与旧模型或基线模型进行比较,看看这是否是一种改进。进而比较非技术指标,比如上面讨论的业务指标,你的模型是否增加了收入等等。另外,讨论其他度量指标,比如解释模型的容易程度,新特性将如何影响用户体验,将模型部署到生产环境中有多难等。

 
giphy (1).gif
 

5. 讨论权衡的过程

  • 意识到方法存在的潜在缺点。试着讨论某些方法的优缺点,并在彻底调查的基础上做出最后的决定。

  • 可以讨论短期和长期利益的权衡。例如,市场活动是否会在短期内增加订阅?在长期内是否能够增加收入?设定一个短期或长期利益不同的目标可能会导致不同的解决方案。

  • 讨论不同利益集团之间的权衡。例如,Uber EATS有三个使用方,餐馆、运营商、和食客。试着讨论一下你的建议分别对三方产生的影响。

  • 讨论在计算复杂度和可解释性、更快的结果和更精确的模型、更高的实验成本和更可靠的结果等方面的权衡。

6. 知道自己在说什么


面试官喜欢根据你的回答再后续提问。例如,你刚提到想在线性回归模型中加入正则化,面试官可能会问你为什么要这样做? L1和L2正则化有什么区别,你会选择哪一个?这是让面试官了解你对模型或技术基本理解的一种方式。

7. 接受暗示

好的面试官会暗示你是否已经偏离了他们想要的答案。例如,如果你在谈论解决问题的方法A,面试官可能会说,使用方法A可能会带来问题B,你认为方法C怎么样?当别人给出你类似的暗示时,要接受!!他们并不是想哄骗你或考验你,是想引导你回到正确的方向。

 
950x800-2.png
 

8. 树立正确的心态

面试不是一场考试,尤其是当你面对没有正确答案的开放式问题时。向面试官展示你将宽泛的商业问题转化为可操作的分析的思维过程是很重要的。你需要向他们展示如何改进业务问题,引入数据科学技能,并演示这些项目将如何影响你希望实现的目标。你可以想象自己已经在公司工作了,你正在和你的同事讨论你面临的问题的潜在解决方案。树立正确的心态可以帮助你减轻压力,展现真实的表现。

9. 面试时不要沉默思考

这条规则适用于当你面对面试中提出的任何问题。在面试官面前经常展示你的想法和思考过程,即使一开始这并不是一个完美的解决方案,但你总是可以根据对方给出提示或进一步思考做出更正和完善。面试时保持沉默是个不明智的选择,当你根本不知道如何回答一个问题时,那就先提出另一些问题用来明确刚才的问题。

以上就是应对数据科学面试中的案例分析的秘籍了。然而,要想真正在面试中从容应对面试官,还需要实战上手的经历加持,才能回答好面试中的每一个细节问题。想要上手企业级项目,获得关于数据产品的实操经验,培养科技公司必备的商业思维,加入科技大厂数据分析团队?深入了解A/B测试,能让你快速适应万变不离其宗的大厂数据分析团队工作模式。MarTechApe的《A/B测试企业级实战训练营》以真实商业场景中的复杂A/B测试问题为项目背景,让学员在两个月的时间里,使用百万量级原始数据,搭建完整的A/B测试流程!

在过去开办的四期《训练营》中,我们为顶尖科技公司输送数据能力强、实验经验丰富、统计基础扎实的数据人才。不论你本来是什么背景,都能通过这门课程,打开盛行“测试文化”的互联网高科技公司的大门!

 
 
 

以下为往期学员的战绩榜:

▲《A/B Testing Bootcamp》往期学员拿到的面试机会以及全职工作OFFER包括Facebook、Amazon、TikTok、Viagogo、GSK、Walmart、Pinterest、Chegg、Wish、Twitch、Plymouth Rock、Nintendo等互联网科技公司。

▲《A/B Testing Bootcamp》往期学员拿到的面试机会以及全职工作OFFER包括Facebook、Amazon、TikTok、Viagogo、GSK、Walmart、Pinterest、Chegg、Wish、Twitch、Plymouth Rock、Nintendo等互联网科技公司。

 

👇 点击下方按钮,了解项目详情!👇


—— END ——

本文由MarTechCareer独家整理发布, 如需转载请注明来源

版权声明:MarTechCareer致力于发布原创优质文章、推广前沿实操干货、分享面试指南与学员战绩。本文不代表MarTechCareer立场,仅为传递、参考之用。如涉及版权问题,敬请原作者谅解,并联系微信yvonne91_wsn进行处理。


 
WechatIMG37.jpeg