进入了本年度最后一波求职冲刺阶段,关于工作面试的建议也层出不穷,把人看得眼花缭乱,找不到方向。今天这篇文章是专门针对数据科学的工作面试中会出现的问题,为你分析和总结具体回答思路及范例,希望可以帮你扫清障碍,让你在接下来的数据分析求职路上越走越顺。
赶紧mark起来,准备好纸笔,一边看一边试着写一下自己的回答吧~年末求职冲刺期,现在再不抓紧准备难道要留到明年从头再来吗??!!
首先,在数据科学职位的面试过程中,你可能会遇到3-7个不同的面试官,并且在与这些面试官交谈的过程中,你通常会与他们讨论到以下几个话题:
1. 介绍自己 (Tell me about yourself)
2. 行为问题 (Behavioral questions)
3. SQL能力考察(“White boarding” SQL)
4. 其他编程能力考察(“White boarding” code)
5. 聊一聊简历中做的项目(Talking about items on your resume)
6. 简单的问题分析(Simple analysis questions)
7. 你的提问时间(Asking questions of your own)
这个问题你可能早在电话面试这一轮就会碰到。要回答好这个问题其实很简单,面试官问这个问题的意图也只是想了解一下你是谁,以及你最近在做的事情。类似的回答可以是:我是一位有着8年数据学习经验的数据科学家,我所做的工作主要集中在用统计和分析的方法来解决在各个行业里所存在的业务问题。我精通SQL和R语言建模,目前正在学习python。
关于这一类的问题,有个很好的建议是按照STAR的模式来进行回答。STAR是情境(situation)、任务(task)、行动(action)、结果(result)四项的缩写。STAR模式是一种讲述自己故事的方式,或者说,是一个清晰、有条理的作文模板。不管是什么,合理熟练运用此法则,就可以自如地向面试官描述事物发生的过程,表现出自己阐述和分析问题的清晰性、条理性和逻辑性。比如,数据科学面试中最普遍的STAR问题如下:
1. 请给出一个你向非技术人员解释你的技术成果的例子
2. 请给出一个你改善工作过程的例子
3. 请给一个与一位难以相处的利益相关者相处的例子,并说明你是如何解决的?
回答此类型的问题,你需要做到的就是简洁明了地说明情境,任务,行动和结果。Source: Give A Grad A Go
举个例子,关于第一个“技术成果”问题,你可以这样回答:
“Vistaprint是一家面向小型企业,通过线上渠道来销售营销物料的公司(注意这里:一定要简要介绍一下公司的情况,因为面试官可能不熟悉该公司)——Situatiion我的工作主要是负责用k-means对客户行为进行细分,这个过程包括创建54个变量,数据标准化,然后在此基础上进行大量的分析等等——Task当与其他项目负责人(非技术人员)讨论我的分析结果时,我已经将里面的重要信息提炼出来并搭建了一个故事。我没有向他们讨论我具体是怎么做的,而是向他们解释了这些细分的客户群分别是哪些人,以及他们的行为有什么不同——Action同时我还强调了这个细分为何是可行的——我们可以在数据库中识别出这些客户,针对他们开展营销活动,并且我也举例了一些具体的活动案例——Result这就是一个我如何向非技术的项目负责人解释技术成果的事例。(注意这里:一定要在回答完问题的最后重述一下问题)”
对于此类问题,你会在面试中一次又一次地遇到,需要有时间来做好充足的准备,反复思考自己的经历。根据经历,来选取最适合的例子和回答,然后进行大量的练习。要相信花在这上面的时间一定是值得的。
数据科学岗位的工作要求基本都会提到SQL是应聘者必须具备的技能。这个面试的过程一般是面试官会让你站在一张白板面前回答一些SQL问题。在大多数情境下,面试官会在白板上贴几张纸,打比方说一张可能是包含了用户ID和姓名的表格(称其为姓名表Names Table),另一张纸可能是包含了ID、购买日期和购买物品的表格(称为交易表PurchasesTable)。在你有了这些信息之后,就需要根据面试官的问题在白板上写出SQL查询语句。
比如面试官会问:请写出一个查询来获得所有用户名字 ——select names from NamesTable
请写一个查询来获取所有名字和其对应购买的物品 ——
请写一个查询来获取某一日期后发生购买的消费者姓名和其购买的商品(这个日期是面试官随机选择的,在这个例子中是2017年12月)——
where p.dates > ‘2017–12–31’
请写一个查询来获取到至少有2次及以上购买的消费者姓名和其具体购买次数 ——
select names, count(purchases) as cnthaving count(purchases) ≥ 2
这就是SQL的大体考察形式,你也可能会遇到要求写一个查询,需要将一张表格连接回同一张表,这可能是你在面试中会遇到的比较复杂的SQL问题。(在MarTechApe的宝藏项目《营销组合建模训练营》中,WPP的数据总监会手把手带你从零开始学习SQL,完成对数据的全套ETL流程。下次碰到SQL问题再也不用担心!点击下图快速了解项目内容👇)
▲戳图了解《营销组合建模训练营》课程详情
除了SQL,你也可能被考察其他编程能力。举个例子,面试官可能会问你如何用Python写FizzBuzz的问题。FizzBuzz问题是指写一个程序来打出1到100这些数字。只要遇到数字为3的倍数的时候,就打印“Fizz”来替代该数字;5的倍数时,就用“Buzz”代替;既是3的倍数又是5的倍数时,就打印“FizzBuzz”;只有既不是5也不是3的倍数时,才打出该数字。
编程问题很可能会涉及到一些循环、逻辑语句,也可能需要你定义一个函数。特别是,如果职位要求中有提到申请人必须掌握的特定编程语言的话,那么面试官很可能就希望看到你通过使用该语言来给到他们想要的答案。
(《营销组合建模训练营》中会教你如何通过R来进行统计建模,包括调参、模型甄选,解读模型结果、优化营销预算和精准预测销售走势!点击下图快速了解项目内容👇)
很多人的面试反馈表示,他们曾被问过简历中提到的所有方法(回归、分类、时间序列分析、多变量测试等)。尽管你可能没有足够的篇幅在简历中介绍你在学校做的项目或论文,但是可以在回答面试官问题的时候,不经意地引到你之前相关的经历,面试官接下来就会更加深入、细节地问你是如何做的这个项目,或者让你介绍在论文中用到的方法。有些项目和论文可能是你很早之前完成的,其中具体的过程和方法你可能都忘得差不多了。如果真的出现这种情况,你可以诚实地告诉面试官,这是几年前完成的项目,具体细节有些忘记了。但是千万不要说到这里就结束了!一定要跟面试官说你回去之后会进一步跟进。当你确定了准确的回答后,可以用邮件的方式发送给面试官。
但是这只是不得已的方法,最好的做法应该是在面试之前,就准备好所有简历上可能会被问到的问题,查缺补漏,将应该补充和学习的知识掌握透彻,这样才能在面试的时候更流畅地与面试官进行沟通和讨论。(如果你缺乏相关的数据分析项目经历,向你诚心诚意推荐《营销组合建模训练营》!项目最后,还会有专业老师帮助你利用这一宝藏项目背景,打造令人注目的简历、面试内容。点击下图了解项目内容👇不要错过!)
▲戳图了解《营销组合建模训练营》课程详情
这个部分,面试官会问一些相对简单的问题来让你作出分析,以了解你是怎么跟工作中的数字打交道,对这些问题的理解程度如何。想要完美回答这类问题,你可能需要画一个图或者用一些代数计算来解决。同时也能体现出你具备了一定的商业背景,可以解释出每个数字代表了什么意思。比如:转化率的变化,平均销售价格,为什么在一些情况下收益下降了,在这种情况下你会选择什么样的模型来解决等等。通常,每个面试者都会碰到两到三个类似的问题。
有些面试者还会遇到有关概率的问题,比如掷骰子。面试官可能会先问你如果掷一枚均匀的骰子,期望值E(x)会是多少。然后会问如果以某种方式给这枚骰子的其中几面加权,使其不再平均,那么加权之后掷这枚骰子的期望值又会是多少。而且面试过程中你很可能不被允许使用计算器。
这一般是面试的最后一个部分,面试官会问你有什么问题想要问他的。很多面试者表示,不知道问什么才能表现出自己对这家公司的关心,或者也有些人反馈,因为前面的面试过程太紧张,一到这个部分,便不知道问些什么了。下面这些范例希望可以给你提供一些思路:
- 请问你会将什么样的人视为表现很好或者很有潜力的员工?
问这个问题可以帮助你进一步了解这家公司的工作模式,这家公司是更欢迎长时间工作或者周末加班等工作模式的员工呢,还是他们更提倡员工能有个人的工作选择、更有效率地完成工作。
有些公司比较偏向于用某一类软件,比如SAS,而有些面试者可能倾向于使用其他软件工作,所以当对方的回答并不是你一贯使用的软件时,你还需要问清楚是否允许在工作中使用其他(你自己擅长的)软件来解决问题。
- 是否还有其他关于我技能和资历的部分可以告诉你们,从而能让你们足够判断我很适合这份工作?
借这个问题的机会,相当于是提醒面试官回顾一下是否还有其他部分是在之前面试你的过程中尚未涵盖的,或者有所顾虑的。你肯定不希望在面试结束之前,他们因为对你获取的信息不足,而无法下定决心来雇佣你。
这让你能有个心理预期,在多久时间之后适合发一封follow-up邮件询问结果,而不至于遥遥无期地等待。
当然你也可以询问更多工作方面的问题,比如开始工作之后,将会从事什么类型的工作(如果在面试前,并没有得知任何信息的话)。每次面试之后,也要记得发送你的感谢信!即使你没有收到offer,或者最后拒绝了某家公司的offer,你仍然可以在Linkedln上向他们发送connect邀请。保持联系,也许之后就会有新的机会!
最后最想说的是,永远不要因为害怕面试或是面试失败就对自己失去信心,不敢再跨出接下来的一步。很多机会都是在你不经意间降临的,你可能都忘记了是自己几时曾播下希望的种子。但你如果不去做、不去表达出来,机会就真的永远不会来临了。每个人都能在每一次面试中有所收获,都能在这过程中遇到很多很棒的人。希望大家都能有一个美好的面试体验,拿到理想的offer!
面试中最重要的是言之有物,让面试官相信你具备足够的经验和素质。如果你想从事数据分析的工作,却因为缺乏相关项目工作经历而屡屡退缩或遭拒,不要就此气馁。MarTechApe宝藏级项目《营销组合建模训练营》经历6期完课,培养了来自不同背景、专业的学员,通过专业老师手把手带领下的一步步实操,来充分掌握数据分析的整套流程,助力你在年末跨入一条数据分析求职、晋升的超车道,加速斩获理想企业的Offer!
往期学生们拿到了全美顶级的面试机会及全职工作Offer,组成了训练营的荣誉之墙:Marketing Mix Modeling Bootcamp往期学员拿到的面试机会以及全职工作OFFER包括Google、Facebook、Twitter、LinkedIn、Uber、Wayfair、Accenture、Pepsi、Bloomberg、Square、Deloitte、Salesforce、AT&T、JP Morgan、Mediamath、Mediacom等互联网科技公司、咨询公司、广告传媒公司、金融机构。现在第7期正在火热报名中,赶紧来了解一下如此硬核的项目吧!
营销组合模型训练营(Marketing Mix Modeling Bootcamp)是MarTechApe的宝藏项目,由全球最大广告集团 WPP美国办公室的数据总监以及营销分析经理共同授课。在训练营中,你将学习在真实商业情境中如何用营销组合模型解决广告营销最核心的问题——科学合理地评估不同广告对品牌和销售的影响,以统计模型的结果来科学优化广告预算。
训练营的学员收获了:
真正意义上的“用数据和模型解决营销中最重要的问题”的经历。
熟练掌握SQL、R、Tableau等时下最流行的数据处理语言,并用这些技能解决实际问题。
大大提高Media/Advertising Industry的商业意识,熟悉不同媒介渠道的广告活动对不同商业指标的不同回报率(ROI)与有效性(Effectiveness),学会用“营销效果”的视角看待营销活动,理解各大公司市场营销部门、消费者洞察部门的痛点。
跳出学校作业的框架,上手真正商业情境中、实际工作中的实战案例。让校园与实际工作无缝衔接。将学到的Analytics思维方式泛化到其他应用场景,面对Case Study建立系统性解决思路。
提升项目演示Presentation技能,学会如何从原始数据中挖掘具有意义的故事。为客户解决实际问题,提高Business KPI。
完成项目后,辅导老师将帮助你利用这一个惊艳的项目背景打造最引人注目的简历;所有学员获得内推机会,优秀学员获得一对一面试辅导。
想获知更多课程详情,请长按二维码,添加小助手为好友,回复“MMM”即可:
小助手
明年的你,是否能在更好的公司做更优秀的自己?投资自己,全方位提升能力,为自己增添被验证有效的宝藏项目经历!赶快报名吧!
前往“发现”-“看一看”浏览“朋友在看”