如何准备Uber数据科学家的面试?
原创:MarTechApe
优步(Uber)大家应该都不陌生吧。它是一家跨国打车公司,在全球785多个城市设有大规模运营机构。服务范围包括叫车, 送餐, 物流和微型出行等。Uber致力于:
通过自动驾驶和城市空运,使客户体验贴更近未来。帮助人们快速经济地订餐,消除医疗保健屏障,开发新的货运预订方案,并帮助公司为员工提供无缝的出差体验。
Uber正逐步地将数据科学与分析纳入几乎每个部门和服务中,例如风险管理,市场营销和政策实施等。
1. 数据科学在Uber中的角色
Uber数据科学家在不同团队所扮演的角色也有所不同。工作内容很大程度上取决于你所申请的团队, 通常包括基本的商业分析,建模,机器学习和深度学习的应用。Uber作为一家大型公司,在安全保险,乘车,风险,平台,营销科学,政策和Uber Eats等多个领域拥有庞大的数据科学团队。
1).必备技能
每个岗位的要求取决于不同部门。但是Uber通常更愿意聘用有至少三年工作经验的候选人,除非应聘的岗位是Associate。
招聘的基本要求是:
Ph.D., M.Sc., B.Sc. 或B.A.学位,专业为统计,数学,经济学,运筹学,计算机科学,物理或任何其他的定量科学。(高学位优先)。
在实验设计(A / B测试优先),数据分析,统计分析和机器学习模型开发方面拥有3年或3年以上经验(对于高级数据科学家,需至少10年经验)。
精通至少一种编程语言,例如Python,Java,R或SQL。
拥有构建管道和ETL的经验,将大规模复杂的数据集中(Hadoop,Hive,Vertica,Presto)结构化和非结构化数据集转换为可操作的数据模型。
2).Uber有哪些不同的数据科学角色?
Uber有各种各样的数据科学团队,分布在公司的不同部门。Uber的“数据科学家”主要在数据科学和数据科学与分析这两个团队里发光发热。
根据团队的不同,他们的职能可能包括:
安全与保险:应用机器学习算法来优化安全策略,以帮助客户降低安全风险。
核心客户:预测产品行为,并对Uber核心的乘车-共享产品各个方面进行自动化。
风险:开发机器学习模型,提出相关策略来遏制市场滥用和付款欺诈行为。
研究:进行内部研究,以更好地了解市场环境并提升产品。
营销科学:运用统计建模,机器学习或数据挖掘技术来为Uber全球营销工作提供宝贵的见解。
2. 面试过程
面试第一步是招聘人员或招聘经理的电话初筛,一般15分钟和30分钟。接下来是Uber take-home challenge。包括SQL,实验/商业智能和数据分析问题。然后再进行45分钟的技术面试。最后一轮就是五个面试官小组的现场面试。
1).初筛
提交申请后,招聘经理或招聘人员会先进行一轮电话初面。主要考察申请人背景与工作职责以及团队的切合度,有时也会有一些初浅的技术问题。看看申请者过去的经历如何能应用到Uber中。招聘经理还可能会问一些更高级的技术问题,例如:
什么是营销归因?
你将使用什么指标来衡量模型的有效性?
你将如何向非技术人员解释p值的含义?
招聘经理通常在这轮面试找一些瑕疵。所以你要对基本的建模分析概念准备充分,熟练的表达技术概念及项目。
2). The Take-Home Challenge
完成电话初筛后,接下来会是一个需要在一周内完成的 take-home challenge,包括三个部分:
SQL和分析:系统会为你提供一个Uber实例, 要求通过SQL解决各种分析问题。
定性部分:有关指标评估和实验设计的问题。
建模:建一个实用的预测模型。
Uber已将这一挑战标准化了。但是有些组也有可能会添加一些跟他们相关的特定问题。
应对Take-home challenge,我们推荐这一本在数据科学求职上脍炙人口的书:《A collection of Data Science Take-home Challenge》
3).技术面试
下一步就是跟数据科学家的技术电面。大多数情况下问题是与Uber相关的开放式的案例分析。这里主要是测试你的思辨和解决问题的能力。可能会涉及机器学习,像是如何通过特征选择和建模来解决现实生活中的Uber问题。如果岗位是偏分析的,那么你也可能会遇到关于产品的问题。示例问题:
哪些指标能评估不同的Uber服务?
如何判断分布的某种趋势是由于异常引起的?
在以往监督式机器学习的应用中遇到过什么问题,你是如何解决的?
如何预测乘车订单?你如何评估Uber的预计到达时间算法?
4).现场面试
通过技术面试后的下一步就是现场面试了。包括5到6轮,每轮45分钟。面试内容有白板编程,与经理和数据科学家的项目讨论,商业案例分析以及统计概念的讨论。
面试小组通常如下分配:
与数据科学家一对一的面试是一些开放式的商业智能分析以及概率统计问题。
与产品经理的行为面试。
与招聘经理的面试将深入探讨Uber及其团队。你可以在这里问一些有建树,考虑周到的问题。
与数据科学家关于机器学习技术的探讨。涵盖建模概念和机器学习设计方面的问题。
与数据科学家进行长达45分钟的SQL或算法的编程。如果岗位是分析部门,则为SQL;若是机器学习部门,则为算法。
面试的最终目标是评估申请者如何运用数据科学概念来解决Uber特定的商业问题。掌握统计概率基本知识,A / B测试和实验设计以及建模等。
在技术方面要练习编程,可以在Interview Query上找到SQL练习题。多做些题将有助于提高你技术面试的通过率。
3. Uber 常见的面试问题汇总
将线性回归分别解释给孩子、一年级大学生和经验丰富的数学家。
假设我们推出了一项新的Uber Eats功能。你会选择什么作为衡量成功的关键指标?
你如何设计一种针对驾驶员的激励计划,使他们更有可能进入需求高的城市?
给定一个随机的伯努利试验生成器,编写一个函数以返回从正态分布采样的值。
你会用什么指标来跟踪Uber付费广告获取客户的策略?如何确定合适的客户获取成本?
估计一下让车队每天为美国每个主要城市拍摄Google街景照片的费用是多少?
构建一个文本包装器。例如,仅在空格处将长句子按字符限制分割。
编写生产代码来查找列表中总数为8的数字的所有组合。
MLE和MAP有什么区别?
线性回归的假设是什么?
嵌套SELECT和WITH在SQL中做什么?
你会用哪种算法来预测驾驶员是否会接受乘车订单?会选取哪些特征?
如果你也想成功通过面试、加入Uber成为一名数据科学家,如果你也想要熟练掌握各种数据分析需要的核心技能(SQL, Database, Statistics, Tableau等)并且拥有过人的商业意识,那就千万不要错过MarTechApe的宝藏项目《营销组合建模企业级实战训练营》,一个专门培养优秀数据分析师/数据科学家的企业级别实战项目,拥有企业真实数据(改编)与行业标准流程。项目经历可成为简历上的履历!9月26日就要开课啦!
🔥火热报名中!🔥
训练营的学员收获了:
真正意义上的“用数据和模型解决营销中最重要的问题”的经历。
熟练掌握SQL、R、Tableau等时下最流行的数据处理语言,并用这些技能解决实际问题。
大大提高Media/Advertising Industry的商业意识,熟悉不同媒介渠道的广告活动对不同商业指标的不同回报率(ROI)与有效性(Effectiveness),学会用“营销效果”的视角看待营销活动,理解各大公司市场营销部门、消费者洞察部门的痛点。
跳出学校作业的框架,上手真正商业情境中、实际工作中的实战案例。让校园与实际工作无缝衔接。将学到的Analytics思维方式泛化到其他应用场景,面对Case Study建立系统性解决思路。
提升项目演示Presentation技能,学会如何从原始数据中挖掘具有意义的故事。为客户解决实际问题,提高Business KPI。
完成项目后,辅导老师将帮助你利用这一个惊艳的项目背景打造最引人注目的简历;所有学员获得内推机会,优秀学员获得一对一面试辅导。