「Lyft数据科学家面经」新鲜出炉!
原创:MarTechApe
Lyft是一家总部位于旧金山的快速发展的拼车公司,是Uber的主要竞争对手。已经覆盖了美国的644个城市和加拿大的12个城市。
2012年,最初,Lyft是名为Zimride的长途拼车业务的一部分
2013年,Lyft在硅谷正式成立
2014年4月,覆盖60个美国城市,公司迅速发展
2017年1月,扩展到了300多个城市
如今,Lyft的用户已增长到2300万,到2020年,骑行记录达到10亿
Lyft每天会生成数百万个数据点,需要强大的数据科学和研究科学的支持。因此,数据科学和商业智能部门的任务是利用最先进的分析,机器学习和大数据(使用AWS S3 / AWS EC2)工具来提供商业模型和见解。
Lyft的数据科学岗位
Lyft的数据科学职能可以化为为三个团队:数据科学家,研究科学家和机器学习工程师。
数据科学家
数据科学家负责构建分析基础架构,创建模型以及设置用于自助服务分析的可视化仪表板。Lyft的数据科学家最初被称为数据分析师,后来更多地专注于分析,并与产品经理一起紧密合作以推动产品决策。
研究科学家
Lyft的研究科学家就相当于传统数据科学家的角色,并写代码来处理核心机器学习项目,例如估计的乘车时间和每次乘车的价格。他们的工作主要集中在与Lyft产品相关的自动化引擎上。
机器学习工程师
Lyft的机器学习工程师专注于构建基础结构,以承载研究科学家构建的复杂模型。
Lyft的数据科学家的职责会根据不同产品和功能团队而不同。所以,你是什么角色或者职责取决于你所在的团队和产品/功能。无论与你在哪个团队,或分配到哪个产品/功能,Lyft的数据科学家都将跨业务分析,建模,运用机器学习和深度学习的技术。
需要的技能
Lyft营造了一种“开放,包容和多样化的环境的文化,员工会因为他们给公司创造的价值被认可”。Lyft倾向于雇佣具有3年以上数据分析和可视化经验的优秀申请人。
Lyft招聘的其他基本要求:
统计学,经济学,应用数学,运筹学或工程学等定量领域的学士/理学士学位。优先考虑更高学位。
在数据科学或分析领域拥有3年以上的行业经验。
出色的数据分析,建模,Python和SQL语言(MySQL,PostgreSQL,SqlServer,Oracle)技能,能够对大型数据集编写结构化且高效的查询语言。
精通Tableau,Power BI或类似的数据可视化软件。
熟练使用ETL逻辑构建新数据表:构建,管理和修复整个企业数据模型。
精通Airflow等工作流管理工具。
出色的沟通能力,能够给相关方提出发现和建议。
数据科学职位的具体职能?
Lyft有专门的数据分析和商业智能部门,但是根据你所在的团队和产品,工作角色和职能可能会有所不同。根据团队的不同,职能可能包括:
利用机器学习来自动化管理增长杠杆的工具。
通过每周、每月和每季度的业务总结,跟踪并制作与核心业务相关的KPI报告。
分析整个市场中价格变化对市场影响。
与产品部门密切合作,以构建最有效的工具,系统和流程来大规模管理定价
在Lyft的数据科学团队包括:
地图、路线
自动驾驶汽车
市场
动态定价
增长团队
乘客体验
驾驶员体验
欺诈团队
机场体验
Lyft面试过程
Lyft的招聘过程与其他大科技公司相似。首先是与招聘经理或人力资源部进行初步电话筛选,然后进行 take-home challenge(通常需要24小时内递交)或技术筛选。成功完成Take-Home挑战和长达45分钟的技术面试(有时候是两次技术面试)之后,随后会进行五或六个一对一的现场面试,由于covid-19现在改为线上。
初筛
初步筛选是通过HR或招聘经理的电话进行的。这次面试主要是基于简历并是探索性的。重点是评估你的背景,尤其是过去的经验,角色,团队的活力,来决定你是否与职位匹配。
技术面
通过后的下一步是与数据科学家进行技术方面的电话面试。这次面试持续30到45分钟,面试问题涉及概率,统计,机器学习,业务案例研究,定义运营KPI,进行假设检验过程中的一些数学问题,以及你的技术/过去项目经验。
Take Home Challenge
完成初始筛选后,你将收到Lyft的Take Home Challenge,要求在24小时的时间内完成。Take Home Challenge中的问题是基于案例研究的问题(拼车数据集),并且包括技术和业务方面的问题。挑战中的问题通常跨越不同的主题,例如流失率测量,优化(使用机器学习),实验的设计,局限性和结论的综合报告。
现场面试
通过技术面后,下一个面试是现场面试。过程包括与数据科学家或团队经理进行的五到六次一对一的面试,每次大约持续45分钟。这将持续半天,其中涉及White Board Coding,与团队经理和数据科学家进行项目讨论,商业案例研究以及统计概念。
通常来说,现场面试需要做Take Home Challenge的演讲,把之前提交的Take Home Challenge的结果做一个展示。
提示:在这个阶段,你将围绕你的分析建立一个连贯的故事,同时回答有关你使用什么度量指标以及为什么选择它们的问题。
商业案例研究:问题主要是开放式的,围绕着真实的商业案例研究。建议重新学习与Lyft拼车相关的某些关于单位经济(Unit Economics)的指标。
与一个数据科学家探讨统计和概率:问题围绕假设检验,例如经典的“硬币投了y次获得x次正面”。考察你将熟悉的关键概念应用于真实的商业环境,它们的变体以及如何使用SQL进行数据操作。
SQL / Python面试:长达45分钟,需要你来white board coding SQL或R / Python的算法。
与产品经理探讨核心价值观/文化契合度。
面试过程的目的是评估你运用分析方法和实验思想来解决真实商业问题,带来商业影响的能力和经验。切记要熟练掌握统计知识和概率,实验设计(A / B测试)以及关键统计概念的商业应用。此外,阅读关键的经济指标和KPI,算法和模型也将有所帮助。
更多「Lyft数据科学家」面试问题
描述如何设计热图,告诉驾驶员要去哪里。
如何定义一个需求量会比较大的区域,以及你想让谁去那里?
如何通过模型来评价激增对需求和供应的影响?
解释相关性和方差。
说明实现拼车的最佳方法。
如何减少供应方的流失?
驾驶员的终生价值是多少?
哪些因素会影响驾驶员平均等待时间的增加?
你熟悉哪些优化技术,它们是如何操作的?
在一个给定的线性需求函数下,你将如何找到最佳价格?
如何从极坐标中的圆上绘制均匀的随机样本?
查找具有基本分布的随机变量的期望。如何构建置信区间?
你如何估计用户叫车的可能性?你需要什么假设才能估算这种可能性?
想要积累企业级项目经验,轻松对答面试题,拿到理想offer?MarTechApe的《A/B测试企业级实战训练营》以真实商业场景中的复杂A/B测试问题为项目背景,让学员在两个月的时间里,使用百万量级原始数据,搭建完整的A/B测试流程!
在过去开办的三期《训练营》中,我们为顶尖科技公司输送数据能力强、实验经验丰富、统计基础扎实的数据人才。不论你本来是什么背景,都能通过这门课程,打开盛行“测试文化”的互联网高科技公司的大门!
以下为往期学员的战绩榜:
🔥目前,MarTechApe《A/B测试企业级实战训练营》正式火热报名第4期!🔥
每一期训练营,我们只招收20名学生。