扒一扒 Lyft 有多少种不同的数据科学家?
原创:MarTechApe
本文将目光锁定在Lyft 数据科学的各种岗位,解释数据科学如何配合公司其他部门运转,以及带大家看看数据科学家面临的一些独特的挑战。
数据科学岗位
Lyft组建了一个由200多名数据科学家组成的团队,他们具有不同的背景、兴趣和专业知识,为的是做出最佳决策,来构建出最佳产品。我们根据他们的常规输出来组织和管理团队:决策团队和算法团队。
数据科学之决策 :“为人服务的数据科学”
决策数据科学家会影响高管、产品经理、工程师、运营/业务团队和其他利益相关者的决策。他们利用自己对业务的深刻理解来开发决策框架,使得对结果影响最大的问题和解决方案能够有效统一。
数据科学之算法:“为机器服务的数据科学”
算法数据科学家开发为内部和外部生产系统提供动力的模型。他们通常结合使用优化、机器学习和推理方法来设计、改进和监视模型和系统。
在几乎所有数据科学家中,日常工作的许多组成部分都是相同的,例如,捕捉产品或业务机会,提出数据相关见解,设计实验以及解释实验结果。团队的实力既来自于这些共同的目标,也来自于其他各种互补技能。
决策和算法之间的区别可以帮助我们根据业务需求雇用员工:是影响人为的决策还是编写高质量的生产模型。但是,将数据科学家分为这两类并非想要限制他们的参与范围, 实际上是鼓励数据科学家根据需要、执行能力、对新技能学习的渴望去探索这两个领域。
重点领域
Lyft的团队按重点领域组织,每个领域都包括来自多个职能领域的专业人员(产品,工程,数据科学,设计,业务/运营)。各种职能朝着共同的目标齐头并进。这种结构的目的是明确所有权,简化沟通并增强跨职能的协作。下面简要介绍一下每个重点领域的工作以及数据科学在其中的贡献。
1. 市场 (Marketplace)
这个领域负责基础系统,这个基础系统决定如何调度车辆和对每次乘车进行定价。市场主要是权衡取舍和效率:充分利用资源来使司机,乘车人和公司都获益。一些示例项目有:
● 设计一种模型,以最节省时间和成本的方式为整个城市的乘客分配司机。
● 确定哪些乘客应该在共享乘车中匹配,使乘客有良好的乘车体验,同时也保证利润。
● 利用定价和激励措施来平衡供需。
2. 乘客 (Rider)
这个小组致力于通过构建高质量的端到端产品和体验来吸引和留住乘客。通过以下方式实现这个目的:
● 评估乘客的乘车体验,开发和测试使乘车过程畅通无阻的产品和功能,以改善他们的体验。
● 分析过去的行为以了解乘客的需求和偏好,并设计会员制度和其他留住乘客的计划。
● 通过有针对性的模型和营销活动来优化乘客的获取和参与渠道。
3. 司机
这个领域致力于通过提供一流的产品体验来确保发展,保留并吸引司机。通过以下方式实现这个目的:
● 建立新的薪酬结构,确保司机获得一致且可预测的可观收入。
● 设计和测试新产品功能帮助提供最直观,无干扰和安全的驾驶体验。
● 优化司机入门程序,建立模型以识别有辞职意向的司机,并创建用户细分来实现产品定制和营销功能。
4. 拼车计划与运营
该小组负责共享乘车的增长/盈利,制定计划和一些基于市场的战略。重点有:
● 构建诊断工具,例如通过异常检测、归因、竞争者分析和报告来提高我们对业务的理解。
● 在各种不同情况下建立投资计划,这些计划会随着条件的变化而灵活变化,例如通过预测和优化。
● 创建决策框架,例如通过因果归因和估值模型来优化我们在乘客,司机和市场上的投资。
5. 路线规划
这个领域主要用于构建和衡量Lyft地图,地图数据以及基于其构建的众多服务的质量。数据科学解决的一些问题包括:
● 向下游算法团队提供最准确的输入(行驶时间,行进距离,司机和乘客位置,接送点)。
● 建立用于测量地图准确性的框架,其中包括检测新更新功能的bug,报告地图上缺少的元素以及建立特定于应用程序的质量标准。
● 为Lyft的路线规划技术做出贡献,实时生成两点之间的最佳路线。
6. 客户平台
这个小组的重点是将前沿的数据模型和框架应用于Lyft数十亿美元的可变成本——如支付、支持、诈骗和保险等。示例项目包括:
● 建立一个远程信息处理平台,将原始手机传感器数据转换为诸如攻击性驾驶刹车信号或使用手机等信号,以用于帮助司机提高驾驶能力,降低事故发生率。
● 优化我们在不同支付提供商之间的交易路径,以平衡长期价值的成本。
● 识别和分类消极用户体验的根源,以便预测和预防它们。
7. Lyft Business
Lyft Business是Lyft的2B业务,专注于建立灵活的通勤,礼仪和旅行管理的解决方案,以帮助合作机构降低成本和合理化他们的地面运输需求。数据科学工作包括:
● 通过开发框架和工具来推动产品决策,以了解现在的产品体验中的缺陷,并确定改进机会。
● 开发技术和投资回报率(ROI)框架,以确定与商业伙伴(如航空公司或酒店)合作的机会,提供高质量的旅行体验和客户忠诚度计划。
8. 研究(市场实验室 & 经济学)
这些领域带来了以科学和研究为基础的专业知识,帮助解决Lyft以及更广泛的交通服务行业的一些最复杂的问题。我们与合作伙伴协作,为高风险但高回报的问题制定变革性的解决方案。最近的努力包括:
● 为实时司机供应、司机收入和共享出行效率提供全新的解决方案。
● 针对市场中诸如定价和新产品发布等各种杠杆,利用最先进的统计、机器学习和计量经济学技术来提高Lyft衡量因果关系影响的能力。
● 将现有的经济学文献与计量经济学和统计工具结合,探讨研究问题例如:我们应该如何定价一种新的模式?我们认为新的法规会对企业产生什么影响?新建的道路如何影响出行速度?
9. 车队
车队包括Express Drive(为司机提供的租车),Lyft Rentals(供消费者租用的汽车),以及司机服务中心。数据科学可以帮助提高车队的增长和盈利能力。示例包括:
● 建立模型来确定最优定价以平衡需求、供给和驾驶风险。
● 通过识别风险司机、改进车队预报和优化零售地点,开发可以最小化运营成本的框架。
● 通过改善渠道和产品体验的机会,提高租客留存和参与度。
10. TBS(交通-Transit,自行车-Bikes,和滑板车-Scooters)
这个领域开发和支持Lyft的所有非汽车产品。一些独特的关注点包括:
● 通过建立运营绩效指标和建立数学模型来改善运营,优化在街道上的产品的均衡调整、电池更换和维护过程。
● 通过整合公共交通运输和微移动性,建立多模型路线算法并对用户偏好建模,以确保Lyft用户在合适的时间以合适的价格获得合适的乘车类型。
● 分析最一流的车辆发送的数据(Lyft设计和制造自行车和滑板车!),并开发结合传感器数据的融合算法,以确保车辆的安全行驶和停放。
11. Level 5(无人驾驶)
这个小组帮助加速Lyft平台上自动驾驶车辆的推出。包括一些项目例如:
● 在道路和模拟环境中测量Lyft的自动驾驶技术的进展。
● 针对共享出行应用案例,确定不同自动驾驶特性的优先顺序,并在选定的最佳位置增加的自动驾驶试点。
● 通过建立模型确定自动驾驶车辆的可用性,以最大化车队的利用率。
结论
我们希望这篇文章能让你深入了解Lyft的数据科学团队,以及我们每天要解决的大量问题。我们的团队拥有多元的专业人才,以及让我们能够与其他职能团队紧密合作的公司结构,确保我们能够严谨、逻辑地处理每一个决定。
随着数据科学的应用越来越广泛,不仅仅是Lyft,每家大厂都具备了功能各种多样的数据团队。深入了解A/B测试,能让你快速适应万变不离其宗的大厂数据分析团队工作模式。想要上手企业级项目,获得关于数据产品的实操经验,培养科技公司必备的商业思维,加入科技大厂数据分析团队?MarTechApe的《A/B测试企业级实战训练营》以真实商业场景中的复杂A/B测试问题为项目背景,让学员在两个月的时间里,使用百万量级原始数据,搭建完整的A/B测试流程!
在过去开办的四期《训练营》中,我们为顶尖科技公司输送数据能力强、实验经验丰富、统计基础扎实的数据人才。不论你本来是什么背景,都能通过这门课程,打开盛行“测试文化”的互联网高科技公司的大门!
以下为往期学员的战绩榜:
🔥目前,MarTechApe《A/B测试企业级实战训练营》正式火热报名第5期!🔥
每一期训练营,我们只招收20名学生。
👇点击下方按钮,了解项目详情!👇