Google数据分析师教你如何拿下大厂面试

0.png

2020年对于所有留学生来说,可真的是太难了。受疫情的影响,大多数学校已经改为网上授课。而对于马上毕业,准备求职的同学们来说,想必更是煎熬。一些原本安排好的onsite面试要不改成了在线上进行,要不就是往后推延;还有很多公司更是暂时中止了招聘。

但即便行情看上去不容乐观,身处茫茫求职大军的我们也不能就此懈怠,更不能停下面试准备,仗都还没打就缴械投降了,那还谈何胜算?说一句真理:机会永远是留给有准备的人的。我们更加应该调整好心态,把握好节省下来的时间。

为了帮助大家平稳的度过这段特殊时期,我们为大家整理了一些数据相关的求职经验分享。本文作者Vincent Tatan,通过了重重面试,拿下了Google数据分析师的职位,他也曾在VISA担任数据软件结构工程师,他将用亲身体验告诉你,如何应对Google、Visa、Amazon等大厂的各轮面试,斩获自己心仪的职位。

在众多数据分析岗面试中,你会面临以下三类问题:技术类问题、行为类问题、假设类问题。下面让我们一一进行解析。

技术类问题

Source:Giphy

Source:Giphy

技术面通常出现在第一轮或第二轮,以确保你在和HR与主管面试之前已经具备了这个岗位的技术要求。一般会考察:

SQL

SQL题通常的考法是向你出示几张表,其中包括日期、字符串和数字列,要求你使用SQL语言聚合某些年或某些类别(例如年龄或地点等)的数据。

解答这类问题,我的建议是:

  1. 询问一些假设:对于相同的值,某个数据点是否可以用不同的方式表示。例如,“ Street”和“ St”具有区分大小写的差异。这可以帮助你在SQL中使用filter,例如使用“like”匹配还是“exact”匹配单词。

  2. 考虑一下极端情况:数字数据是否已经是纯数字格式,没有任何歧义或缺失值,例如-1代表丢失的数字。

  3. 把你的所想大声说出来:从绘制思维图,在白板上写下解决方案,然后大声思考来确保你的思维过程清晰。在面试官确认后,用你喜欢的语言编写解决方案的代码。

此外,SQL考察还经常在考数据聚合和过滤(group by和having语法)的同时考连接表的题(inner join,outer join),请参考下图。

Source:Stack Overflow

Source:Stack Overflow

此时,如果你忘记了某个语法,请老实告诉面试官。写下你所知道的并继续。 你的面试官知道只要你对SQL JOIN有透彻的了解,某个具体的语法可以简单通过上网搜索解决。就算出了错,也不要太慌张,微笑,继续。

代码问题

接下来面试官会问你一些代码问题。可能是如何对某个二维数组排序,如何在单词字符串中搜索某些pattern,或者如何聚合数据。在这种情况下,我鼓励使用python,因为它的语法作为脚本语言要短得多,并且发生bug的几率较小(用Java就可能出现缺少分号的问题)。

同样,要回答此问题,我们需要从以下内容开始:

  1. 给出假设并找到你的测试用例:这是你自行决定用例的机会。如果列表中有重复或未排序的数据,它将返回什么?如果列表为空怎么办,它将返回什么?如果用户传递空值该怎么办?

  2. 给出多个答案:大多数时候,你应该能够想到简单粗暴的方法,将整个列表逐一元素过一遍。此外,你可以设计一个更有效的排序算法(合并排序等)和迭代。

  3. 写代码前先确认你的答案:向面试官确认你的答案,并且只有在批准后才开始写代码。征求他们的反馈并修复你的算法。另外,请注意在做类似经典的“栅栏涂色问题”(不能出现连续两根以上栅栏颜色一样)时,要格外小心犯一些致命的低级错误(比如因为索引值超出范围而报错)。最后,用测试用例测试代码。

行为类问题

Source:Giphy

Source:Giphy

这类问题的目的是让你的面试官了解你过去的经历以及你解决问题的方式方法。

常见的问题有,你之前做过哪些数据项目?

这是你表现自己的机会。作为有抱负的数据分析师或数据科学家,你们中的大多数人应该拥有一些值得夸耀的项目。如果你有Github项目,请准备好并展示你所构建的一些应用程序。如果你像我一样在Medium上撰写博客,请展示你最受欢迎的项目并展示访问量。无论你有什么项目,都应专注于提供能展示你的技能和信心的指标。

优秀的答案长这样👇:

“at Visa I have worked in extracting client key reports for clients (acquirers and issuers). These are the key information which are managed as a part of authorization process that Visa has to ensure secure transaction channels. As a result, the users can now generate the reportings through their own portal with 43% time saved. I also mentioned my project from Lazada to use clusterings and features engineering to find important seller features then relate them to how I could contribute for the role.”

你需要指出你项目的亮点,说明这个项目和申请的工作的相关性。

假设类(应用类)问题

Source:Giphy

Source:Giphy

在这类面试题中,面试官将使用以下一些问题,了解你解决问题的思路,而这些要解决的问题一般是你申请这个职位经常要处理的问题。求职者的目标是通过结构化、理性的方式,向面试官说明你的关键行动。

类型一

如果我们发现产品上存在一些漏洞,但被产品经理或高层否定了。你会如何应对?

这是一个棘手的问题,但是公司希望了解你如何处理困难的情况,并能够执行正确的解决方案而不是简单的解决方案。

这些是你应该问的几个问题:

  1. 产品经理为什么否定我们的发现,是否有任何特殊原因?

  2. 我们的团队和产品经理的共同利益是什么?其中的共同利益可以是用户体验或数据安全。

一旦知道了问题,就可以使用数据驱动的决策来证明你的发现。

  1. 首先,你需要找出影响的范围并创建一些可视化内容。比如说,你可以进一步将条形图或地理位置放在发现漏洞和受影响用户的位置。

  2. 其次,你可以从客户支持部门找到定性反馈。你需要与客户经理联系,看看常见的用户痛点是什么。然后,您可以将其与用户体验这一主要问题联系起来。

  3. 最后,突出显示要推荐给产品经理的关键操作。这必须可以在产品经理的时限内相对快速地完成。例如,产品经理应使用增强的API来检测和解决漏洞。

通过提问和结构化答案展现你的思路,你将给面试官留下深刻的印象。

类型二

你如何设计用于解决某种问题的机器学习模型?

这类问题考察的是你对特定问题进行建模的能力。通常在这种情况下,你可以:

  1. 从探索性数据分析(EDA)开始做起:你可以建议先对问题进行可视化。假如说,如果午餐期间产品流量增加,你需要要提出一个假设,说明发生这种情况的原因并进行测试。

  2. 通过具有解释性的简单模型做出一些假设:在数据管道的早期阶段,获得对数据的一些初步认识比追求准确性更重要。也就是说你应该使用更简单的模型从数据中得出一些见解,并了解哪些因素最能驱动因变量/指标。我建议对分类模型使用决策树和Logistic回归,对回归模型使用简单的线性回归。这些模型可以让你对信息获取和重要系数进行可视化,并进行进一步的分析。

  3. 展示特定的模型学习方法:展示通过EDA和简单模型获得的见解之后,需要提出更专业的技术解决方案。在文本分析问题中,建议大家使用LDA(线性判别分析)来查找主题聚类。对于需要高精度分类的问题,可以考虑使用集成模型,例如Random Forest和XGBoost。需要注意的是,你必须要深刻理解常用模型的方法。

  4. 保持诚实并继续前进:如果你不熟悉某个主题,请诚实地说“我不知道”。数据科学是一门快速发展的学科,并且不可能有人期望你精通100%的专业知识。因此,承认你的缺点并继续前进不是什么丢人的事情。

面试技巧

准备,准备再准备

机会总是留给有准备的人,对不同类型的问题都进行充分的准备,和你的同学朋友进行模拟面试,征求他们的意见。

Source:Quotefancy

Source:Quotefancy

面试是一个推销自己的双向对话

面试结束时,你的面试官就是你的朋友。不要太紧张,直言不讳。多聆听,享受这个过程。通过与HR的交谈,我学到了更多关于职位的知识。

保持乐观,享受过程

面试后,反思5分钟,注意进展顺利或发生问题的地方。无论接下来发生什么,你都可以将自己的志向和技能提升到一个新的水平。

希望大家可以拥抱变化,积极调整自己的求职状态,顺利找到工作!

如果你最近待在家里希望给自己充充电,积累求职面试时的数据分析相关经历,并获得上述Google数据分析师所讲的三类面试解题思路的专业指导和梳理,诚挚向你推荐MarTechApe数据分析宝藏项目《营销组合建模训练营》

整个项目里会手把手带你经历全套的企业内营销数据分析流程,从数据源概况、数据处理与可视化,到统计建模、深度诊断。同时配备SQL技术、行为、假设类面试辅导和简历指导。每位学员将有一套亲自打磨的Data成果作品和一套Model成果作品,以及一段完整的可以写在简历中为客户解决实际问题的经历。

现在项目第8期已开始招生,如果你希望通过这样一个项目加速斩获理想Offer,就快来报名我们的《营销组合建模训练营》吧!以下是项目具体介绍:

好的项目可以帮助你学习到必要的概念并敲开理想工作的大门。从2018年起,我们已举办了共7期《营销组合建模训练营》,往期的学生们拿到了全美顶级的面试机会以及全职工作OFFER,组成了训练营的荣誉之墙:

Marketing Mix Modeling Bootcamp往期学员拿到的面试机会以及全职工作OFFER包括Google、Facebook、Twitter、LinkedIn、Uber、Wayfair、Walmart、Accenture、Pepsi、Bloomberg、Square、Deloitte、Salesforce、AT&T、JP Morgan、Mediamath、GroupM等互联网科技公司、咨询公司、广告传媒公司、金融机构。

Marketing Mix Modeling Bootcamp往期学员拿到的面试机会以及全职工作OFFER包括Google、Facebook、Twitter、LinkedIn、Uber、Wayfair、Walmart、Accenture、Pepsi、Bloomberg、Square、Deloitte、Salesforce、AT&T、JP Morgan、Mediamath、GroupM等互联网科技公司、咨询公司、广告传媒公司、金融机构。

1.营销组合模型训练营是什么?

营销组合模型训练营(Marketing Mix Modeling Bootcamp)是MarTechApe的宝藏项目,由全球最大广告集团 WPP美国办公室的数据总监以及营销分析经理共同授课。在训练营中,你将学习在真实商业情境中如何用营销组合模型解决广告营销最核心的问题——科学合理地评估不同广告对品牌和销售的影响,以统计模型的结果来科学优化广告预算。

7.png

训练营的学员收获了:

  • 真正意义上的“用数据和模型解决营销中最重要的问题”的经历。

  • 熟练掌握SQL、R、Tableau等时下最流行的数据处理语言,并用这些技能解决实际问题。

  • 大大提高Media/Advertising Industry的商业意识,熟悉不同媒介渠道的广告活动对不同商业指标的不同回报率(ROI)与有效性(Effectiveness),学会用“营销效果”的视角看待营销活动,理解各大公司市场营销部门、消费者洞察部门的痛点。

  • 跳出学校作业的框架,上手真正商业情境中、实际工作中的实战案例。让校园与实际工作无缝衔接。将学到的Analytics思维方式泛化到其他应用场景,面对Case Study建立系统性解决思路。

  • 提升项目演示Presentation技能,学会如何从原始数据中挖掘具有意义的故事。为客户解决实际问题,提高Business KPI。

  • 完成项目后,辅导老师将帮助你利用这一个惊艳的项目背景打造最引人注目的简历;所有学员获得内推机会,优秀学员获得一对一面试辅导。

2.学员对训练营评价如何?

Marketing Mix Modeling Bootcamp开办至今,收获了大量好评,学员们都觉得Bootcamp的质量非常高,在节课后给我们发来了很多让我们 非常感动的评论:

mmm-学员评价.png

3.训练营老师是谁?

1. 全球最大广告传媒集团WPP | 数据总监

  • 商业分析高级专家

  • 拥有7年数据分析经历

  • 各类SQL、Tableau疑难杂症的go-to person

2. 全球最大广告代理公司GroupM | 营销分析经理

  • 营销效果分析专家。为十多个每年广告预算上亿美元的大客户提供营销效果评估、销售预测等解决方案

  • 拥有6年Marketing Mix Modeling等高阶分析经验,具有丰富的训练新人和带领团队的经验

  • 毕业于Columbia University统计学系

现在Marketing Mix Modeling Bootcamp第八期

已正式开放报名!

我们的老规矩:小班教学,每一期Bootcamp只招收20名学生,先到先得!

接下来我们就看看训练营的具体课程内容吧!

4.在Bootcamp中可以学到哪些内容?

  • 整个bootcamp分为广告数据源概况、数据处理与可视化、统计建模、深度诊断,共计24小时课时,在两个月内完成。

  • 周末Online Live授课,课后完成老师布置的作业,助教团队在班级群随时答疑,直播录像永久回放。

  • 课程内容涵盖了数据分析岗位的完整工作流程(analytics cycle):

    • 数据收集 Data Acquisition

    • 数据处理和清洗 Data Processing

    • 数据可视化与商业洞察 Data Visualization & Data Story-telling

    • 统计建模 Modeling

    • 模型优化 Optimization

    • 销售预测 Simulation

    • 深度诊断 Side Diagnostics 

    • 结果展示 Presentation

  • 每位学员将有一套亲自做的Data成果作品和一套Model成果作品,以及一段完整的为客户解决实际问题的经历。

  • 结课后,每位学员获得提升简历的Project Experience完美描述,所有学员获得内推机会!优秀学员获得额外一对一面试辅导

  • 报名的学员可在开课前一周获得详细的Syllabus。

mmm-大纲.png

5.上完Bootcamp,有哪些成果可以展示?

从变量可视化分析、模型解读、营销渠道分析,到战略洞察、PPT演示,学员的精致作业就是他们最好的训练营成果,这一份拿的出手的高品质项目,无论是LinkedIn还是面试展示,都会是脱颖而出的最佳帮手!

mmm-作品.png

正是这些实打实的项目经验和能够直接拿到面试官面前展示的作品,让我们的学员在面试的时候信心倍增,让面试官刮目相看!

说了这么多,到底怎么报名这门干货十足物超所值的项目课程呢?

6.报名方式

长按二维码,添加小助手为好友,回复“MMM”,即可报名bootcamp:

小助手(微信ID:yvonne91_wsn)

24.jpg

 价格规则 

熟悉我们的老用户,应该知道我们一直都是实行阶梯价格的,这次也不例外:

先到先得、越早报名越优惠(原价$1999美元)。以下价格单位为美元:

第1名~第5名:1299美元

第6名~第10名:1499美元

第11名~第15名:1599美元

第16名~第18名:1799美元

第19名~第20名:1999美元(原价)

2020年的你,是否能在更好的公司做更优秀的自己?投资自己,全方位提升能力,为自己增添被验证有效的宝藏项目经历!赶快报名吧!

本文来源:https://towardsdatascience.com/ace-your-data-analytics-interviews-ef114606c5d7