我在一家初创公司做职业导师,帮助那些有志于从事数据科学岗位的求职者。我发现其中有一条建议是我反复对我的学生提到的,但我原先并没有预料到这条建议会使用得这么频繁。
这条建议就是——我会希望他们首先考虑一下自己想成为什么样的数据科学家,而不是马上先去建一个新的数据库或开发一个新的工具,或修改一些简历。
这一点之所以至关重要,是因为数据科学并不是一个单一的、定义明确的领域,而且公司通常不会聘请通才的数据科学家,而是偏好雇佣精通某项专业技能的。原因是什么呢?假如你的公司想要聘请一位数据科学家。通常来说,你的脑海中已经有一个很明确的问题需要帮助,而这个问题需要一些具体的技术知识和专业知识。例如,一些公司希望有一套简单的模型能够应用于大型数据集,一些公司则希望有一套复杂的模型来应用于小型数据集,一些公司需要对他们已有的模型进行实时的测试,还有一些公司根本不使用传统的模型。
针对以上不同类型的问题,需要完全不同的技能。所以特别奇怪的是,想要成为数据科学家的求职者收到的建议一般都是:“学习如何使用Python,做一些分类/回归/集群项目,然后开始申请工作。”我们这些已经在这个行业工作的,对此负有很大的责任。在日常对话、博客文章和演讲中,我们倾向于把过多的东西归入“数据科学”范畴。比如,为生产构建一个稳健的数据管道(data pipeline,指构建一个贯穿了公司所有数据的管道,便于获取需要的数据),是一个“数据科学问题”;研究出一个人工神经网络(neural network, 指以人脑和神经系统为模型的计算机系统),这也是一个“数据科学问题”......
这是不好的,因为这些言论往往会导致有抱负的数据科学家失去对特定问题类别的关注,而成为万事通——在一个已经充斥通才的市场中,这可能会让他们更难被注意到或得到突破。但是如果一开始你不知道你最擅长的是哪类常见的问题,你就很难避免成为通才。因此,我将“数据科学”标签下经常混在一起的五个问题类别进行了一个汇总,列在了下文:职责描述:你将管理拥有大量数据的公司的数据管道(data pipelines)。这意味着确保在需要获取数据、清理数据和预处理数据时,数据能够被有效地收集和检索。
为什么重要:如果你只使用过存储在.csv或.txt文件中的相对较小(< 5GB)的数据集,那么可能很难理解为什么会有人专门负责构建和维护数据管道。这里有几个原因:1)一个50GB的数据集不适合你的计算机的运行内存,所以你通常需要其他方法将它输入到你的模型里;2)处理这么多的数据可能会花费大量的时间,而且通常会以冗余的方式存储在多个系统和数据中心里。因此管理这些数据存储需要专门的技术知识。
职位要求:你将使用的技术包括Apache Spark、Hadoop和/或Hive,以及Kafka。你最有可能需要有坚实的SQL基础。
→“我如何构建一个每分钟可以处理10,000个数据请求的数据管道?”→“我怎样才能在不加载所有数据到运行内存的情况下清理数据集?”
职责描述:你的工作是将数据转化为可执行的商业见解。你将经常与技术、商业策略、销售或营销团队的同事共事。数据可视化将成为你日常工作的重要部分。
为什么重要:非常偏技术的人员常常很难理解为什么数据分析师如此重要,但他们确实很重要。因为公司需要有人将经过训练和测试的模型,以及成堆的用户数据转换成可以理解的形式,以便在此基础上做出商业策略。数据分析师能帮助确保数据科学团队不会浪费时间来解决没有商业价值的问题。
职位要求:你将使用的技术包括Python、SQL、Tableau和Excel。你也需要是一个很好的沟通者。
→“我们怎么才能向管理层解释最近用户费用的上涨会让客户流失呢?”职责描述:你的工作将是清理和研究数据集,并做出有商业价值的预测。日常工作将包括训练和优化模型,并经常将这些模型部署到生产中,发挥具有指导性的作用。
为什么重要:当你有一堆数据大到让人无法解析,但其中的数据价值又不容忽视的时候,你就需要从这些数据中找到一些可以被人理解的洞察。这是数据科学家的基本工作——将数据集转换成易于被理解的结论。
职位要求:你将使用的技术包括Python、scikit-learn、panda、SQL,可能还有Flask、Spark和/或TensorFlow/PyTorch。有些数据科学职位纯粹是技术性的,但大多数职位需要你具备一定的商业意识。
→“我们可以建立一个模型来预测哪些产品会卖给哪些用户吗?”
4. 机器学习工程师(Machine learning engineer)职责描述:你的工作将是构建、优化并将机器学习模型部署到生产中。通常,你会将机器学习模型视为API(应用程序接口)或组件,把它们插入到一个完整的应用程序或某种硬件中(机器学习 API 隐藏了创建和部署机器学习模型的复杂性,让开发者能够专注于数据挖掘和用户体验),但是你也可能被要求自己设计模型。
职位要求:你将使用的技术包括Python、Javascript、scikit-learn、TensorFlow/PyTorch(和/或企业深度学习框架)和SQL或MongoDB(通常用于应用程序DBs)。
→“如何将这个Keras模型集成到我们的Javascript应用程序中?”
5. 机器学习研究员 (Machine learning researcher)职责描述:你的工作将是寻找一些新方法,来解决数据科学和深度学习中有挑战性的问题。你将不再使用已有的解决方案,而是生成自己的解决方案。
职位要求:你将使用的技术包括Python、TensorFlow/PyTorch(和/或企业深度学习框架)和SQL。
→“如何提高模型的准确性,使其更接近当前的技术水平?”我在这里列出的五类工作描述绝不是在所有情况下都相互独立的。例如,在初创公司的起步阶段,数据科学家可能必须同时是数据工程师和数据分析师。但大多数工作将会更标准地归入其中一类——公司规模越大,这些类别的划分就会越适用。
总的来说,要记住的是,为了得到工作,你通常最好是建立一套更有针对性的技能——如果你想成为一名数据分析师,不需要学习TensorFlow;如果你想成为一名机器学习研究员,不要优先学习Pyspark。相反,你应该想想你想要帮助公司建立什么样的价值,并做到善于传递这种价值。这才是进入这个行业的最佳途径。同样的,如果你发现自己对于营销数据分析很感兴趣,相信自己日后能够为提高企业营销投资回报率带来价值,有了这样的思考就是一个很不错的开始!那么若要继续专精于此,对这方面的营销知识和分析方法有更全面、具体的学习,能充分了解何种商业情景适用何种分析方法以及如何进行有机结合,从而在之后的求职中让面试官认可你的专业度,向你抛出橄榄枝,就来报名这门由MarTechApe联合美国名企内部营销科技专家用心打磨的《营销分析专项系列课程》吧!现在第三期正在火热进行早鸟优惠中!营销归因模型、营销组合模型、增量模型、A/B测试、随机森林模型,一个专项横扫五大营销分析方法!赶紧来了解一下这套课程的具体信息吧!1. 全面理解营销分析各类前沿方法、应用场景,美国知名公司营销科技专家亲自授课
《营销分析专项系列课》由以下美国名企管理层执教:
- 苹果公司硅谷总部(前Ebay资深数据分析师),营销数据科学家
- 美国最大家具电商平台Wayfair,营销数据科学经理
这门专项系列课由5个模块组成,涵盖了5种应用最广泛的营销和商业分析方法:五大营销分析方法代表了Marketing Analytics领域最前沿的主流方法,是营销分析师/数据分析师为了测量营销效果必须掌握的重要方法和商业分析手段。2. 课程老师与课程大纲
在美国知名企业从业5-10年的营销分析、营销科技专家精心授课,每一位老师与他们教授的课程分别是:
3. 每课备有精心设计的课后作业,及时巩固课程内容
一门课程唯有通过作业才能完全掌握。《营销分析专项系列课程》每周都有老师精心设计的作业,作业类型包括:
精心设计的作业强调了课程重要知识点,在完成作业的过程中,帮助学员巩固对课程的掌握程度。
4. 学员提出的任何问题都能得到助教详细解答,及时解决难点。
5. 沉浸式学习体验,让网络课程更接近线下学习。防止课程囤积,助教督促完课
1). 班主任
来自Google美国的运营分析师会担任班主任,负责为所有学员规划学习进程,布置作业与截止日期。
2). 助教团
助教团的助教老师们会nice地提醒大家交作业,并进行作业答疑。
3). 作业
每周一次作业,将课程所学应用到新的案例中。花费时间15-30分钟。
4). 课程测试
每门课程历时两周(共5门课程)。在每门课程结束后,学员完成该课程的测试。
5). 专项大证书
当所有课程全部完成后,学员进行期末测试,获得70分(满分100分)以上的学员,就可以拿到Marketing Analytics营销分析这个专项的大证书:
6. 如何报名?
*我们提供标准Invoice,可用于企业报销
如果你曾购买过本专项中任意一门课程,请咨询小助手获得购买方式(如果你买的课程不在这五门之列,请勿扰)
小助手
Q & A
1. 如果我已经买过其中的某些课程怎么办?
完全没关系,我们考虑到了有不少用户已经单独购买过专项中的个别课程。但是我们有让你满意的解决方案!事实上,我们鼓励已经买过部分课程的同学来参与这个专项学习,尤其是买了课却还没有完课的同学。我们想让你看到自己认真上完课程后的改变!
请联系小助手购买课程:
2. 请问课程是在手机还是在桌面上观看?
所有学员既可以获得手机课程通道,又可以获得桌面课程通道!
如果你更喜欢在轻便的手机上学习,那当然可以使用手机登陆课程!
如果你身处海外,不满意跨境服务器的加载速度,不用担心,我们有网速无敌的视频平台,可以在桌面直接看视频!
总之,不论是大屏还是小屏,不论你身在世界的哪里,都会爱上我们全新升级的课程体验!
3. 我的公司非常支持员工上课,你们的课可以报销吗?
4. 单独买专项内的课程和买专项有什么区别吗?(当然有啦!)
差别一:从价格上,单独买这些课总价需要¥1399,但现在有早鸟优惠,9/21 - 10/21期间购买立减¥200,仅需¥1199(相当于每门课85折优惠)。10/21以后恢复到原价¥1399.
差别二:课程体验上,单独买课没有作业、证书、学习规划,一切需要靠你自学,而很多同学最后都把课囤着没有上完。但专项系列课配备全套运营服务,升级了课程体验,确保你完成课程!
差别三:单买课程并不能知道各种分析方法之间的联系与区别,不知道在什么场合用什么方法。专项课程里的班级答疑中会帮大家建立联系,并教大家如何把所学与工作、面试相联系。
如果你还有任何疑虑,不妨咨询小助手:
坚持学习,保持职场竞争力,MarTechApe的课堂,期待你的到来!
前往“发现”-“看一看”浏览“朋友在看”