文科生如何让数据分析成为你的铠甲而非软肋?

文科生如何让数据分析成为你的铠甲而非软肋?
MarTechApe MarTechCareer


文科生,见理科丧胆者,何以让数据分析成为自己的盔甲?

我们先不说文理之分在现在这个时代是否还合理,但大家首先应该拥抱一个信念——数据分析是一种思维方式,不分文理。


 只要你的工作涉及“说服”,

 你就需要数据分析 


“说服”是一项所有人都需要的能力,文科生们,不论你们未来要做什么工作,你都会发现,你离不开“说服”。


影响你的用户买你的产品,是种说服。影响你的老板采纳你的建议,是种说服。影响你的爸妈让你出国留学也是种说服。说服在现在这个社会变得越来越难,没有数据分析,你的论点总是带着一点“一厢情愿”。所以,有力的说服必须包含证据和逻辑。


以前营销部门拿预算,画大饼就行。现在营销部门拿预算,必须出示ROI。要有事实的支撑,而非只是浪漫的刻画。没有数据支撑,你的“说服”没有可信度。


很多公司都有Ad Sales这个职能,其工作内容就是说服广告主在你自己的平台上打广告。你可能是电视行业的某个频道,你可能是提供内容的某个网站。而广告主为什么要在千万个频道或网站里选择你?这时候,你就需要提供数据来证明,你的平台有大量广告主想要找的用户人群。


求职时,动不动就给你一个数据集,让你挖掘洞察,提建议做决策。你如何顺藤摸瓜找到影响用户活跃度下降的因素?找到网站流量突增的因素?找到流量虽大了可是销量缺降低了的因素?


Telling a compelling story with data——这就是“说服”过程里,最重要的技能。


不是只有在职业转型到数据行业时才需要学数据分析。

事实上,

任何人都应该培养自己的数据思维,

以及用科学方法论来看待世界的习惯 


人天生有很多认知偏差。比如,“幸存者偏差”——每当有人告诉你,“现在留学生在美国找不到工作,还是回国吧”的时候,你有没有想过,在美国已经找到工作的人是不会和你说“在美国很容易就能找到工作”的,他们没有说,所以你没有收集到这部分人的“积极”数据,但他们的确找到工作了啊。由于找不到工作的人更容易发射出“找工作太难了”这种信号,所以你自然很容易就收集到了这些“消极”数据。


如果没有这一层理性批判,你可能就会产生“努力了也无法在美国找到工作”的非理性信念。


再举一个例子,“这几周,美国股市大跌。由于最近中美之间爆发了贸易战争,因而美国股市大跌一定是因为中美贸易战”。


这个论点看起来没有什么问题,但你有没有听说过“统计回归效应”


统计回归效应,也叫“向平均数回归”,是指在进行重复测量时,前测中获得的极高或极低分数会在后测时倾向于向平均值偏移,即随着时间的推移高分者成绩下降,低分者成绩升高,这种自然倾向被称为“统计回归效应”。

美股此前长势实在太好,处于一个高值,最近回归到了平均水平,所以显得下降了很多。而这份下降,即使没有中美贸易战,也可能会发生,这就是回归效应。所以贸易战和美股下跌这两件事,只能确定相关,但很难确定因果。


生活的决策往往缺乏数据支撑,直觉选择较多,所以要善用批判性思维和科学的方法论来弥补你的认知漏洞。工作的时候,你也许有机会接触大量的数据,但如何从数据里挑选能支持你论点的证据、如何从不同角度来看数据的全貌,就取决于你的数据思维与分析素养了。


 那该如何培养自己的数据思维呢?


要想培养数据思维,你需要给自己寻找频繁处理大量数据的机会,注意学习数据分析的步骤,积累从数据中提取洞察的经历和方法论。这个过程中,你需要掌握一门数据分析语言。


这里有两个注意事项:


第一,在选择数据分析的语言时,确保这是一门可以做统计分析的语言,比如R语言,是由统计学家开发的语言,且由于开源免费的属性,绝大多数公司都使用R语言进行数据分析。为什么要学一门能够做统计分析的语言?因为数据思维的本质就是统计思维。


第二,在选择课程时,确保这是一门有应用场景、案例分析的课程,因为唯有这样,你才能容易讲课堂知识迁移到实际工作场景。


基于这些因素,我们推荐——由世界银行顾问和尼尔森数据分析师一起开设的R语言课程,这门课程包括了基础入门、数据处理、统计分析这三大独立板块。接着就让我们看看这门课程的特别之处吧!


1. 交互式学习:高效学习,紧跟节奏 

不少同学应该经历过这样的上课经历:对于编程类、实操类课程,直播时一台电脑、一本笔记本,一会儿要看老师的屏幕操作,一会儿又要在自己屏幕上操作,手忙脚乱,跟不上节奏。但是我们的R课程,前所未有地使用了交互式学习平台:在上课时,所有同学可以进入交互学习平台,所有的课堂重点和讲义内容已经一一呈现在平台上,学生只需一边听课,一边操作,通过浸入式学习就能够达到最好的学习效果。


MarTechApe交互学习平台:


2. 基础、数据、模型:3个独立课程,60多个知识点与应用场景 

  • R 基础入门:如果你从未在工作环境使用过R,或者只是学过一些皮毛,但经年累月也忘记的差不多了,那我们建议你从R Basics学起。在R Basics这门课里,老师会注重帮你打好R的基础,详细讲解R的所有常用功能。上完课后,你可以轻松用R做一些基本的分析与绘图、基本的数据处理。

  • R 数据处理数据分析,现有数据,再有分析。所以认识数据是数据分析的重要前提。在这一部分,你可以学到如何用dplyr Package来玩转数据操纵与清洗,如何用apply()family实现对数据的循环、分组、过滤、类型控制等操作。从此以后可以告别在Excel里费时地清洗数据,而使用R来轻松解决问题了!

  • R for Statistical Modeling第三门课程就是学习如何在R中建立模型、进行统计分析。在这门课程中,不仅会学习如何用R语言实现不同的模型,还会学到海量的统计知识:Linear Regression,Logistic Regression,Cluster Analysis,K-mean,Hierachical Clustering等等应用广泛的分析方法。此外,还将用产品数据、用户数据、营销数据来在R中完成一个完整的案例分析。


课程大纲:


模块 

01

R Basics

  1. Software installation    

  2. R Studio Interface    

  3. Data type    

  4. Vector    

  5. List    

  6. Matrix    

  7. Data Frame    

  8. Factors    

  9. Data Transformation    

  10. Element Access    

  11. File Management    

  12. Base Ploting system    

  13. Scatter plots    

  14. Bar plots    

  15. Histogram    

  16. Pie charts    

  17. Write functions    

  18. For loop    

  19. Apply family  

模块 

02

R for Data Cleaning & Manipulation

  1. Data Probing    

  2. Tricks Dealing with R    

  3. Data Import & Export (Extremely Big Datasets) 

  4. Data Inspection    

  5. dplyr Package    

  6. select    

  7. filter   

  8. arrange    

  9. mutate    

  10. summarise    

  11. distinct    

  12. %>%    

  13. join    

  14. apply() Family    

  15. lapply function    

  16. sapply function    

  17. mapply function    

  18. data.table Package    

  19. setnames    

  20. setDT    

  21. reshape2 Package    

  22. melt function    

  23. dcast function    

  24. Deal with NAs and Outliers    

模块 

03

R for Statistical Modeling


  1. ggplot2    

  2. concepts of ggplot2    

  3. ggplot2 syntax    

  4. Aesthetics    

  5. geometrics    

  6. geom statistics    

  7. facets    

  8. colors    

  9. case study  

  10. Regression    

  11. Linear model    

  12. Logistic model    

  13. Modeling philosophy    

  14. Key concepts    

  15. Results interpretation    

  16. Significance    

  17. P value, standard errors    

  18. Model assessment    

  19. Case study    

  20. Cluster Analysis    

  21. K-mean    

  22. Hierachical Clustering    

  23. Model-based clustering    

  24. Density-based clustering    


3. 授课老师有着深厚的R语言功力以及丰富的行业应用经验 

R课程有两位经验丰富的老师:

    Chris老师, PhD

  • 世界银行顾问

  • 国际粮食与政策研究所助理研究员

  • 美国全国经济研究所研究助理

  • 5年R经验

    Jason老师

  • 现Nielsen数据分析师

  • 前Kantar Media数据分析师



三门课程的时间安排:

R的三门独立课程(Basics、Data、Modeling)在11月和12月都各有一期直播。11月与12月的内容完全一样。可以选择你合适的时间上课。

没有时间参与直播的同学,可以购买录播课。录播与直播价格一致。

R

R Basics

R for Data

R for Modeling

11月

11月16日

8PM - 11PM

(美东时间)

11月17日

8PM - 11PM

(美东时间)

11月18日

8PM - 11PM

(美东时间)

12月

12月7日

8PM - 11PM

(美东时间)

12月8日

8PM - 11PM

(美东时间)

12月9日

8PM - 11PM

(美东时间)




三门课程的价格:


R

R Basics

R for Data

R for Modeling

三门一起

直播

附送录播

$69美元/人

$149美元/人

$149美元/人

$299美元/人

无法参与直播,只需录播回放视频

$69美元/人

$149美元/人

$149美元/人

$299美元/人

我找朋友一起双人团购

NA

$119美元/人

$119美元/人

$239美元/人




还等什么,赶紧邀请好朋友一起来团购吧!

报名请添加小助手为好友,回复“R”:





聪明的你千万不要错过以下免费/优惠活动


△Amazon BI免费直播,戳我报名!


双十一优惠正在进行中,戳我领取优惠!



关于MarTechApe

MarTechApe是一个来自纽约、专注MarTech领域的知识分享|技能学习|求职服务的终身学习平台。我们提供最专业的Marketing Technology课程。