MarTechApe

View Original

Spotify如何准确预测你想听哪首歌?

Spotify是在音乐流媒体领域里把客制化做到最极致的企业之一。它创建了一组算法,用于管理从个人音乐主页到精选播放列表例如《每周精选》中的所有内容。除此之外,Spotify还在持续试验新的方法去更好地了解每一首音乐,以及人们为什么偏好某一首歌或某一种风格。

市面上的流媒体应用琳琅满目,五花八门。Spotify是如何在众多竞争对手中脱颖而出的呢?

Apple Music,Amazon Prime Music和Google Music之类的竞争对手依赖于付费会员并依靠社交关系来创建播放列表,而Spotify的主要区别在于向客户提供更高级别的音乐定制化服务以及与音乐相关的知识普及。

今天我们就来一文看懂Spotify如何把“定制化”用到极致。

1. Spotify的算法系统——BaRT

Spotify App是靠算法来把控用户的聆听体验的。其中一大例子就是它的主页。主页的使命就是快速帮助用户找到他们喜欢听的内容

主页由被称为BaRT (全称“Bandits for Recommendations as Treatments”)的AI系统控制。这个系统的任务是为每个用户以个性化的方式构建主页。其中的“音乐架”中包括不同主题的播放列表,例如《最佳歌手》或者《气氛音乐》,之后该AI系统会让这些歌单出现在对应主题的“音乐架”上。

BaRT系统的核心目的是根据用户之前的收听内容,为用户提供Spotify相信的用户会喜欢的音乐。但是Spotify同时还必须在其中融入全新的风格,这样用户才不会一直陷入听同一类型歌曲的循环中。

2. 如何为用户推荐喜欢的音乐的同时,还推荐新的音乐?

BaRT系统的运用可以归结为两个概念:挖掘探索

当Spotify进行“挖掘”时,它利用的是收集到的用户信息,它会考虑用户的音乐收听历史记录,跳过的歌曲,创建的播放列表,在平台社交功能上的活动,甚至用户的位置。

但是当Spotify进行“探索”时,它会利用除该用户以外的所有信息,比如符合你的音乐品味但你还没听过的播放列表和音乐人,以及其他音乐人的热度等。

与Spotify的挖掘和探索能力一样重要的是该应用程序如何向用户解释它的推送选择。音乐架上的每个标签,像“跳转回这里”或“更多你喜欢的内容”,都在告诉用户这些播放列表被推荐的原因。根据2018年关于BaRT的研究论文,Spotify发现解释对于获得用户的信任是至关重要的

3. 三十秒定成败

BaRT的成功与否是通过用户是否收听了“音乐架”上的音乐,以及收听了多久来衡量的。如果一首歌被播放超过30秒,算法就会追踪这一过程把这次推荐记为正确。你收听推荐的播放列表或歌曲集的时间越长,系统的推荐效果就被认为越好。

Spotify将判断一个人是否喜欢一首歌的舒适点定在了30秒。在2015年新闻媒体Quartz的一次采访中,Spotify的产品总监Matthew Ogle提到在30秒之前跳过歌曲,就等于对“每周发现”播放列表的否定。该公司在研究中明确指出,只有通过追踪和记录用户在程序中的每个操作,所有这些算法服务才有可能获得成功。

“本周推荐“ 是一个30首歌曲的组合,这些歌曲是听起来与你喜欢的音乐非常相似的歌曲,或者来自其他与你音乐偏好相似的人的播放列表,以及音乐博客的最新报道。

2014年,Spotify公司斥资1亿美元收购了Echo Nest为了提升自己的推荐系统。作为Echo Nest的联合创始人Brian Whitma 在2012年写道,他的推荐服务每天搜索超过1000万个与音乐相关的网页,以了解音乐世界发生了什么。“任何人在互联网上说的关于音乐的每一个词,都会经过我们的系统,寻找描述性词汇、名词短语和其他文本。”Brian Whitma如是说。

4. 新歌手的音乐怎么推荐?——“冷启动”

Spotify是一个线上音乐的流媒体服务平台,每天都有很多新音乐被上传到Spotify的平台。但是传统的推荐系统对这些新音乐并不是“很友好”

如果不是流行的艺术家,就没有系统会推荐这些音乐。协同过滤方法,也就是通过有着相似音乐兴趣的人点过赞的音乐来进行推荐的方法,在最开始对那些根本没有人认识、无人问津的某位新生代的作品来说根本是行不通的

Sportify把新人音乐的推荐称为“冷启动问题”。这个问题的解决方案是分析音频本身,并训练一种算法来学习识别音乐中可能被人喜欢的不同特点。比如它能够识别非常具体的音色比如“扭曲的吉他声”,也能识别更抽象的概念,比如流派。

这个系统是现在”每周精选“播放列表的一个重要元素,这就是为什么你可能会被推荐一个从未听说过的艺术家的作品。

5. 产品改进的不断尝试

但是算法可以被塞进Spotify上的各种地方。即使你知道你的主页面和“每周精选”播放列表是由推荐算法构成的,但你可能不会意识到有一些你使用过的小工具也是先进的AI研究产品。

例如,播放列表自动延续功能。这个功能会通过分析某个播放列表中的歌曲来尝试预测下一个该被播放的音乐,就好像创建它的人在一直添加音乐一样。Spotify希望有新的方式来改善和构建这个功能,因此它发布了一个“百万播放列表数据集”,其中包含用户自己生成的Spotify播放列表,可以用来了解人类认为的一组好的曲目的特点。公司邀请了其他AI研究人员来帮助他们解决问题,并在2018年的行业峰会上展示了解决方案。

还有一个例子关于Spotify如何通过识别歌曲的封面图来找到你真正想听的歌曲版本而不是原始音乐。它的算法最终能够非常准确的通过歌曲的封面图,来判断一首曲目的不同版本,例如器乐演奏版和现场表演版。但爵士乐被证明是更加难以分辨的,因为爵士乐通常有会有更多的即兴表演。

Spotify团队的另一个研究方向是将歌词与歌曲演唱进行同步,这不仅有助于用户可以查看歌词的功能,还为Spotify开辟了新的机会。Spotify计算机科学家今年早些时候写道:“与音乐同步的歌词技术可以通过实现卡拉OK、文本歌曲检索和歌曲内部导航等应用程序来丰富音乐收听体验。”

6. 地域和年龄如何影响一个人的音乐品味?

除了通过算法对产品进行不断改进来提升用户体验,Spotify还在不遗余力地对其用户进行分析。2019年4月发表的一项研究称该公司分析了1600多万用户的数据,跟踪他们从2016年12月到2018年2月的收听模式。这些研究包括某人每天播放特定艺术家或歌曲的次数以及他们所处的地区。

这些数据,再加上用户人口学方面的数据性别和年龄,使得Spotify可以研究一个人进入人生不同阶段后,音乐品味是否会发生变化,以及年龄如何影响一个人听的音乐种类。

该团队还机智地利用了位置数据的跨州移动现象。根据位置数据,如果用户在特定的时间——2016年圣诞节、2017年感恩节和2017年圣诞节,也就是三个重要节日中的两个期间移动到另一个州,那么Spotify会猜测这是他们的家乡所在州。

Spotify团队通过研究每个州的人们的音乐品味,再对比那些改变音乐方向的群体,得出结论:在较长的时间范围内,地点确实以某种微妙的方式影响了音乐品味。

“搬家似乎确实会使个人的音乐口味略微向新环境的口味转变。然而,这种影响很微小,听众还是往往更像他们的过去而不是现在的环境。”

通过对年龄的研究,他们还提出,用户在10到20岁听的音乐也会是未来他们主要会听的音乐,他们已经塑造了自己的的“音乐身份”

这一切都表明,Spotify拥有大量的用户数据,并需要继续收集它们以保持自己的竞争优势。2015年的“本周推荐“播放列表的简报上提及了Spotify每天会记录1万亿字节的用户数据。

然而,这些数据显然是为客户服务的。该公司在研究中明确表示,所有这些算法服务的成功都是因为你在Spotify上的每一个操作都会被跟踪和记录。

Spotify在与包括拥有千万付费客户的音乐巨擘苹果在内的所有科技巨头抗争的同时依然成功地蓬勃发展起来。想必这就是音乐流媒体Spotify成功的秘密武器。

如果你也想学习数据科学方法如何被应用在美国一线互联网科技公司,诸如Apple、Walmart、Airbnb等公司,并系统化掌握各类应用场景下的数据科学解决方法,那么千万不要错过MarTechApe携手来自Apple、Walmart、Airbnb、Verizon、Wayfair等知名公司的资深职场人开设的《营销分析专项》课

《营销分析专项系列课》由MarTechApe联合美国的一线营销分析和营销技术专家们共同研发推出,由以下美国名企管理层执教:

  • 知名独角兽公司Airbnb硅谷总部,营销科技经理

  • 苹果公司硅谷总部(前Ebay资深数据分析师),营销数据科学家

  • 美国最大家具电商平台Wayfair,营销数据科学经理

  • 美国电信巨头Verizon,营销效果经理

  • 沃尔玛Walmart电商(前GroupM营销分析经理),数据科学经理

这门专项系列课由5个模块组成,涵盖了5种应用最广泛的营销和商业分析方法:

课程大纲

每课备有精心设计的课后作业和练习,及时巩固课程内容

一门课程唯有通过作业才能完全掌握。《营销分析专项系列课程》每周都有老师精心设计的作业和练习,类型包括:

  • 案例分析题

  • 编程题

  • 简答题

  • 思考题

精心设计的作业练习强调了课程重要知识点,在完成作业和练习的过程中,帮助学员巩固对课程的掌握程度。

沉浸式学习体验,让网络课程更接近线下学习。防止课程囤积,助教督促完课

1). 班主任

负责为所有学员规划学习进程,布置作业与截止日期。

2). 助教团

助教团的助教老师们会nice地提醒大家课程进度,并进行线上答疑。

3). 作业和练习

每周一次作业,将课程所学进行巩固。花费时间15-30分钟。课件中附有数据和课外阅读供学员练习和扩展知识。

4). 专项大证书

当所有课程全部完成后,学员进行期末测试,获得70分(满分100分)以上的学员,就可以拿到Marketing Analytics营销分析这个专项的大证书:

如何报名?

原价:¥1540

疫情期85折优惠,仅需¥1299!

*我们提供标准Invoice,可用于企业报销

手机通道(人民币支付)

网站通道(美元支付)

See this product in the original post

如果你曾购买过本专项中任意一门课程,请咨询小助手获得购买方式(如果你买的课程不在这五门之列,请勿扰)

小助手

如果希望以其它方式购课(如支付宝)请联系小助手

何时开班

课程一经订阅,即可解锁所有课程相关视频,可自行调节学习进度。

课程班级群答疑与作业开始时间:2020年6月20日

还等什么,快来报名课程吧!