“10年照片挑战”是Facebook用来训练人脸识别AI的!?
从昨天开始,不管是Facebook、Instagram、微信还是Twitter,都爆发了网友狂晒自己10年前和现在的今昔对比照。原来这是Facebook的“10 Year Callenge”——10年挑战。如果你去Instagram上搜这个hashtag,你会发现已经有3百万人在Ins上参与了:
牛逼的Caitlyn Jenner(原名Bruce Jenner,卡戴珊家族成员)还直接晒出了自己变性前后的10年对比。网友不得不承认:Caitlyn Jenner wins the 10 year challenge!
还有网友对大量的10年今夕对比图作出了深刻总结:This is basically what happened...
小编摸摸自己身上的肥肉,只能说that's so true..
娱乐之余,也有人开始警觉——这个“10年挑战”真的只是一场人畜无害的晒图游戏吗?
你知不知道这些照片可以被Facebook用来训练“人脸年龄识别”?
有人说,“你多虑啦!这些照片本来就已经在我的相册里了。Facebook早就有了我所有的头像照片。”
的确,很多人的头像相册里都有自己以前的照片,而且不少人就是拿自己头像相册里10年前的照片来做这个10年挑战的。这些照片都是公开的,Facebook早就可以获取这些照片。
但是,让我们仔细想想,如果你要训练一个人脸识别算法来完成年龄特征识别任务(比如,一个人老了之后会长什么样?),你会怎么做?你需要大量的、各种各样的人的年轻时和老一些时候拍的照片。如果你能够知道“年轻”和“老一些”之间具体间隔的时间(比如10年),那就再理想不过了。
当然,你完全可以对Facebook的头像照片做数据挖掘,查询照片发布日期或者EXIF数据。但是这样做可能会带来很多干扰因素。
比如,人们不一定是按照时间顺序来发布照片的(可能今天发布的照片是去年拍的;可能同一个头像被用了很多年),而且也不是每个人都拿自己的照片作为头像。你只要稍微看看你Facebook好友的头像照片一定不难发现,有的头像是狗,有的是风景,有的是卡通,还有人喜欢拿一片空白做头像的我也不是很懂为什么。
换句话说,如果你有一组干净的、简单的、最好是标注好年份的今昔对比图,那完成这个人脸识别的任务就轻松多啦!
在晒10年对比照时,大多数人还不辞辛劳地给照片加了很多背景信息,比如“2008的我与2018的我”,“2009我在xx学校度过我的高中岁月,2019我在xx城市和我的男友某某度假”。
也就是说,多亏了这个晒照活动,现在有了大把的制作精良的10年今夕对比照片,成为了实验者可以直接拿走的数据。
当然了,这么多网友晒的照片里,也有很多垃圾数据,不过数据科学家们知道如何应付这些。你可以给比较早期的数据以更高的权重,因为在活动刚爆发的时候,大多数人还是非常认真地在晒自己的今昔对比图的。但现在已经有很多人在纯粹发图恶搞了,比如这张:
对于这些没有价值的照片,图片识别算法足以筛选出真正人脸的照片,然后把垃圾数据扔掉。
Facebook否认“谋划”了这场#10YearChallenge活动。一位Facebook的发言人说,“这只是一场用户自发的晒图活动,Facebook并没有发起这项运动,而且大家用的是Facebook上已经有的照片,Facebook无法从这些照片里获得任何东西。同时提醒用户,你可以随时关闭脸部识别功能。”
但即使这不是一场社交工程(在计算机科学中,社交工程指的是通过与他人的合法地交流,来使其心理受到影响,做出某些动作或者是透露一些机密信息的方式。这通常被认为是一种欺诈他人以收集信息、行骗和入侵计算机系统的行为。在英美普通法系中,这一行为一般是被认作侵犯隐私权的。),但过去几年里,大量的社交游戏和表情包就是被设计出来为了收集数据的。想想Facebook曾经泄露了8千万美国用户数据,就让人不禁毛骨悚然。
让人用你的Facebook照片来训练脸部识别算法真的是一件不好的事情吗?也未必。而且从某种程度说,这是无法避免的。但是,这篇文章主要就是想提醒大家,我们要对我们自己的隐私和数据有保护的意识,并且有科技的常识,能判断这些数据可以被别人如何利用。
我来说说三种人脸识别的应用案例:一个值得尊敬,一个很普通,还有一个很危险。
第一个案例(值得尊敬):人脸识别技术,尤其是年龄进展(age progression)技术,可以帮我们找到失踪儿童。去年,新德里的警察报告,用人脸识别技术仅在4天内就追踪到了近3000个失踪儿童。如果有些儿童已经失踪了好几年,那他们可能就和已有的照片长得不太一样了。但有了年龄进展技术,警察就可以找到那些容貌已经有所改变的失踪儿童。所以,可靠的年龄进展识别技术可以拯救很多心碎的家庭。
第二个案例(普通):年龄识别技术还可以为定向广告服务。在展示广告里安装摄像机或者感应器,就可以根据观看者的年龄特征来更改展示的广告内容。这个应用场景并非如此激动人心,但可以让广告变得更加个性化。
第三个案例(危险):在亚马逊于2016年推出人脸识别服务后,他们开始向法律机构、政府部门(比如奥兰多和华盛顿的警察局)兜售这项服务。但是科技引发了大家的隐私担忧,因为警察不只是用人脸识别来追踪可疑的犯罪分子,还用这个技术来追踪没有犯罪的人,比如抗议者和那些被警察认为不“安分”的人们。
美国公民自由联盟(The American Civil Liverties Union)要求亚马逊停止兜售这项服务。甚至一些亚马逊的股东和员工也为了公司的价值观和声誉而提出抗议。
科技一直都在影响人性。但我们有选择的权利来让科技变得更好。
所以,晒个十年对比照是件大事吗?难道我晒了照片真的会有不好的事发生吗?难道用网友的照片来训练人脸年龄识别算法很危险吗?
未必是,未必不是。
不管这场大型晒图活动的起源和背后的意图是什么,我们必须更“聪明”地对待自己创造和分享的数据。
对于大多数现今的科技来说,人类是最丰富的数据源。我们的数据被企业用来连接物理世界与数字世界,我们的数据是企业提高盈利的燃料。所以我们完全有权利要求企业尊重我们的个人数据,并全力以赴地保护它。
这应该成为我们的常识。
原文链接:https://www.wired.com/story/facebook-10-year-meme-challenge/?from=timeline&isappinstalled=0
翻译:MarTechCareer
-推荐阅读-
关于MarTechApe
MarTechApe是一个来自纽约、专注MarTech领域的知识分享|技能学习|求职服务的终身学习平台。我们提供最专业的Marketing Technology课程。