亚马逊智能音箱有千人监听团队:曾听到性侵案

  原标题:隔屏有耳调查|亚马逊智能音箱有千人监听团队,曾听到性侵案

  澎湃新闻记者 承天蒙 综合报道

  遭遇?#26696;?#23631;有耳”质疑的,不止中国流行的手机App,还有国内外近年兴起的智能音箱。最新的一例是亚马逊智能音箱Echo植入的智能语音助手Alexa,被曝有人类人工参与“监听”。

  4月11日,彭博社发布调查报道,揭秘了亚马逊Alexa“监听”团队中,这些一直被隐藏的人类员工的工作内容。报道称,有时候,参与其中的工作人?#34987;?#21548;到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助。还有两名员工甚至称,他们听到过他们认为是性侵案的声音。

  亚马逊此前?#28216;?#20844;开过它会人工听取用户和Alexa的私人聊天,也没有披露过Alexa的语音技术中,部分包括人类参与。7位为该项目工作的员工向彭博社透?#35835;?#20122;马逊Alexa的这项人工声音检查流程。

  亚马逊的Echo是世界上最流行的智能音箱,它于2014年上市;Echo音箱之后,谷歌也推出了植入谷歌语音助手的Google Home智能音箱,?#36824;?/a>随后推出了采用Siri的智能音箱HomePod。在中国,天猫精灵、小度智能音箱、小米AI音箱等设备也纷纷走进了更多用户家庭。

  如今,很多用户已经习惯于通过?#21483;汛式?#38899;箱中的语音助手激活,进而向它提出问题或下达指令,有的智能音箱甚至还能与用户简单地聊两句天。但彭博社的报道提出,智能助手如此“懂你”的背后,可能并不仅仅是人工智能和机器学习,而是有人类员工团队人工听取用户与设备的对话录音,并帮忙改进算法的结果。

Google Home智能音箱Google Home智能音箱

  亚马逊千人监听团队

  彭博社报道介绍,亚马逊在全球有数千名工作人员,他们人工听取和检查用户和智能语音助手Alexa的私人对话,目的是帮助Alexa改进语音识别技术。

Echo音箱Echo音箱

  该团队专门收听用户在家中和办公室里被Echo音箱抓取的录音。这些录音会被转录、加上注释,然后反馈到软件中,以消除Alexa对理解人类语言的差距,帮助它更好地响应指令。

  亚马逊在广告词中介绍,“Alexa生活在云端,并且一直越来越聪明?#20445;导?#19978;,和许多需要从经验中学习的软件工具一样,人类也为机器做了不少教学。

  执行这?#36824;?#20316;的团队包括全职亚马逊员工和合约工,工作地点遍布世界不同地区,包括波士顿、哥斯达黎加、印?#21462;?#32599;马尼亚。员工签署了保密协议禁止公开谈论这一项目。

  罗马尼亚首都?#25216;?#21202;斯特的两位员工透露,他们一天工作9小时,每班解析多达1000条音频片段。

  波士顿的一名员工则表示,他为特定的话语,如Taylor Swift,挖掘了累积的语音数据,并对其进行了注释,以表明这个搜索?#20405;改?#20301;歌手。

  私人声音片?#25105;不?#34987;抓取

  智能音箱需要时刻开启麦克风,以监听用户是否说出了?#21483;?#35789;、是否在向?#32422;合旅?#20196;。亚马逊语音助手Alexa的软件就被设计为?#20013;?#35760;录音频片段,聆听?#21483;?#35789;。默认的?#21483;?#35789;即为“Alexa”。

  目前的工作流程下,私人的声音片?#25105;不?#34987;设备抓取。

  有时候,工作人?#34987;?#21548;到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助。工作人员利用内部聊天室共享文件,解析含糊的单词,或者是分享搞笑的录音。

  有时员工还会听到不安甚至有可能是犯罪的录音。两名员工称,他们听到过他们认为是性侵案的声音,当这?#36136;?#24773;发生时,他们会在内部聊天室说出来解压。

  亚马逊对此表示,员工听到令人痛苦的事情时,他们有标准流程处理。但是这两位罗马尼亚员工表示,他们要求对这类案件进行处理时,?#36824;?#21496;告知干预此类?#24405;?#19981;是亚马逊的工作。

  “我们认真对待用户的个人信息和隐私安全。”亚马逊发言人在一份电子邮件声明中称,“我?#20405;?#20250;注?#22270;?#23567;一部分的Alexa录音样本,为了改善用户体验。如帮助我们训练语音识别和自然语言理解系统的信息,这样Alexa可以更好地理解用户要求,并保证对每个人都能提供好的服务。”

  “我们有?#32454;?#30340;技术和操作保障,对滥用我们系统的行为采取零容忍政策。员工在工作流程中无法直接访问能辨别用户和账号的信息。我们使用多重验证来限制访问,对服务?#29992;埽?#23457;计我们的工作环境,以对所有信息高度保密。”

  语焉不详的隐私政策

  亚马逊在其宣传和隐私政策的材料中,没有明确表明Alexa获取的一些对话录音是人工来听,只是在常见问题解答列表中提到了一句“我们使用您对Alexa的命令来训练我们的语音识别和自然语言理解系统”。

  Alexa的隐私设置中,公司给用户提供了禁用录音开发新功能的选项。彭博社看到的截图显示,发?#36879;?#24037;作人员的Alexa录音没有提供用户的全名和地址,但与用户的账户号、名称和设备序列号相关联。

  依赖人类员工填补算法空白的,还有谷歌、Siri

  亚马逊圆柱形的智能音箱Echo于2014年上市后,很快就因其可以在家中使用智能语音软件快速流行开来。不久之后,谷歌母公司Alphabet推出了?#32422;?#30340;版本Google Home,随后是?#36824;?#20844;司的HomePod,在中国也有很多?#25918;?#30340;智能音箱产品。

  据研究机构Canalys的报告,2018年,全球消费者购买了7800万台智能音箱,其中数百万台通过语音软件与智能手机上的智能助手进行交互。

  大多数?#25191;?#35821;音识别系统依赖于模仿人脑的神经网络,软件会通过海量数据进行机器学习,为Echo等其他智能音箱的算法提供可能性的模型。如果用户问Alexa附近有没有名?#23567;?#24076;腊某某”的地方,算法会自动知道用户在寻找希?#23433;?#21381;,而不是教?#27809;?#31038;区中心。

  但Alexa也经常犯错,尤其是俚语、口语、方言和非英语的语言。因此亚马逊需要雇佣人类员工,帮助填补算法的空白。

  除了亚马逊之外,?#23548;?#19978;,其他?#25918;?#30340;语音助手也都是在人类的帮助下训练出来的。

  ?#36824;?#30340;Siri也有人类员工的帮助,他们负责评估语音助手对请求的解释是否与用户说的相符。根据?#36824;?#23433;全白皮书,员工检查的Siri录音是没有个人身份信息的,录音会与一个随机标识符关联,存储六个月,之后这些数据就会被移除随机标识符,但它们也有可能存储更长时间以改善Siri的语音识别。

  在谷歌,一些人类员工?#37096;?#20197;获取谷歌助手的音频片段帮助训练和改善产品,这些音频也没有个人身份信息,并且经过音频失真处理。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

?#36824;?#27719;

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 ?#36824;?#27719; 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

?#36824;?#27719;

?#36824;?#27719;为你带来最新鲜的?#36824;?#20135;品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片