亚马逊的Alexa收集的数据比任何其他智能助手都多( 二 )


众所周知,谷歌在您说出“唤醒词”后会记录您与Google智能助理的对话 。但你可能不知道的是,谷歌使用承包商来手动审查少数这些录音,大约0.2% 。
VRT NWS发布了一份报告,详细说明了如何收听由Google工作的举报人泄露的数千条录音 。至少有一个音频片段包含一对夫妇的地址和有关其家庭的个人信息 。
虽然录制内容与用户帐户无关,但人们通常会共享个人信息,例如可以透露其身份的姓名和地址 。虽然谷歌在用户说“嘿,谷歌”或“好的,谷歌”之类的短语之前不会进行录制,但这些设备有时会误听其他单词或短语并录制他们不打算收听的对话 。其中一些谈话最终被公司雇用的“语言专家”转录 。
4月,彭博社发布调查报道,揭秘了亚马逊Alexa“监听”团队中,这些一直被隐藏的人类员工的工作内容 。报道称,有时候,参与其中的工作人员会听到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助 。还有两名员工甚至称,他们听到过他们认为是性侵案的声音 。
亚马逊此前从未公开过它会人工听取用户和Alexa的私人聊天,也没有披露过Alexa的语音技术中,部分包括人类参与 。7位为该项目工作的员工向彭博社透露了亚马逊Alexa的这项人工声音检查流程 。
亚马逊的Echo是世界上最流行的智能音箱,它于2014年上市;Echo音箱之后,谷歌也推出了植入谷歌语音助手的Google Home智能音箱,苹果随后推出了采用Siri的智能音箱HomePod 。在中国,天猫精灵、小度智能音箱、小米AI音箱等设备也纷纷走进了更多用户家庭 。
如今,很多用户已经习惯于通过唤醒词将音箱中的语音助手激活,进而向它提出问题或下达指令,有的智能音箱甚至还能与用户简单地聊两句天 。但彭博社的报道提出,智能助手如此“懂你”的背后,可能并不仅仅是人工智能和机器学习,而是有人类员工团队人工听取用户与设备的对话录音,并帮忙改进算法的结果 。
亚马逊千人监听团队
彭博社报道介绍,亚马逊在全球有数千名工作人员,他们人工听取和检查用户和智能语音助手Alexa的私人对话,目的是帮助Alexa改进语音识别技术 。
该团队专门收听用户在家中和办公室里被Echo音箱抓取的录音 。这些录音会被转录、加上注释,然后反馈到软件中,以消除Alexa对理解人类语言的差距,帮助它更好地响应指令 。
亚马逊在广告词中介绍,“Alexa生活在云端,并且一直越来越聪明”,实际上,和许多需要从经验中学习的软件工具一样,人类也为机器做了不少教学 。
执行这一工作的团队包括全职亚马逊员工和合约工,工作地点遍布世界不同地区,包括波士顿、哥斯达黎加、印度、罗马尼亚 。员工签署了保密协议禁止公开谈论这一项目 。
罗马尼亚首都布加勒斯特的两位员工透露,他们一天工作9小时,每班解析多达1000条音频片段 。
波士顿的一名员工则表示,他为特定的话语,如Taylor Swift,挖掘了累积的语音数据,并对其进行了注释,以表明这个搜索是指那位歌手 。
私人声音片段也会被抓取
智能音箱需要时刻开启麦克风,以监听用户是否说出了唤醒词、是否在向自己下命令 。亚马逊语音助手Alexa的软件就被设计为持续记录音频片段,聆听唤醒词 。默认的唤醒词即为“Alexa” 。
目前的工作流程下,私人的声音片段也会被设备抓取 。
有时候,工作人员会听到用户私人的声音片段,如一个女人洗澡时严重走调的歌声,或者一个孩子尖叫着寻求帮助 。工作人员利用内部聊天室共享文件,解析含糊的单词,或者是分享 搞笑 的录音 。

推荐阅读