- +1
隔屏有耳調(diào)查|亞馬遜智能音箱有千人監(jiān)聽團(tuán)隊(duì),曾聽到性侵案
遭遇“隔屏有耳”質(zhì)疑的,不止中國流行的手機(jī)App,還有國內(nèi)外近年興起的智能音箱。最新的一例是亞馬遜智能音箱Echo植入的智能語音助手Alexa,被曝有人類人工參與“監(jiān)聽”。
4月11日,彭博社發(fā)布調(diào)查報(bào)道,揭秘了亞馬遜Alexa“監(jiān)聽”團(tuán)隊(duì)中,這些一直被隱藏的人類員工的工作內(nèi)容。報(bào)道稱,有時(shí)候,參與其中的工作人員會(huì)聽到用戶私人的聲音片段,如一個(gè)女人洗澡時(shí)嚴(yán)重走調(diào)的歌聲,或者一個(gè)孩子尖叫著尋求幫助。還有兩名員工甚至稱,他們聽到過他們認(rèn)為是性侵案的聲音。
亞馬遜此前從未公開過它會(huì)人工聽取用戶和Alexa的私人聊天,也沒有披露過Alexa的語音技術(shù)中,部分包括人類參與。7位為該項(xiàng)目工作的員工向彭博社透露了亞馬遜Alexa的這項(xiàng)人工聲音檢查流程。
亞馬遜的Echo是世界上最流行的智能音箱,它于2014年上市;Echo音箱之后,谷歌也推出了植入谷歌語音助手的Google Home智能音箱,蘋果隨后推出了采用Siri的智能音箱HomePod。在中國,天貓精靈、小度智能音箱、小米AI音箱等設(shè)備也紛紛走進(jìn)了更多用戶家庭。
如今,很多用戶已經(jīng)習(xí)慣于通過喚醒詞將音箱中的語音助手激活,進(jìn)而向它提出問題或下達(dá)指令,有的智能音箱甚至還能與用戶簡單地聊兩句天。但彭博社的報(bào)道提出,智能助手如此“懂你”的背后,可能并不僅僅是人工智能和機(jī)器學(xué)習(xí),而是有人類員工團(tuán)隊(duì)人工聽取用戶與設(shè)備的對話錄音,并幫忙改進(jìn)算法的結(jié)果。

亞馬遜千人監(jiān)聽團(tuán)隊(duì)
彭博社報(bào)道介紹,亞馬遜在全球有數(shù)千名工作人員,他們?nèi)斯ぢ犎『蜋z查用戶和智能語音助手Alexa的私人對話,目的是幫助Alexa改進(jìn)語音識別技術(shù)。

該團(tuán)隊(duì)專門收聽用戶在家中和辦公室里被Echo音箱抓取的錄音。這些錄音會(huì)被轉(zhuǎn)錄、加上注釋,然后反饋到軟件中,以消除Alexa對理解人類語言的差距,幫助它更好地響應(yīng)指令。
亞馬遜在廣告詞中介紹,“Alexa生活在云端,并且一直越來越聰明”,實(shí)際上,和許多需要從經(jīng)驗(yàn)中學(xué)習(xí)的軟件工具一樣,人類也為機(jī)器做了不少教學(xué)。
執(zhí)行這一工作的團(tuán)隊(duì)包括全職亞馬遜員工和合約工,工作地點(diǎn)遍布世界不同地區(qū),包括波士頓、哥斯達(dá)黎加、印度、羅馬尼亞。員工簽署了保密協(xié)議禁止公開談?wù)撨@一項(xiàng)目。
羅馬尼亞首都布加勒斯特的兩位員工透露,他們一天工作9小時(shí),每班解析多達(dá)1000條音頻片段。
波士頓的一名員工則表示,他為特定的話語,如Taylor Swift,挖掘了累積的語音數(shù)據(jù),并對其進(jìn)行了注釋,以表明這個(gè)搜索是指那位歌手。
私人聲音片段也會(huì)被抓取
智能音箱需要時(shí)刻開啟麥克風(fēng),以監(jiān)聽用戶是否說出了喚醒詞、是否在向自己下命令。亞馬遜語音助手Alexa的軟件就被設(shè)計(jì)為持續(xù)記錄音頻片段,聆聽喚醒詞。默認(rèn)的喚醒詞即為“Alexa”。
目前的工作流程下,私人的聲音片段也會(huì)被設(shè)備抓取。
有時(shí)候,工作人員會(huì)聽到用戶私人的聲音片段,如一個(gè)女人洗澡時(shí)嚴(yán)重走調(diào)的歌聲,或者一個(gè)孩子尖叫著尋求幫助。工作人員利用內(nèi)部聊天室共享文件,解析含糊的單詞,或者是分享搞笑的錄音。
有時(shí)員工還會(huì)聽到不安甚至有可能是犯罪的錄音。兩名員工稱,他們聽到過他們認(rèn)為是性侵案的聲音,當(dāng)這種事情發(fā)生時(shí),他們會(huì)在內(nèi)部聊天室說出來解壓。
亞馬遜對此表示,員工聽到令人痛苦的事情時(shí),他們有標(biāo)準(zhǔn)流程處理。但是這兩位羅馬尼亞員工表示,他們要求對這類案件進(jìn)行處理時(shí),被公司告知干預(yù)此類事件不是亞馬遜的工作。
“我們認(rèn)真對待用戶的個(gè)人信息和隱私安全。”亞馬遜發(fā)言人在一份電子郵件聲明中稱,“我們只會(huì)注釋極小一部分的Alexa錄音樣本,為了改善用戶體驗(yàn)。如幫助我們訓(xùn)練語音識別和自然語言理解系統(tǒng)的信息,這樣Alexa可以更好地理解用戶要求,并保證對每個(gè)人都能提供好的服務(wù)。”
“我們有嚴(yán)格的技術(shù)和操作保障,對濫用我們系統(tǒng)的行為采取零容忍政策。員工在工作流程中無法直接訪問能辨別用戶和賬號的信息。我們使用多重驗(yàn)證來限制訪問,對服務(wù)加密,審計(jì)我們的工作環(huán)境,以對所有信息高度保密。”
語焉不詳?shù)碾[私政策
亞馬遜在其宣傳和隱私政策的材料中,沒有明確表明Alexa獲取的一些對話錄音是人工來聽,只是在常見問題解答列表中提到了一句“我們使用您對Alexa的命令來訓(xùn)練我們的語音識別和自然語言理解系統(tǒng)”。
Alexa的隱私設(shè)置中,公司給用戶提供了禁用錄音開發(fā)新功能的選項(xiàng)。彭博社看到的截圖顯示,發(fā)送給工作人員的Alexa錄音沒有提供用戶的全名和地址,但與用戶的賬戶號、名稱和設(shè)備序列號相關(guān)聯(lián)。
依賴人類員工填補(bǔ)算法空白的,還有谷歌、Siri
亞馬遜圓柱形的智能音箱Echo于2014年上市后,很快就因其可以在家中使用智能語音軟件快速流行開來。不久之后,谷歌母公司Alphabet推出了自己的版本Google Home,隨后是蘋果公司的HomePod,在中國也有很多品牌的智能音箱產(chǎn)品。
據(jù)研究機(jī)構(gòu)Canalys的報(bào)告,2018年,全球消費(fèi)者購買了7800萬臺智能音箱,其中數(shù)百萬臺通過語音軟件與智能手機(jī)上的智能助手進(jìn)行交互。
大多數(shù)現(xiàn)代語音識別系統(tǒng)依賴于模仿人腦的神經(jīng)網(wǎng)絡(luò),軟件會(huì)通過海量數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),為Echo等其他智能音箱的算法提供可能性的模型。如果用戶問Alexa附近有沒有名叫“希臘某某”的地方,算法會(huì)自動(dòng)知道用戶在尋找希臘餐廳,而不是教堂或社區(qū)中心。
但Alexa也經(jīng)常犯錯(cuò),尤其是俚語、口語、方言和非英語的語言。因此亞馬遜需要雇傭人類員工,幫助填補(bǔ)算法的空白。
除了亞馬遜之外,實(shí)際上,其他品牌的語音助手也都是在人類的幫助下訓(xùn)練出來的。
蘋果的Siri也有人類員工的幫助,他們負(fù)責(zé)評估語音助手對請求的解釋是否與用戶說的相符。根據(jù)蘋果安全白皮書,員工檢查的Siri錄音是沒有個(gè)人身份信息的,錄音會(huì)與一個(gè)隨機(jī)標(biāo)識符關(guān)聯(lián),存儲(chǔ)六個(gè)月,之后這些數(shù)據(jù)就會(huì)被移除隨機(jī)標(biāo)識符,但它們也有可能存儲(chǔ)更長時(shí)間以改善Siri的語音識別。
在谷歌,一些人類員工也可以獲取谷歌助手的音頻片段幫助訓(xùn)練和改善產(chǎn)品,這些音頻也沒有個(gè)人身份信息,并且經(jīng)過音頻失真處理。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司