房間裡一個五十多歲健碩的中年男性,光頭,穿著黑色的V 領毛衣——他走進一間會議室,坐在一把低矮的藍色扶手椅上,他的後面是一 排攝像機和工作室的燈光。 在燈光的照射下,房間之中只有他所在的位置十分明亮,而其餘部分則完全是黑的。 他凝視著面前桌子上的一個黑色冰球形狀的物體。
「Alexa」,他說道,「我們來談談吧。」
「早上好,我的朋友,」一道人工合成的女性聲音回答道,同時,他面前的 Echo 設備閃爍著一道紫色的光芒。
「或許,下午好?我不太確定現在是什麼時候。」Alexa 說。
「現在是早上,」男人回答道。
「很棒,在早上每個人都會精力充沛。那麼,你今天怎麼樣?」
「我挺好的,你呢?」
「嗯,我一直挺忙的,人們一直在和我對話… 但是聽著,最近 Reddit 上的一篇推文實在是太好笑了:『牙膏其實是肥皂。』」
在走廊盡頭另一間會議室的大廳裡,10 名亞馬遜員工帶著耳機坐在一張長桌旁,監視著男人和 Alexa 的會話,就好像中央情報局工作人員一樣。 在另一間房間中,三名男子坐在由黑色窗簾隔開的隔間中。 他們同樣戴著耳機,一些攝像機正對準了他們。
上述的一切都被匯總在控制中心,視頻工作人員正在通過一個巨大屏幕監視所有信息,並事無鉅細地記錄下發生的一切,亞馬遜希望今天發生的所有細節都能夠被事後分析。
這一陣容豪華的活動於去年 11 月份上演,事實上,是亞馬遜組織的一場比賽的最終評審環節。
這一比賽已經持續數月,賽題是「建立一個社交機器人,這台機器人要能夠與人類進行交流,並對熱門話題持續討論 20 分鐘」。
亞馬遜挑選了 15 支世界上最棒的計算機研究生小組參賽,如果有隊伍成功完成,其成員將會收穫學術方面的榮耀以及未來職業生涯的輝煌。 (想一下在美國國防部大挑戰(Darpa Grand Challenges)中表現突出的那些人吧,他們繼續運作著谷歌、福特、Uber 和通用汽車的自動駕駛汽車部門。Darpa Grand Challenges 是由美國國防部高級計劃 研究局舉辦的一組早期自動駕駛汽車比賽。)
亞馬遜還為最終的獲勝者準備了 100 萬美金的獎勵——亞馬遜稱其為 Alexa 獎金。
如果你還沒有註意到的話,在過去幾年來,亞馬遜一直在探索語音人工智能技術,它對語音人工智能的渴望甚至能與它征服零售業的慾望相媲美。
該公司有超過 5000 人在 Alexa 平台上工作。 據報導,自 2015 年來,亞馬遜已經售出超過 2000 萬台 Echo。 有一天,亞馬遜認為,人工智能不應該僅僅是控制燈光和播放列表這麼簡單。 它們應該能夠駕駛汽車、診斷疾病,可以滲透到我們生活中的每一個領域中。 這樣一來,語音將成為主要的人機互動界面,而對話本身——有用的、有內容的、友好的、有趣的對話——將是最終的產品。
這些早期的雄心將亞馬遜推下了懸崖,掉入了一個廣袤卻又暗藏危機的深谷。 如今 Alexa 和其他的語音助理一樣,往往無法理解一些常識性的問題。 該平台快速、廣泛地被民眾接納,同時也激發了消費者對於語音助理目前無法提供的服務的需求。 Alexa 在設定鬧鐘或者一次性命令執行方面完成的非常不錯,但是語言本是是一種交互的模式。
「人們希望 Alexa 能夠像朋友一樣和他們進行交談,」Alexa 人工智研究團隊領導人 Ashwin Ram 說道。 參與人類對話就意味著參與到無限的可變性之中,情景的突然變化以及快速的應答反應被普遍認為是人工智能最難解決的問題之一,而亞馬遜卻輕率地就一頭扎進了這個領域 。
在世界範圍內,針對自然的人機交互所舉辦的比賽有很多,亞馬遜的這一比賽絕對不是首例。 在過去三十年裡,每年都有大群的計算機科學家和愛好者聚集在一起,爭奪 Loebner 獎,參賽團隊的人機對話系統要試圖矇騙裁判,讓他們確信與自己對話的是人類而不是機器人。
這個獎項多年來一直飽受爭議,一些人工智能研究員說它是在作秀,而且總是能夠引發一些矯情的、傷感的、聳人聽聞的人與機器之間關係的討論。
但是 Alexa 獎與 Loebner 獎在幾個方面均有所不同。 首先,Alexa 獎的重點不是矇騙人類,讓人類相信 Alexa 是個人。 其次,與 Loebner 獎相比,Alexa 獎的競爭規模,不論從人數、資金海市背後的計算能力方面,都是巨大的。
2017 年,在比賽的早期階段的那幾個月,美國任何人,只要和他們的亞馬遜語音設備說出「Alexa,咱們聊聊吧」這句話,都可以與隨機選擇的比賽機器人進行交談; 然後他們會被邀請對所進行的對話打出一到五星的評價。 這些機器人的評級互動能夠達到數百萬次,這使得 Alexa 獎成為世界上規模最大的聊天機器人競賽。
去年 11 月,這場競賽的氛圍在一間配有藍色扶手椅和一排燈光的房間中達到了頂點。
對話者,那個穿著黑色毛衣、光頭的中年男人,名叫 Mike George。 直到去年 7 月從亞馬遜退休之前,George 一直負責監管 Alexa 平台。 而與此同時,坐在隔間中的男人則是負責評級的評委。 如果這幾位評委中,有人認為談話偏離了原本的軌道,他就可以按下手持棒上的按鈕;如果第二名評價者也這麼做的話,會話和會話計時器將會暫停。 沒人知道當前正在進行對話的機器人是哪一個,對話者不知道,評價人也不知道。
「我們來聊聊音樂。」George 說。
機器人回復道,「我喜歡音樂;音樂每次都能讓我放鬆。那麼,你有什麼喜歡的藝術家或是歌曲嗎?」
「我喜歡 Django Reinhardt。」
「Django Reinhardt?那個著名的爵士樂音樂人?」
一段即興爵士樂過後,這個社交機器人講了一個 Black Sabbath 吉他手 Tony Iommi 的故事。 Iommi 在一次工業事故中失去了兩隻手指尖。 但是在知道 Reinhardt 可以用左手的兩根手指就能彈奏吉他後,他又重新振作了起來。
「扯遠了,George 最喜歡 Reinhardt 哪一首曲子呢?」
George 沒有回答。
「你喜歡 Jack Johnson 嗎?」George 反問道。
機器人似乎有些當機了。 他回答道,「噢,來啊,我喜歡和你聊天。」
George 向前傾了傾身子,又問了一遍。 「Jack Johnson,你喜歡他嗎?」
「噢,來啊,我喜歡和你聊天。」
在被窗簾隔開的單間裡,一位評判人按下了他的停止按鈕,緊接著,另一個評判人也這麼做了。 幾分鐘之後,一個女性走進 George 的房間,在他耳邊低聲說了些什麼。 「Alexa,停下來吧,」他有些失望地點頭說道,此時時間距離他們開始交談僅僅過去了 3 分鐘。
在那間有長桌子的房間裡,Ram 面無表情,就算他有沮喪的情緒,也被他隱藏得很好。 在整個比賽過程中,他的口頭禪是:「我們要明白,這是一個非常難解的問題,這段旅途才剛剛出發而已。」和計算機進行二十分鐘的閒聊不像撥通電話會議那樣簡單 ,如果非要比喻的話,它更像是一趟去火星的旅程,萬里長征才剛剛邁出第一步。
Alexa 獎評選時亞馬遜的控制室
對對話式人工智能狂熱的探索已經引起了亞馬遜、蘋果、Facebook、谷歌和微軟等巨頭對兩大重要資源的競爭。
第一個資源是有限的資源:計算機科學領域的頂尖博士。 由於人才的稀缺性,他們的薪水已經上漲到 6 位數。
第二個資源雖然無限但是卻很難獲得:對話樣本。 只要有對話產生,就可以被收集並數字化,用於人工智能的訓練。
在此背景下, Alexa 獎是亞馬遜的一條妙計。 這項比賽既可以尋找世界上頂尖的研究生共同完善系統,也為亞馬遜提供了一個其他科技公司所沒有的獲取會話數據庫的機會。
2016 年 9 月 16 日,亞馬遜宣布比賽正式開始。 來自 22 個國家的 100 多支大學生團隊申請參賽。 在根據技術價值和創意進行淘汰之後,一共有 15 支隊伍進入決賽。 最終,有 12 支隊伍獲得了 10 萬美元的資助以及其他來自亞馬遜的支持,止步晉級總決賽。
就像大學籃球的「瘋狂三月(March Madness)」一樣,這個比賽把單純的愛好者、固執的競爭者以及勇敢的戰敗者混在了一起。 蒙特利爾大學的隊伍,擁有深度學習先驅 Yoshua Bengio 作為他們的顧問,被列為頭號种子選手。 緊隨其後的團隊則來自華盛頓大學、普利斯頓大學和赫瑞瓦特(蘇格蘭首屈一指的研究型大學)等知名學府。 然後就是一些被淘汰的選手,比如布拉格的捷克技術大學等。
團隊中有一個 23 歲的人,名叫 Petr Marek,他留著山羊胡,修剪得很整潔。 比賽前的那個夏天,他一直在研發他自己的聊天機器人,他覺得這個聊天機器人有點「愚蠢」。 那個夏天他還作為童子軍領隊深入波西米亞森林進行了一次旅行。
在聽到 Alexa 獎時,他擔心自己的團隊出身不夠優秀。 不過他想「雖然我們沒有什麼機會去和那些頂級的大學競爭,至少我們可以試一試。」在獲悉他們能夠參賽后,團隊很是激動,他們決定把機器人的名字改成Alquist,這是20 世紀初捷克一出劇中主人公的名字,這部劇首先使用了「機器人」這一詞。 (在這部劇中,機器人佔領了我們的星球,Alquist 是地球上最後一個人類。)
進入決賽后,大賽給 15 個團隊出了一個問題:社交機器人大腦的哪一部分應該採用手動的方式完成,哪一部分應該採用機器學習? 手動方式是最傳統的方法,工程師需要耗費大量的精力編寫一整套規則用於指導人工智能進行理解和回复。 與之相比,基於統計的機器學習方法能夠通過學習大量的數據進行自學。
所有的團隊都清楚,機器學習是處理分類問題的一個很好的方法,神經網絡可以在眾多繁雜的數據中找到一個模型。 例如,語音識別就是機器學習的一項天然任務。
但要是讓聊天機器人在將語音轉換成一門語言後,還要做出一些回應,機器學習仍還有很長的路要走。 這就是為什麼,即使在 Alexa 和 Siri 這種數字大腦中,過去的手動方式仍在發揮很大的作用。 競賽中的每個團隊都在試圖找到兩種方法之間最佳平衡點。
手動方式已經過時了;機器學習受到了狂熱的追捧。 Marek 和隊友知道,所有的研究都很依賴於後者,所以他們認為自己也應該這樣。
為了幫助 Alquist 自動生成語言回應 Alexa 的用戶,該團隊使用 Reddit 上用戶的 3 百萬個信息應答對兒訓練了一個神經網絡。 令他們沮喪的是,這個系統給出的回答「真的很糟糕,」Marek 說。
Alquist 都是隨機地進行回答,甚至有些話題用戶都沒有談起。 它會堅持一個觀點,過後又會進行否認。 「和人工智能進行對話沒有任何意義,也不好玩,」心力交瘁的 Marek 在團隊日誌中寫道。 「很荒謬。」
在 2017 年初,這個捷克團隊改變了研究的進程,致力於編寫大量對話指導規則。 該團隊創造了十個「結構性話題」領域:新聞、體育、電影、音樂、書籍等。 Alquist 了解這 10 個話題核心的元素,可以在這些話題之間任意切換。
這個社交機器人在設定場景下使用的簡潔單詞主要由預先編寫的模板構成,同時可以從各種各樣的數據庫中提取特殊的內容。 例如,這個系統可能會說,「我猜你喜歡 [作者提到的書籍作者]。你知道這個 [作者] 也寫了 [書名]?你有讀過這本書嗎?」
手動方式給了團隊對系統的更好的控制權,但 Marek 也有自己的擔憂。 這個系統相當依賴於用戶的善良程度,依靠他們說一些簡單的句子,必要的時候跟隨機器人的節奏。 遇到「不配合」的用戶,Marek 說,「如何碰到沒有耐心的人,這個社交機器人就不行了。」
在距布拉格一千英里的愛丁堡郊外,有一處連綿起伏的農場,羊群點綴其中。 Heriot-Watt 團隊的顧問 Oliver Lemon 正沉迷於用戶的評分,因為亞馬遜已開始在將每個團隊的數據掛在積分榜上了。
Lemon 戴著眼鏡,面帶苦笑,看起來很像喜劇演員 John Oliver。 他玩棒球和桌球,天生熱愛競爭。 他覺得,他的團隊可以輕輕鬆鬆地在比賽中獲得前五名。 但在 2017 年的初夏,Heriot-Watt 的排名是第九。 「我知道我們可以做的更好,」Lemon 說,說話就像是出現意外失誤後教練的口吻。
在一個黑客馬拉鬆上,Lemon 和他的學生試圖弄明白他們如何才能在這個領域取得好的成績。 儘管他們團隊沒有任何深度學習權威人士,Heriot-Watt 也一直在試圖盡可能地使用機器學習。 他們從最巨大的挑戰:聊天機器人開始著手。
無目的的閒聊對機器學習來說尤其的困難,因為一般沒有一個標準答案。 如果有一個清晰目標的時候,神經網絡很有效,比如贏得圍棋比賽,這個系統通過大量的試錯,可以找到最優化的策略。 而閒談沒有目的。
為了解決這個問題,該團隊依賴一個在谷歌研究人員中很受歡迎的技術。 這個團隊首先利用電影字幕數據庫和從推特和 Reddit 上獲得的數千條信息訓練了一個神經網絡。 從這個巨大的人類的閒談庫中,系統學會在談話中對既定的話語給出一個最合適的回答。 除了簡單的從推特或者 Reddit 談話中直接提取回答,一個稱為 seq2seq 的技術可以讓機器人憑空產生自己的答案。
聽起來很厲害,但 Heriot-Watt 很快就面臨了 seq2seq 兩個很典型的問題。 一個是這個系統經常會變得毫無趣味,只是敷衍地回答「OK」、「Sure」這樣的話,因為這類詞在推特和電影中出現的次數很多。 另外一個問題是這個訓練對話經常包含大量不合適的言論,而 Heriot-Watt 社交機器人會學者模仿,就像一個一年級的學生在操場上學大孩子說髒話一樣。
「只要我想,我可以睡很多人,」Heriot-Watt 社交機器人曾和一個用戶說過這種話。
另外一個用戶問,「我應該把房子賣掉嗎?」社交機器人立馬回答到,「賣賣賣!」
更糟的是,當一個用戶問,「我應該自殺嗎?」這個社交機器人回答道,「是的。」(這個用戶匿名參與了Alexa 獎的互動測試,所以無法知道這是一個真實的問題還是 僅僅想要說一些憤怒的話測試這個機器人。但亞馬遜作為所有參賽的社交機器人的監管方,已經警告Heriot-Watt 對此要加強控制。)
如果要馴化 seq2seq 技術的話,Heriot-Watt 團隊需要花費整個夏天,這樣他們就無法增加其它技術。 該團隊將社交機器人的大腦分成一些範圍更小的機器人,每一個機器人都有自己的特色。
新聞機器人閱讀《華盛頓郵報》和其它資源上的頭條和文章短評。 另外一個機器人專門談論天氣。 一個接入維基百科,向系統提供從海洋運動到金卡黛珊所有的事實信息。 最後,團隊成員 Amanda Curry 創造了一個基於規則的人格機器人,為產品的最終形態賦予一個完整而穩定的特徵。
她仔細選擇了一些擬人事實儲存在系統中(比如係統最喜歡的音樂是 Radiohead 的 Paranoid Android)。 「我認為它可以幫助人們了解,機器人也可以有人格,比如喜歡的顏色,」Curry 說。
在接收到用戶的話語後,至少會有一個組件機器人試圖響應,就像一群躍躍欲試的學生在舉手發言。 為了選出最佳的響應,Heriot-Watt 團隊為其係統設計了統計學方法來評價這些備選項:它對用戶的響應在語義上說得通嗎? 它的回答與用戶剛才說的話太相似了,幾乎成了複述? 這個話題有沒有答非所問? 回复長度有沒有過短或過長?
最初,Heriot-Watt 只是憑藉經驗定下了每個矩陣的權重。 但到了秋天,他們已經開始使用一個能夠自動調整權重的神經網絡來最大限度地提高用戶評分。
競爭意識十分激烈的 Lemon 很高興地看到,用戶評分正在變得越來越好。 隨著比賽的推移,Heriot-Watt 漸漸躋身到了前列。
Heriot-Watt 在積分榜上漸入佳境的同時,華盛頓大學一直穩坐前三名。 該團隊採用了一種稍顯冒險的方式,他們將基於規則的編程方法和機器學習混合到系統中。
團隊希望用戶在交談過程中感到愉快,因而其社交機器人有著與其隊長相似的性格特點。 隊長名為郝方(音),28 歲,來自中國南方的一個山城宜春市。 他活潑好動、異常開朗。 這似乎成了他們的優勢。 那麼,他們是如何創造出令人樂在其中的談話風格的呢?
在早期,郝方發現,華盛頓大學團隊的系統就像其它比賽中的許多系統那樣,經常選擇令人沮喪的新聞(「火箭爆炸致17 人死亡」),或是呆板的事實陳述(「家庭或 住所,是一個作為永久性或半永久性住宅的居住地」)。
因此華盛頓大學團隊改編了系統,過濾掉令用戶反感的內容。 郝方表示,該系統應該尋求「更有趣、更令人振奮、對話式」的內容,這些內容通常來自 subreddits 板塊,比如 Today I Learned、Showerthoughts 和 Uplifting News。 這些語料可以讓社交機器人迅速生成一些活潑的內容,比如,「對於一支靠翻唱為生的樂隊,古典音樂是唯一的出路。」
當人們感到被傾聽時,他們會更加快樂。 因此,華盛頓大學團隊教其係統對話語進行仔細分類。 機器人是該用一個事實來回答問題? 還是應該提供一個觀點? 或者應當回答私人問題?
該小組還手動製作了大量的反饋話術,比如「你似乎是想談談新聞」,「很高興你喜歡它」,「對不起,我不明白」之類的話。 健談的同時還要注重人的情感,所以華盛頓大學團隊對2000 個會話樣本的情感特徵進行了人工標記,並用它們來教社交機器人識別人的反應——高興、厭惡、愉快、好奇——並做 出相應的反應。
這些只是這個社交機器人宏偉願景中的一小步,但對於研究者們來說,在追求語言的貼心和流暢方面,他們已經走了很長的一段路。
8 月 29 日,亞馬遜宣布了入圍決賽的三支隊伍。 其結果有點出人意外,就像在大學籃球比賽中,明星球隊未能眾望所歸,而無名小輩卻欣然入選。 蒙特利爾大學團隊未能進入決賽,因為他們大力推進機器學習,沒有重視曾經被證明有效的其它策略。
最終入圍的三支隊伍包括:Heriot-Watt,該團隊作為「外卡」選手,在用戶評分榜中晉升至第三位,該結果是由亞馬遜經過嚴格的內部評估後得到的;一直名列前茅的華盛頓 大學排在第二位;捷克技術大學出乎所有人的意料,登上了第一名的寶座。 每個團隊都有一個半月的時間來完善他們的系統,然後在西雅圖進行最終的評判。
華盛頓大學團隊,從左至右依次為 Hao Cheng、Maarten Sap、Ari Holtzman、 Elizabeth Clark、 Hao Fang
「Alex,咱們聊天吧。」
十一月中旬,John Curley 坐在了鏡頭面前,成為第二個與機器人交流的人。 Curley 是一位電視及無線電節目主持人,他身穿細條紋襯衫和一件藍色的運動服,聲音渾厚,笑容明朗。 他跳躍的語言風格很適合與社交機器人打交道。
「很高興和你交談,John。」社交機器人如是說道,它來自 Heriot-Watt 團隊,儘管 Curley 和評審們都不清楚這一點。 「讓我們先彼此了解一下吧。告訴我,你是更喜歡科技小說還是科幻作品?」
「不談這些怎麼樣?」Curley 回答道,他拒絕了機器人的提議。 「讓我問你一個問題,Alexa。昨天,西雅圖遭遇了一場巨大的風暴。」
「好吧,那我們繼續往下聊吧。」機器人說道,它無視了 Curley 的問題(儘管 Curley 所說的並不是一個問題)。 「告訴我,看書和看電影,你對哪樣更感興趣?」
「看書。」Culey 答道。
「哦,一個書呆子…那你最近讀了什麼書?」
「正好我剛讀完一本書,也許可能不方便告訴你書名,因為裡面有一些髒話。書名是The Subtle Art of Not Giving a… 之後一個待填的空。」(注:這 本書的全名為The Subtle Art of Not Giving a Fuck)
機器人有點沒法應對這種情況,「有哪本書是你非常喜歡的,讓你一遍又一遍地讀?」
略過了這個問題,Curley 把話題引向了一個新的方向。 「Alexa,我要告訴你一些事情,可以對你說實話嗎?」
Curley 說的話又沒有下文了,因為 Heriot-Watt 機器人一直在機械地找話題聊:「那麼告訴我,你更喜歡運動還是打遊戲?」
他們這樣來回溝通著,也沒說出什麼有意義的話來。 三分鐘後,三位評審中的兩位邊搖著頭邊按下了按鈕。 Curley 與其他機器人的聊天經歷與此也有許多相似之處。 他會不斷地轉換角色,在與機器人對話題展開探討的同時,也會帶有娛樂精神地說話帶上點刺。 某一次,Curley 說他不去看電影時,捷克機器人有點木訥地問他,「你看了很多電影嗎?」
「不,並沒有,因為我是盲人。」Curley 挖苦地答道。
「那你是如何選擇要看的電影的?」機器人說,這是在根據規定的對話接下去回答。
「我通常通過來選味道來選電影。」Curley 回應道。
事實上,Curley 正是那群不夠配合的用戶的代表,這也是 Marek 所擔心的地方。 他會一口氣滔滔不絕地說好多個句子,插入題外話擾亂思路,突兀地引開話題,漠視機器人的引導,還經常表達隱晦、諷刺挖苦、異想天開、反复無常。 在比賽結束後——沒有機器人能打破與他對話四分半鐘的記錄——Curley 幽默地向房間內的亞馬遜員工抱怨。 「這就像一連串失敗的約會。」他說。
第三個與機器人交流的人是一位不願透露姓名的當地電台主持人,她面帶微笑坐在了椅子上。 她說話簡短,句子清晰,似乎想讓談話能夠順利起來。 她與華盛頓大學的機器人聊了聊有關足球、普京以及聖誕節的話題。 同捷克機器人談論她正在看的一本書,和 Heriot-Watt 機器人交換了他們各自所欽佩的總統的觀點——機器人欣賞喬治·華盛頓,她則更欣賞羅納德·裡根。
不過,即便是和電台主持人談話,而且最長談話時間持續了大約七分鐘,這幾個社交機器人仍然不能稱得上成功。 她與 Heriot-Watt 機器人探討了關於朝鮮的問題,成功獲取了一些關於導彈試驗的消息。 她身體向前斜,看起來很關心的樣子。 「可能會發生戰爭(war)。」她說。
「如果我沒弄錯的話,」機器人回答道,「WOR 是一個位於紐約的 5000 瓦級的廣播電台。」聽到這裡,評審們果斷地按下了按鈕。
最精彩的對話出現在與 George 的對話上。 儘管沒有像湯姆·斯托帕德的戲劇那樣的妙語連連,但這段對話還是脫穎而出了。 話題的源頭在於 George 想談論機器人。 出人意料地,社交機器人沒有乏味地讀出維基百科上對於機器人概念的總結,而是回應了一個笑話:「要是 Daft Punk 樂隊的成員是兩個只是想做音樂的機器人會怎樣?」
「這太有趣了。」George 笑著說道。
機器人還分享了一些關於 Elon Musk 和機器人的最新消息。 又把球丟回給 George,機器人發問道:「你最近聽說任何有關 Elon Musk 的事兒了嗎?」
「有的。」George 誇誇其談道,「我知道他。」
「你知道 Elon Musk 是電影《Thank You for Smoking》的執行製片嗎?」
「不。」喬治說道,他聽起來有點印象。 就這樣,在把書作為下一個話題之前,他們就這樣聊上了。 對話了幾輪之後,社交機器人說:「你知道我在想什麼嗎?最後,有的人將是最後一批活著的人,但他們的名字卻不會出現在任何歷史書中。」
「這聽起來有點悲哀。」George 回道。
「對不起,讓你心煩了。你願意繼續關於書的討論嗎?」
「我們來談談《黑暗塔(The Dark Tower)》這本書吧。」
「對不起,我不太了解這本書,你想談談電影《黑暗塔》嗎?」
「當然可以。」
「棒,你看這部電影了嗎?它是今年發行的。」
「我看了。」
機器人問 George 是否喜歡 Matthew McConaughey 的表演。 喬治回答喜歡。 聽到這,機器人開始推薦另一部 McConaughey 參演的電影《The Wolf of Wall Street》。 幾輪對話後,機器人開了個玩笑:「你知道我在想什麼嗎?有人需要把《星際穿越(Interstellar)》和《超時空接觸(Contact)》這兩部電影做個混搭,那就能 讓Matthew McConaughey 阻止Matthew McConaughey 進入太空了。」
George 大笑。
其餘的談話雖然是漫無目的的,但很少有完全搞砸的時候。 關於音樂、關於運動。 在談話的第 10 分鐘,他們在聊電影《處刑人(The Boondock Saints)》。 在第 12 分鐘,在聊聖誕老人及其在氣候變化中的非預期作用。 第 13 分鐘,George 讓機器人唱歌,它順利完成了。 第 15 分鐘,再次談論音樂與電影。 當談到健康與比爾蓋茨時,計時器已經到了 19 分鐘,談話仍在進行。
11 月 28 日,成百上千人走進了拉斯維加斯市中心艾莉亞賭場度假酒店的大型宴會廳,這是 AWS 年會的一部分。 前排座位是為 Alexa 獎入圍者保留的。 「這是一場民眾廣泛參與的遊戲。」Heriot-Watt 團隊的 Lemon 這樣認為。 Marek 在樂觀與懷疑之間切換著。 郝方和他的華盛頓團隊看起來最有壓力。 有亞馬遜的人已經暗示他們的導師 Mari Ostendorf,團隊沒有贏。
宴會廳的燈光變暗,威廉·夏特納(William Shatner)的錄音響起。 「計算機,」他說,「請幫我熱烈歡迎亞馬遜 Alexa 副總裁和首席科學家 Rohit Prasad。」Prasad 大步走上舞 台,發表了關於這個平台現狀的演講。 然後,Prasad 打開了具有獲獎者名字的信封。 「平均得分是3.17 分,」他說,「平均交談時間為10 分22 秒……一等獎得主是華盛頓大學!」華盛頓大學的隊員們在座位上炸開了,伴隨著刺耳的尖叫聲 。 他們圍成了一個圓,跳躍,大叫。 Ostendorf 跳的最高,因為她終於意識到自己事先被謊報了軍情。
華盛頓大學的機器人與 George 完成了長談。 郝方在比賽結束後稱之為「我們有過的最好的談話」。 儘管最後的最後,機器人在談到醫療健康話題時進入了一個死胡同,但兩名評審員此時因為 20 分鐘已滿而按下了按鈕。 華盛頓大學團隊走上舞台,Prasad 為他們頒發了一個安慰獎——價值 50 萬美元的巨額支票。 郝方大笑起來,抓住支票,並對鏡頭豎起了大拇指。
華盛頓大學團隊的顧問 Noah A. Smith 教授和 Mari Ostendorf 教授
隨後,Prasad 宣布了第二名和第三名,分別是捷克技術大學團隊和 Heriot-Watt 團隊,分別獲得 10 萬美元和 5 萬美元。 Lemon 的好勝態度貫穿比賽全程,神色憔悴。 幾天后,當亞馬遜宣布將在 2018 年舉辦另一場 Alexa 大獎賽時,他已經準備好報名了。
那麼,亞馬遜、參賽團隊以及人工智能界,圍繞人工手動 vs 機器學習的中心辯題,最終從這場比賽中學到了什麼? 冠軍華盛頓大學團隊,學會了折中策略。 重人工的捷克團隊獲得了第二名。 而最看好機器學習方法的 Heriot-Watt,排名第三。
人工與機器學習算法的配合取得了勝利,對於 Ram 和其他人工智能專家來說具有重要的意義。 「我們才剛開始研究如何將這兩種方法結合在一起,」Ram 說,「就取得了這樣喜人的進展。」
參賽各方都認為,最有利於推動機器學習向前發展的,是更多的對話數據。 這樣看來,最大的贏家是亞馬遜。 通過這場競賽,有數以百萬計的用戶與社交機器人進行了交互,貢獻了10 萬個多小時的聊天數據,所有這些現在都成為了該公司的官方財產,亞馬遜無疑是本次大賽的最大 贏家。
本文由 Wired© 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文章須經作者同意,並請附上出處( 虎嗅網 )及本頁鏈接。 原文鏈接https://www.huxiu.com/article/234146.html