人工智能正在讓這個時代激動不已,但也正引發不少擔憂。 被譽為機器學習之父的美國三院院士、伯克利教授Michael I.Jordan昨天在美國知名科技媒體Medium上,難得的發布了他的第一篇文章。 一反以往的技術乾貨輸出,這篇文章的主題是對當前AI研究中的問題進行冷靜反思。 Michael I.Joardan教授是吳恩達的導師,在機器學習和人工智能領域建樹頗深。
以下為Michael I.Jordan博客全文:
作為這個時代的代名詞,人工智能正被技術人員、學者、記者和風險投資人共同吟誦。
和其他專業名詞一樣,這個名詞在被使用過程中伴隨著種種誤解。 事實上並不是公眾不理解科學家,而是科學家有時候也像公眾一樣迷惑。
“與人類智能相媲美的矽基智能正誕生於我們所處的時代。”這類想法讓我們激動萬分,也帶來了同等程度的驚嚇和分心。
而關於當前的時代,也有一些不同的聲音。
讓我先講一個故事,它涉及到人類、計算機、數據和生死抉擇。
超聲波檢測數據和唐氏綜合徵
14年前我的太太懷孕時,我們做了一次超聲波檢查。 一位遺傳學家指出,胎兒心臟周圍有一些白色斑點。
“這些都是唐氏綜合症的標誌,”她說,“患病風險已經高達5%。”她還告訴我們,我們可以通過羊膜穿刺術來了解胎兒的實際情況,但羊膜穿刺術具有一定的 危險性,手術中胎兒死亡的概率約為1/300。
作為一名統計學家,我決定找出這些數據來源。
長話短說,我發現十年前有人在英國做過一項統計分析,這一分析稱,這些白點反映了鈣的積累,確實是唐氏綜合症的一個預測指標。
但我也注意到,在我們的測試中使用的成像儀比英國研究中使用的,每平方英寸多幾百像素。 我回去告訴遺傳學家,我相信這些白點很可能是假陽性的,它們實際上是“白噪音”。 她說:“啊,這就解釋了為什麼自從我們開始用新機器,唐氏綜合症的診斷就不斷上升。”
我們沒有做羊膜穿刺術,幾個月後,一個健康的女孩出生了。
這一事件讓我非常困擾,特別是在粗略計算後,我發現全世界每天有成千上萬的人正接受這種診斷,而且其中很多父母選擇了羊膜穿刺術,導致了一些嬰兒不必要的 死亡。
這種情況一天又一天發生,不知何時才能停止。
這個故事中的問題與我個人的醫療保健無關;它關乎醫療系統,測量不同地點和時間的變量和結果,進行統計分析,並在其他地方和時間使用結果。
這個故事中的問題與數據分析本身有關,而且與數據來源有關。
廣義而言,數據來自哪裡,數據得出了什麼推論,這些推斷與當前情況之間的相關程度如何?
一個訓練有素的專家也許能夠逐案解決所有這些問題,但問題能否是設計出全球醫療系統的解決方案,以至於不用人類監督也可以解決這些問題。
我也是一名計算機科學家,想要建立這種全球的推理和決策系統所需的原則,將計算機科學與統計學相結合,並考慮到人類的福祉,我所學的知識並不能幫助我解決這些 問題。
不僅在醫療領域,而且在商業、交通和教育等領域,這些原則的發展至少與建立能讓我們眼花繚亂地玩遊戲和進行運動感知的AI系統一樣重要。
無論我們是否很快就能理解“智能”,我們都面臨著一個重大挑戰,即將計算機和人類友好交互,從而給人類生活帶來便利。
儘管有些人將之視為“屈從於人工智能”,但它也可以被更平常地看待,就像創建一個工程學科的新分支一樣。
就像過去幾十年興起的土木工程和化學工程一樣,這門新學科的目標是聚合幾個核心思想的力量,以安全的方式為人們帶來新的資源和能力。
土木工程和化學工程建立在物理和化學之上,而這個新的工程學科將以上個世紀落地的思想為基礎,這些思想包括“信息”、“算法”、“數據”、“不確定性”、 “計算“、”推理“和”優化“等等。
此外,由於這個新學科建立在有關人類的數據之上,所以其發展也需要從社會科學和人文科學的視角剖析。
雖然人工智能大工程的積木塊已經有了,但是把這些積木塊組合在一起的原則還沒有出現,所以這些積木的組合僅僅以特例的方式存在。
就像在土木工程學科出現之前建造房屋和橋樑一樣,人類開始著手構建大規模的推理和決策系統,它涉及機器、人類和環境。
正如早期的建築和橋樑有時會以不可預見的方式崩塌並帶來悲催的後果一樣,目前許多早期的大規模推理和決策系統已經暴露出了嚴重的概念缺陷。
不幸的是,我們並不善於預測下一個會出現的嚴重缺陷。 我們缺少的是一個具有分析和設計原理的工程學科。
當公眾談到這一話題時,他們過於頻繁地使用“AI”,彷彿它是個通配符(wildcard),這使得人們很難推理AI這項新興技術的範圍和後果。
因此我們需要仔細思考AI這一名詞在歷史上和今天,到底指的是什麼。
什麼才能被稱為AI?
今天大多數所謂“AI”,指的是過去的幾十年中被稱作“機器學習”的東西。 ML是一個算法範疇,它將來自統計學、計算機科學和許多其他學科的想法融合在一起,設計算法來處理數據、做出預測並幫助做出決定。
ML真正給世界帶來了影響,而且它所帶來的影響不是最近才發生的。 事實上,在90年代初就已經非常明確了:ML會給工業界帶來大規模的影響。
在本世紀初,亞馬遜這樣的前瞻性公司已經在所有業務中使用了ML,解決了欺詐檢測和供應鏈預測方面的關鍵問題,並且對面向消費者的服務做出了創新,如推薦系統。
在接下來的20年中,隨著數據集規模和計算資源的快速增長,很明顯,ML將不僅為亞馬遜,而且將為任何一家能夠將決策與大規模數據聯繫在一起的公司提供動力。
新的商業模式將會出現。 “數據科學”這個名詞開始被用來指代這種現象,反映出ML算法專家需要與數據庫和分佈式系統專家合作以建立更強的ML系統,也反映這一推理系統在社會和環境方面的 潛力。
這種思想和技術趨勢的融合在過去幾年中被重新命名為“AI”。 這一重塑值得仔細推敲。
從歷史上看,AI這個詞在上世紀50年代末被創造出來,表達了在軟件和硬件中實現具有人類智能實體的強烈願望。 我們將使用“類人AI”一詞來指代這一願望,它強調人工智能實體似乎應該是我們中的一員,即使不是身體上,但至少在精神上。
這類研究主要存在於學術領域。 雖然相關的學術領域,如運籌學、統計學、模式識別、信息論和控制論已經存在,並且常常受到人類智能的啟發,但這些領域可以說是集中在“低級”信號和決策上。
比如說,一隻松鼠能夠感知它所生活的森林的三維結構,並在樹枝之間跳躍,這種能力給我們帶來許多啟發。
“人工智能”的關注點應該不同於此,AI應當關注人類“理性”和“思考”的高級認知能力。
然而,60年過去了,高層次的推理和思想仍然難以捉摸。 現在被稱為“人工智能”的發展主要出現在與低水平模式識別和運動控制制相關的工程領域,以及統計學領域——專注於找到數據模式並做出有根據的預測、假設檢驗和決策 。
著名的“反向傳播”算法在20世紀80年代初被David Rumelhart重新發現,現在被視作所謂“人工智能革命”的核心。 其實,反向傳播最早出現於20世紀五六十年代的控制理論領域,它的早期應用之一是優化阿波羅號宇宙飛船向月球前進時的推進器。
自20世紀60年代以來,我們已經取得了很大的進展,但可以說,這並不是來自於對“類人AI”的追求。
相反,這些工程師的傑作往往隱藏在幕後,就像阿波羅飛船的情況一樣。 雖然公眾不容易覺察,但在文件檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社交網絡分析、規劃、診斷和A/B測試等領域的研究和系統建設的確取得了重大成功,推動 谷歌、Netflix、Facebook和亞馬遜等公司的進步。
人們可以簡單地所有這些稱為“AI”,但這樣的標籤可能會讓優化或統計領域的研究人員感到驚訝,他們一覺醒來後發現自己突然成了“人工智能研究人員”。 但撇開研究人員的標籤不談,更大的問題是, 使用這個單一的、定義不清的首字母縮略詞,會妨礙人們對技術和商業變革的清晰理解。
2個關鍵問題:智能增強和智能基礎設施
在過去的二十年裡,“智能增強”(IA)在工業和學術界取得了重大進展,這是對“類人AI”的補充。 在IA領域,計算和數據被用來增強人類智力和創造力。 搜索引擎可以被看作是IA的一個例子,自然語言翻譯也是如此。
基於計算的聲音和圖像生成可以作為藝術家的調色板和創意增強器。 雖然這類項目可能涉及高層次的推理和思想,但目前它們不這樣涉及——它們大多執行各種字符串匹配和數字操作,捕獲人類可以使用的模式。
本文的最後一個縮略詞是“智能基礎設施”。 讓我們想像一個由計算、數據和物理實體組成的網絡,它使人類所處的環境更加友好、有趣和安全。 這種基礎設施已開始出現在運輸、醫藥、商業和金融等領域,並對個人和社會產生巨大影響。
有時也出現在關於“物聯網”的話題中,但物聯網一般指把“物”放在互聯網上,並不涉及這些能分析數據和發現事實、在更高的抽象層面上與人互動的“ 物”所面臨的更大挑戰。
例如,回到我的個人軼事,我們可以想像在一個“社會規模的醫療系統”中生活,它建立了醫生以及位於患者體內外設備之間的數據流和數據分析流程,從而幫助人類進行診斷 和提供護理。
該系統將納入來自人體細胞、DNA、血液測試、環境、群體遺傳學以及大量藥物和治療文獻的信息。 它不僅關注單個病人和醫生,而且關注所有人類。 就像目前的醫學測試允許在一組人身上進行實驗,然後大範圍應用一樣。 這將有助於保持相關性、出處性和可靠性,就像當前金融業正致力於解決財務和支付的可信性一樣。
當然,可以預見,這一系統將會出現很多問題,比如隱私、責任、安全問題等等,但這些問題應該被視為挑戰,而不是阻礙。
我們現在遇到了一個關鍵問題:如果要解決上述這些更大挑戰,“類人AI”研究是最佳的,或者說是唯一的方法嗎?
機器學習領域裡最受歡迎的成功案例中,有一些與類人AI有關,如計算機視覺、語音識別、人機對局和機器人等。 所以,也許我們應該等待這些領域的進一步發展。
這裡需要說明兩點。 首先,報紙不會告訴你,我們在類人AI上取得的成功實際上非常有限,我們距離實現類人AI的願望還很遙遠。
不幸的是,儘管進步甚微,它帶來的興奮和恐懼給這個領域帶來了過度的關注,而這種情況在其他工程領域還從未出現過。
其次,更重要的是,這些領域的成功不僅不足以解決重要的IA和II問題。 為什麼說它們不足以解決IA和II問題呢? 看看自動駕駛就知道了。
要實現這樣的技術,需要解決一系列的工程問題,而這些問題可能與人的能力關係不大。 整個交通系統可能會更像現在的空中交通管制系統,而不是模擬現在的路況:一群分散的、面朝前的、注意力不夠集中的人類駕駛員。
它將比現在的空中交通管制系統複雜得多,尤其是將使用大量數據和自適應統計建模來進行更細層面上的決策。 這些挑戰才是最需要被擺在首位的,而在努力解決這些挑戰的過程中,專注於類人AI可能會令人分心。
當然也有人認為,類人AI包含了IA和II,因為類人AI系統不僅能夠解決AI的經典問題,也是解決IA和II問題的最佳選擇。
但是,幾乎沒有先例可以支撐這樣的論點。 照這麼說,發展土木工程是不是需要通過人造木匠或泥瓦匠來實現? 發展化學工程是不是應該先造出一個人造化學家? 或者這麼說,如果我們的目標是建設化學工廠,那麼我們是否應該先建立一個人造化學家,然後再研究如何建造一座化學工廠?
還有一種與之類似的觀點認為,人類的智慧是我們目前所能知道的唯一一種智慧,我們應該先模仿它。 但其實人類在某些推理上並不十分擅長——我們會有失誤、偏見和局限。
而且關鍵的是,人類還沒有演化出大規模決策的能力,這種能力是現代II系統必須擁有的。 人類也還不足以應對II系統場景中的各種不確定性。
有人可能會爭辯說AI系統不僅會模仿人的智能,而且會“糾正”它,並把它擴展到大規模的問題上。
但是,這是科幻小說裡才有的,這種推測性的論點雖然在小說中具有娛樂性,但不應該成為我們在遇到IA和II問題時的主要策略。 我們需要研究IA和II問題本身,而不僅僅是坐等讓類人AI來解決問題。
II系統的算法和基礎設施挑戰並不難解決,而這不屬於類人AI研究的核心。 II系統需要管理分佈式知識庫,這些知識庫正在迅速變化,而且很可能在國際上互不一致。
這些系統必須考慮與雲端的相互作用,來做出及時的分佈式決策,並且它們必須能夠處理長尾現象。 它們必須解決在不同管理部門和競爭對手之間分享數據的難題。
最後,尤為重要的是,必須將激勵、定價等經濟概念帶入統計和計算基礎設施領域,是它們連接了人與人、人與商品。 這樣,II系統就不僅僅是提供服務了,而是在創造市場。
音樂、文學和新聞等領域正急需這樣能夠用數據分析將生產者和消費者聯繫起來的市場。 這一切都必須在不斷演變的社會、道德和法律規範的背景下完成。
展望未來
當然,類人AI的經典問題仍然值得關注。
然而,目前AI研究的重點還是收集數據、部署“深度學習”基礎設施、展示能模仿某些狹義上的人類技能的系統。
這樣的研究重點偏離了經典AI研究裡最主要的開放性問題,包括,在自然語言處理系統中引入推理和意義、推斷和因果關係的必要性、開發計算上易於處理的對不確定的表示的 必要性、以及開發製定和追求長期目標系統的必要性。
這些都是類人AI研究中的經典目標,但在目前“AI泡沫”的喧囂中,人們很容易忘記這些亟待解決的問題。
IA還將保持相當重要的位置,因為在可預見的將來,在抽像地理解現實世界情況的能力上,計算機還無法追上人類,我們仍然需要經過深思熟慮的人機互動經過來解決我們最緊迫的 問題。
我們希望計算機能夠激發人類更高一層的創造水平,而不是取代人類的創造力。
John McCarthy創造了“AI”一詞,顯然是為了將他的初期研究與Norbert Wiener的研究區分。 Wiener創造了“控制論”一詞,用以指代他自己對智能係統的願景,這一願景與運籌學、統計學、模式識別、信息論和控制理論密切相關。
而McCarthy的願景裡則強調了與邏輯的聯繫。 這裡有個有趣的反轉,雖然“AI”是McCarthy提出來的術語,今天佔據了主導地位卻是Wiener的智能理論。
但我們需要超越McCarthy和Wiener的觀點。
我們要認識到,目前關於AI的公開對話內容主要都集中在工業界和學術界的很小領域裡,這可能會使我們面臨由AI、IA和II帶來的全方位挑戰和機遇。
上述的角度不關乎科幻夢想或機器超越人類的噩夢,而更關乎人類理解和塑造技術的需求。 這種需求在日常生活中變得更加現實有力。 此外,在這種理解和塑造過程也需要來自各行各業的不同聲音,不僅僅是技術上的對話。
過於集中地關注類人AI,會讓人們屏蔽很多聲音。
工業領域的進步將繼續推動發展,學術界也將繼續發揮重要作用,學術界的作用不僅在於提供創新性的技術理念,而且在於將來自不同領域的研究人員:計算機和統計學科、來自社會科學、 認知科學和人文科學等領域的研究人員匯聚起來,他們的價值和觀點十分重要。
另一方面,雖然人文和科學是我們前進的關鍵,但我們討論的範疇依然是工程領域——社會造物:製造新的產物,這些產物應該能按照我們想要的方式工作。
我們都不希望在建立了能幫助我們獲得醫療、交通和商業機會的系統後,發現這些系統並不能真正運轉起來,從這個角度來說,在機器學習和數據科學佔中心地位的領域,還有 一個學科亟待出現。 這些已知的領域令人興奮,但還不能被視為新的工程學科。
而且,我們應該接受這樣的事實:我們正在見證一個新的工程分支的誕生。 在學術界以及其它領域裡,“工程學”這個術語經常被狹義地引用,用以指代冷酷無情的機器,或帶有人類失去控制的消極內涵,但工程學科其實是可以成為我們想要的 樣子的。
當前,我們有機會來建構一種新學科領域——真正以人類為中心的工程學科。
我不會給這個新興學科命名,但未來,如果“AI”這個詞繼續被濫用,它將會給我們帶來頗多限制。 讓我們開闊視野,淡化炒作,認識到未來嚴峻的挑戰吧!
作者簡介:Michael I.Jordan是加州大學伯克利分校計算機科學與統計學教授。 他在計算、推理、認知和生物科學領域有超過三十年的工作經驗。
本文由 大數據文摘 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文章須經作者同意,並請附上出處( 虎嗅網 )及本頁鏈接。 原文鏈接https://www.huxiu.com/article/240986.html