坊間流傳著這麼一個說法:谷歌想回中國,必須靠AI;而靠AI回中國,必須搞個大事情。 於是,上週四的晚上李飛飛發布了一篇博文,然後連著發了三條推特,宣布一個叫AutoML的AI產品了。
一夜之間,中國的科技媒體就爆炸了,空氣中似乎迴盪著那一句話:搞事情了、搞事情了、搞事情了……AutoML是不是跟谷歌的中國戰略有關,我們不做討論。 這里希望幫大家搞清楚的,是這個AutoML到底要搞什麼事情。
按照谷歌云AI項目首席科學家李飛飛的說法,AutoML的目標是降低開發者、研究者和企業群體使用人工智能相關工具和框架的門檻。 而通俗的理解大概就是,這個產品讓你不需要寫任何代碼,就訓練出一個企業級的機器學習模型。 AutoML也就是“自動機器學習”的意思。
驚不驚喜? 意不意外? 傳說中學會機器學習年入50萬呢,說好的BAT瘋搶AI工程師呢? 是不是感覺剛掏出去的培訓費被風吹走了? 更有網友驚奇地評論道:“不是說一起用AI去革一大堆工作的命嗎?怎麼我辛辛苦苦學AI,結果先被革命了?”
當然了,現實並沒有這麼殘酷。 但谷歌的動作並不是孤例, 背後隱含著的,是一直被反复提及的“AI民主化”, 並且也折射出“我們今天學的AI技術也許是沒用的”。
搞笑的吧? 原來最先被AI革命的是AI工程師?
谷歌宣布的這個讓碼農界風聲鶴唳的東西,叫做AutoML Vision,是整個AutoML體系的第一款產品,專注自動生產圖像識別領域的模型。
我們用簡單易懂的方式描述一下這個系統是如何工作的:
假如以前我想要做一個能夠進行圖像識別的AI系統,那麼我需要在開發框架上自己搭建訓練過程,完成各種訓練部署,導入數據集,整個過程需要使用編程的方式來完成。
但在AutoML Vision上,我一行代碼都不用寫,只需要按照說明,把我希望訓練用的圖片都拖進系統裡,然後耐心等待,一個訓練好的機器學習模型就趁熱出爐了。
舉個例子,假如你想訓練一個模型,用來識別你家的貓主子是不是生氣了(這得有多無聊……),那麼就只需要在AutoML Vision中放入你家貓 的照片、它生氣時候的照片、高興時候的照片等等,然後你就會得到一個識別程序。 用它連上手機拍照,就可以讓AI去理解貓大人的喜怒哀樂了。
是不是挺神的?
這背後,是谷歌利用了深度學習領域中的遷移學習(Transfer Learning)技術。 把此前谷歌訓練圖像識別模型時積累下來的訓練過程,遷移到AutoML當中,這樣就節省下後續類似模型的開發過程。
簡單來說,AutoML有點像谷歌云搭建的一個“解題公式”。 之後的考生並不需要知道公式是怎麼來的,只需要把問題套進去就可以得到答案。 當然了,這只是簡單交代一下它的工作原理,實際上沒有那麼容易。 尤其在調試進程中,不同模型需求和系統的兼容度是個大問題。
總而言之,這個產品以及背後的思路,對於想做機器學習又缺乏專業技術和人才的企業來說確實是個福音。 它取消的,是通過代碼搭建機器學習模型的過程,以及復雜的調試工作。 僅為碼農們保留了輸入特定數據這個操作。 很大程度上降低了機器學習訓練中的工作量,尤其是編程工作。
但也別太樂觀。 雖然AutoML目前還沒有正式發布,真實效果有待考量,使用價格也是未知數。 但就目前信息來看, AutoML生成定制化模型需要的數據量還是很大的,不是毫無基礎的開發者能夠搞定的。
而且它只能完成相對簡單的任務,且只能套用谷歌給出的訓練方案。 如果想要製作比較複雜的機器學習系統,使用獨特算法進行訓練,那麼編程還是不可避免的。
所以呢,目前來看真正用心且努力進入AI開發領域的朋友大可放心。 除了圖像識別,谷歌未來還計劃將AutoML服務拓展到翻譯、視頻和自然語言處理等領域。 這或許意味著初級的AI程序被自動生成、快速復製到各行業已經不遠了。
雖然谷歌表示AutoML是目前唯一一個此類產品,但其實各家也都在部署類似的業務。 比如亞馬遜的Amazon SageMaker,以及微軟還未正式發布的定製圖像識別模型服務。 包括國內的百度,也在旗下AI開放平台中推出過定制化圖像服務。
之所以說谷歌這次“搞了個大事”,主要是因為AutoML的自動化程度更高,尤其是解決了自動搭建訓練模型和調參這兩大問題。
不過在谷歌這麼賣力的背後,似乎寫著五個大字: AI民主化。
AI民主化,要取消了誰的集權?
去年3月,剛剛加盟谷歌不久的李飛飛就表示,人工智能的下一步是完成“AI民主化”。 在這次發布AutoML之後,她又一次表示由於資源稀缺,多數企業無法開發個性化模型,所以AutoML的出現是為了進一步推進AI民主化。
那麼問題來了: AI民主化,到底是針對誰的專政? 要取消誰的集權?
有人說了,大部分先進的AI技術現在是掌握在幾家大公司手裡的。 AI民主化當然是要讓人人成為AI的主人,破解巨頭專政。
我只能說,你當人家傻啊?
難道谷歌們會費了好大力氣,為了瓦解自己的霸權? 當然不會。 就像AutoML的產品思路中展示的那樣,省略掉了開發者的技術門檻,谷歌吃虧了嗎? 沒有。 谷歌擁有了更多的用戶,自身的算法優勢無形中得到了擴張。 並且AutoML的用戶訓練模型是要直接部署在谷歌云上的,顯然這也是個變相捆綁,希望從刁鑽角度刺AWS幾刀。
對於最迫切希望得到“民主”的小公司和個人開發者而言,巨頭兜售的開發者賦能和去技術門檻式“民主”,絕不是仁慈的饋贈,換取而來的是小開發者們緊密 依賴關係的生態。 真正被AI民主化瓦解的,其實是夾在大公司和小開發者之間的中層公司,或者叫算法公司、技術公司。
目前在世界各地的AI市場上,這類中型公司都普遍存在。 當然其存在是有意義和價值的。 對於巨頭來講,將技術能力打入各行各業,開發各種各樣的應用是完全不可能的,那麼就有賴於開發者去做這些事,自己做平台服務和技術能力的輸出者就好 了。
但小團隊和個人開發者能去做這些深入行業,或者極具創意的開發嗎? 其實也不行,因為從零開始的話技術太複雜,對人才的要求太高,一般開發者和小企業根本玩不起。
於是就出現了大量夾層公司,他們以技術壁壘為主要產業支撐點。 利用重技術和人才去做一些其實看起來不那麼“重”的小應用,或者以開發定制化AI模型的方式向第三方收費。
而谷歌、英特爾等巨頭企業都在倡導的AI民主化,事實上是將需要大量“AI勞動力”完成的工作裝入自動化模型裡。 向上收回底層技術開發權,向下直接觸達細分開發場景。
說白了,小公司、個人創業者、人才稀薄地區想要引入AI,就必須能從成本上越過技術公司,自己玩得起AI。 巨頭的AI民主化,當然是希望瓦解那些憑藉“二手技術”和“僱傭能力”卡位的企業,把他們的份額分給更小的開發者。 讓開發者僅僅提供創意和運營、市場等能力來激活AI的廣泛前景。
所以所謂AI民主化,真正瓦解的是AI當中非創造性工作製造的准入壁壘。
而在AutoML代表的自動化戰略進一步實施後,最可能帶來的影響是AI產業鏈的去中層化。 一些看似很大的公司,卻只創造了很小的價值,僅僅依靠AI技術壁壘來佔據市場份額和資本關注,大概是這場“民主運動”中最危險的一方。
今天的AI,會不會是跑不過馬的汽車?
最後,我們可能還要開另一個腦洞: AI民主化雖然聽起來很美,但未必全是好消息。
毋庸諱言,AutoML這樣的產品所帶來的AI民主化進度,可以說是肉眼可見的。 如果回頭看看一兩年前,很容易就會發現AI的產業鍊和開發規則已經大變樣了。
但這對產業邊緣徘徊不前的企業來說一定是好事嗎? 就像文章開頭提到的,AutoML一發布,很多程序員朋友第一反應是調侃自己的AI白學了。 但要知道,他們可才學了沒有多長時間。 那麼對於想要進入這個領域的企業來說,類似的恐懼會不會更深?
我們知道,在絕大多數共識裡,今天以機器學習為主導的AI復興,核心是由三個因素構成的: 算法、算力和數據。 有趣的是,這三個因素現在都在快速“被民主”。
算法上,AI開發框架開始越來越智能,AutoML這樣的產品甚至能自動編程,實現算法工具化和模塊化。 算力上,各種新的硬件和處理到來,算力成本近乎每一天都在跌落。 數據上,越來越多的免費數據分享成為常態。 並且前沿的AI技術爭論中,已經開始質疑大量數據對於深度學習的必須性。
總而言之,差不多每隔一段時間,AI的門檻就會下調一次。 但從企業和開發者的角度來看,這樣的情況就有點苦惱: 現在部署的AI能力,會不會一個月之後就被淘汰了?
我們知道,汽車最開始是跑不過馬車的。 雖然最終證明了汽車絕對強過馬車,購入汽車是正確的,但大家都不希望成為那輛超級老爺車的乘客。 何況AI這東西,連老爺車那樣的收藏價值都沒有。
就像此時此刻,不知道有沒有一位剛剛組建了豪華機器學習專家團隊的企業家,突然發現原來自己想做的,隨便找個人操作下谷歌的新產品,再等上一天就搞定了. …..
也許在今天,企業收穫的不是AI開發門檻逐步降低帶來的好處,而是面對AI體系快速迭代產生的恐慌。 畢竟我們都不知道,今天做的事會不會在幾個月之後就被證明毫無意義。
尤其對於中國企業來說,習慣於追風口,風來則上,風小則退。 這麼複雜且天天都在變的AI,誰有心情跟它躲貓貓啊?
本文由 腦極體 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文請於文首標明作者姓名,保持文章完整性(包括虎嗅注及其餘作者身份信息),並請附上出處(虎嗅網)及本頁鏈接。 原文鏈接:http://www.huxiu.com/article/230703.html
未按照規範轉載者,虎嗅保留追究相應責任的權利