吳恩達團隊可能沒想到突然被diss。
他們最近發布了全球最大的醫學影像數據集MURA,還用這個數據集訓練了一個169層的深度卷積神經網絡模型。
發布數據集的同時,順帶也披露出這個AI模型識別肌肉骨骼病變的能力,比放射科醫師還是……差了那麼一點點。
結果這件事,成為了導火索。
計算生物學界的一位戰士,加州理工教授Lior Pachter見到這個成績後,翻出了吳恩達幾個月之前發布的一條Twitter:
放射科醫師是不是該擔心一下自己的工作了? 大新聞:我們的AI(ChexNet)現在讀胸腔X光片診斷肺炎的能力已經超過放射科醫師了。
這條搞了個大新聞的消息緊扣公眾痛點,直指放射科醫師的失業問題,獲得了1400次轉發,2400個贊。
結果,反差出來了。
同樣一個團隊,去年發布ChexNet時,暗示放射科醫師面臨失業。 而最近這個MURA模型的表現意味著:放射科醫師的工作,似乎又保住了。
學界爭論
其實之前ChexNet診斷肺炎“超越放射科醫師”這個說法提出時,受到的質疑也不少。
例如,Lior一手帶出來的博士,現在斯坦福做博士後的Harold Pimentel,看見吳恩達的Twitter就立刻就拿出來批判了一番:
放射科醫師們沒什麼可擔心的;介紹研究成果的時候要負責任一點。
而跨界放射科醫師和機器學習研究者的Alexandre Cadrin也說,論文結論很有意思,但放射科醫師們“不用擔心”。
為什麼不擔心? 秘密就在ChexNet的結果裡。
Harold後來給出了解釋:
他說,機器學習界研究醫學影像問題至少30年了,但識別的結果普遍還是不如經過專業訓練的人類。 吳恩達Twitter一發,說得好像這個問題已經解決了一樣,可是他們只找了4名放射科醫師,略微超過了他們的平均成績。
醫生Eric Topol也在論文結果中標註了這樣兩句話,提醒我們注意:
這個模型,就和4名放射科醫師比試了一下,4個人就能代表所有從業者了?
還有一名懂機器學習的放射科醫師Declan O’Regan指出,論文中的數據不足以支撐吳恩達Twitter的結論,沒有曲線下面積(AUC)的統計對比,沒有未選病例的外部盲測,沒有細節 ,沒有正常病例的比例,對誤分類情況也沒舉出例子。
質疑並不少,但是所有人加起來,聲量也不夠大。
生物學家、醫生、以及吳恩達的半個機器學習同行們對這條Twitter的不滿,很大程度上也是因為吳恩達老師的學術地位和影響力。
在Lior看來,吳恩達作為一名聞名學界內外、有30萬Twitter粉絲的大V,如此聳人聽聞,對同行、對公眾、對整個科學家群體來說,都不是什麼好事。
對同行來說,傷害顯而易見。 知名學者拿著自己的研究成果大聲吆喝,普通科學家連一個小職業都消滅不了,論文哪還好意思發表?
對公眾和科學家群體來說,基本的信任就是這麼被消滅的:公眾一次又一次這樣被言過其實地忽悠,誰還會相信科學家?
事情就是這麼個事情。
Lior Pachter其人
Lior Pachter是計算生物學、計算和數學科學教授,目前任教於加州理工大學。 目前其團隊主要研發基因組學的計算和實驗方法,專注於單細胞測序技術的發展及其在RNA生物學中的應用。
這已經不是他第一次在網上開砲。
例如四年前,剛剛開通博客不久的Pachter,就連續發表三篇熊文,強烈抨擊此前發表在Nature Biotechnology上的兩篇論文。
他抨擊的對象,一位是知名的複雜網絡研究權威Albert-Laszlo Barabasi,另一位是時任MIT計算生物研究組負責人的大牛Manolis Kellis。
是非曲直,我們不做深究。 但在這一時間裡,Pachter的風格同樣一覽無餘的展現了出來。 當時有報導這麼記述:
“萊爾寫博客的時間不長,2013年8月開始,也就半年多的時間。但絕對絕對是博客界的奇葩。萊爾寫博客的風格非常鮮明,那就是無論如何上來先劈裡啪啦一頓 胖揍。”[1]
以及上面提到的第二個批評,還是Pachter隱忍多年,找到一處細節之後,全力啟動的一次爆發。 足見這位教授也是心思縝密、很愛開砲,讓人不由得想起紐約大學的馬庫斯教授。
與當年的洋洋灑灑、雷霆萬鈞相比,他這次對吳恩達的批評,應該算是“三和一少”的態度了。
而說馬庫斯,馬庫斯就到。
剛剛馬庫斯也出手參與了一下這件事,他又在Twitter上開砲:
“過度炒作可能已經成了吳恩達的習慣,在影像診斷上,在汽車上,更普遍地說在AI上都是這樣。”
關於未來
其實,放狠話的不僅僅是吳恩達。
此前,聲名煊赫的Geoffrey Hinton曾經放言:從現在開始,應該停止培訓放射科醫師。 他預言5-10年內深度學習就將取代這些崗位。
作為一個克制的英國人,Hinton對深度學習能帶來的醫療革命充滿熱情。 “我看過太多的醫生低效的使用數據,病患的歷時信息被大量忽略;我看到醫生們無法很好地閱讀CT掃描,兩個醫生對同一個掃描片能得出不同的解讀 ”。
在三次不同的場合,醫生基於CT掃描說他妻子有繼發性腫瘤,但每次都是誤診。 Hinton相信AI會最終讓放射科醫師失業。
值得注意的是,前不久吳恩達的老師Michael I.Jordan發表了一篇博客,題為《人工智能:革命遠未到來》。
在這篇文章裡,Jordan同樣回憶自己14年前的往事,但暗示機器應用於醫療系統之後,數據誤差等原因使得“唐氏綜合症的診斷就不斷上升”,“導致了一些嬰兒不必要的 死亡”。
從這一個案例出發,Jordan拋出一個觀點:AI正在暴露出嚴重的缺陷,大家過於依賴數據,深度學習不是AI的全部。 並且建議關注更多推理、因果關係等方面的進展。
未來,爭論可能仍會不停上演。 好在所有人的目標都是一致的,那就是如何更好的造福人類社會。
本文由 量子位 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文章須經作者同意,並請附上出處( 虎嗅網 )及本頁鏈接。 原文鏈接https://www.huxiu.com/article/245997.html