生物神經系統和電腦程序之間是否存在本質性的區別? 我們的大腦活動和機器學習本質上是否就是同一回事?
翻譯 嚴冰冰
審校 卓思琪
科學家的好朋友秀麗隱桿線蟲(C.elegans)Credit: TU Wien
在維也納技術大學(TU Wien, Vienna)的實驗室中,電腦程序(computer program)和真實生命(living being)之間的界限正在被一點點瓦解:一隻線蟲的神經系統被轉寫成了電腦編碼 ,然後這只虛擬的線蟲被指導完成各式各樣的把戲。
對科學家而言,只有1mm長的秀麗隱桿線蟲( C.elegans )是一個相當有意思的研究對象。 它是現存唯一一種全部神經系統都被分析完畢的生物體:它的神經系統可以畫成一副迴路圖;也可以用電腦軟件再現,從而在電腦程序上模擬線蟲的神經活動。
在維也納技術大學,這樣一隻“人工”虛擬線蟲便學會一項出色的技巧:用它的尾巴尖上頂住一根樹立的桿子。
秀麗隱桿線蟲僅依靠區區300個神經細胞生活下去,但這足以幫助它們完成的日常活動包括尋找路徑、吞食細菌和回應外界刺激等活動。 比如當線蟲的身體被觸摸時,將觸發相應的射反應幫助線蟲蠕動逃走。
這一簡單行為取決於由線蟲的神經細胞、及神經細胞之間的突觸連接強度。 當人們在電腦中將這個簡單的反射網絡重建後,受到程序刺激的虛擬線蟲會產生跟觸摸刺激一模一樣的反應。
維也納技術大學計算工程研究所的研究人員Ramin Hasani 表示,“’觸摸逃跑’這種神經迴路的反射反應,和一個控制樹立杆子平衡的反應非常相像。”將一根桿子的一端固定在一個移動的 物體上,讓桿子始終保持豎直——是一種典型的控制問題,利用標準控制系統可以完美地處理:每當棒子開始傾斜時,物體就需要輕微移動以保持棒子豎直。 這就好比每當線蟲受到觸摸刺激時,它都需要改變方向。 (如下圖)
Mathias Lechner, Radu Grosu 和Ramin Hasani 這三位研究人員感到好奇,對於電腦程序上的虛擬線蟲的神經系統而言,是否能在不添加任何神經細胞情況下,只是通過調整突觸連接的強度來解決 該控制問題。 而其中的本質——調整突觸連接強度——也是任何自然學習過程的基礎和特徵。
圖1 線蟲對觸摸刺激的反應(左)和虛擬線蟲平衡樹立的桿子(右)的對比
Credit: TU Wien
沒有程序員的程序
最終,該團隊成功地教會了虛擬線蟲如何去平衡一根桿子。 Mathias Lechner 解釋道,“通過強化學習(又稱‘基於實驗和獎勵的學習’),虛擬線蟲的神經網路在電腦上被不斷訓練和優化。” Radu Grosu補充說道:“ 實際上,它最終成為了一個解決桿子平衡的控制系統。 特別之處在於,沒有任何人為這個控制系統寫過一句代碼,它僅是通過訓練一個已有的生物神經系統而生成的 。 ”
該團隊將會繼續研究這一類有趣的問題。 或許這樣的問題能讓人想得更遠——生物神經系統和電腦程序之間是否存在本質性的區別? 我們的大腦活動和機器學習本質上是否就是同一回事? 這些問題將持續困擾著人類,而科學家的好朋友秀麗隱桿線蟲大概不會太在意它是生在電腦裡、還是活在泥土中。
原文鏈接 https://phys.org/news/2018-02-worm-uploaded-pole.html
相關論文信息
【論文題目】Worm-level Control throughSearch-based Reinforcement Learning
【作者】Mathias Lechner, Radu Grosu,Ramin M. Hasani
【期刊】arXiv.org
【DOI】arXiv:1711.03467
【摘要】Through natural evolution,nervous systems of organisms formed near-optimal structures to expressbehavior. Here, we propose an effective way to create control agents, bytextit{re-purposing} the function of biological neural circuit models, togovern similar real world applications. We model the tap-withdrawal (TW) neuralcircuit of the nematode, textit{C. elegans}, a circuit responsible for theworm’s reflexive response to external mechanical touch stimulations, and learnits synaptic and neural parameters as a policy for controlling the invertedpendulum problem. For reconfiguration of the purpose of the TW neural circuit,we manipulate a search-based reinforcement learning. We show that our neuralpolicy performs as good as existing traditional control theory and machinelearning approaches
閱讀更多
▽ 故事
· 主動感染絕症、求人給自己開顱:那些為研究獻身的“瘋狂科學家”
▽ 論文推薦
· 壽命超過400年的格陵蘭鯊提醒我們:人類對於最冷海域中的生命還知之甚少
▽ 論文導讀
內容合作請聯繫
keyanquan@huanqiukexue.com