- 首頁
- 民文
- English
- 網(wǎng)站無障礙
- 舉報(bào)
- 登錄
AI“聯(lián)合科學(xué)家”重塑科研協(xié)作方式


2024年春的一天,美國斯坦福大學(xué)病理學(xué)家托馬斯·蒙廷開啟了一場前所未有的“實(shí)驗(yàn)室會(huì)議”——與6位由人工智能(AI)驅(qū)動(dòng)的“虛擬科學(xué)家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經(jīng)科學(xué)家到藥物化學(xué)家,在幾分鐘內(nèi)展開多輪討論,最終生成了一份長達(dá)一萬多字的會(huì)議紀(jì)要。這場看似科幻的情景,其實(shí)是一個(gè)新興趨勢的縮影:以多智能體語言模型組成“AI科研團(tuán)隊(duì)”,模擬真實(shí)研究協(xié)作過程,幫助科學(xué)家節(jié)省時(shí)間、完善假設(shè),甚至激發(fā)新的科學(xué)靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學(xué)家”。
多家機(jī)構(gòu)打造“虛擬實(shí)驗(yàn)室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學(xué)家”的軟件。該軟件由6個(gè)AI代理組成,分別負(fù)責(zé)想法生成、反思或批評、概念演進(jìn)、去重、排序和總結(jié)審稿,均由谷歌的Gemini 2.0模型驅(qū)動(dòng)。這套系統(tǒng)是谷歌生物醫(yī)學(xué)AI研究工作的延伸。在一項(xiàng)早期測試中,該系統(tǒng)在兩天內(nèi)就解決了困擾科學(xué)家十多年的科學(xué)謎題。
美國斯坦福大學(xué)也在去年11月推出了“虛擬實(shí)驗(yàn)室”系統(tǒng),蒙廷試用的正是這個(gè)版本。科技媒體Freethink網(wǎng)站報(bào)道稱,目前,該系統(tǒng)以O(shè)penAI的GPT-4o為基礎(chǔ),默認(rèn)配備“首席研究員”和“評論者”兩個(gè)角色,用戶可自由添加更多代理并設(shè)定他們的專業(yè)領(lǐng)域,快速生成模擬會(huì)議記錄。
在中國,上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)也在開發(fā)虛擬科學(xué)家系統(tǒng),名為“VirSci”,專注于模擬科學(xué)家團(tuán)隊(duì)的合作過程,以推動(dòng)科研創(chuàng)新。
英國《自然》雜志報(bào)道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點(diǎn),它們還具備聯(lián)網(wǎng)檢索信息、執(zhí)行代碼、調(diào)用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術(shù)語目前尚不嚴(yán)格,但一般指LLM在一定程度上能自主承擔(dān)任務(wù)。美國阿貢國家實(shí)驗(yàn)室的計(jì)算機(jī)科學(xué)家里克·史蒂文斯指出,多個(gè)AI代理協(xié)同作戰(zhàn),可連續(xù)數(shù)小時(shí)專注于解決復(fù)雜科學(xué)問題,不會(huì)走神,也不會(huì)疲憊。
AI科研團(tuán)隊(duì)是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎(jiǎng)得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實(shí)存在“幻覺”問題,即生成錯(cuò)誤或虛構(gòu)的信息。但芝加哥大學(xué)計(jì)算機(jī)科學(xué)家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內(nèi)容,提升整體可靠性。他還認(rèn)為,即便是“幻覺”,在頭腦風(fēng)暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關(guān)。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實(shí)優(yōu)于單一AI。以GPT-4o為例,斯坦福大學(xué)團(tuán)隊(duì)發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學(xué)測試中的表現(xiàn)會(huì)提高幾個(gè)百分點(diǎn),在實(shí)際科研應(yīng)用中的回答也更加精準(zhǔn),例如在放射治療方案設(shè)計(jì)方面更具邏輯。
谷歌也曾對其聯(lián)合科學(xué)家系統(tǒng)展開評估,結(jié)果顯示,人類專家更傾向于由多個(gè)AI協(xié)作生成的回答,認(rèn)為其更具新意和科研潛力。
關(guān)于多少名AI代理、幾輪互動(dòng)最為有效,科學(xué)界也正在尋找答案。上海人工智能實(shí)驗(yàn)室計(jì)算機(jī)科學(xué)家董楠卿等人開發(fā)VirSci系統(tǒng)時(shí)發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個(gè)代理人×每人5輪發(fā)言”的設(shè)置下。而斯坦福大學(xué)的斯旺森則表示,超過3個(gè)專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點(diǎn)子到底有多新
谷歌在宣布其聯(lián)合科學(xué)家系統(tǒng)時(shí)表示,該系統(tǒng)幫助研究者提出了“新穎的預(yù)測”。例如,斯坦福大學(xué)的加里·佩爾茨用谷歌的“AI聯(lián)合科學(xué)家”系統(tǒng)尋找治療肝纖維化的新藥時(shí),AI團(tuán)隊(duì)在分析背景信息后提出3種藥物建議,其中2種在實(shí)驗(yàn)中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時(shí),一些科學(xué)家則認(rèn)為這些建議其實(shí)“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學(xué)院微生物學(xué)家何塞·佩納德斯團(tuán)隊(duì)測試谷歌系統(tǒng)時(shí)。AI在閱讀背景文獻(xiàn)后,提出了一種未見于任何文獻(xiàn)的新假設(shè):移動(dòng)遺傳元件可“跨細(xì)胞偷取”噬菌體尾部。這一觀點(diǎn)挑戰(zhàn)主流,卻與該團(tuán)隊(duì)通過未公開實(shí)驗(yàn)得出的結(jié)論一致。佩納德斯認(rèn)為,盡管AI只是把已有信息作了一個(gè)“顯而易見”的推理,但其本身就是科學(xué)進(jìn)步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結(jié)資料、激發(fā)靈感、提出新角度或查漏補(bǔ)缺,幫助研究者節(jié)省時(shí)間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗(yàn)證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認(rèn)為,AI聯(lián)合科學(xué)家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會(huì)損害其自主思考和學(xué)習(xí)能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。(記者 張佳欣)
分享讓更多人看到