久久久久亚洲精品天堂_久久综合噜噜激激的五月天_一本久道久久综合_日韩精品久久久久影院

人民網(wǎng)
人民網(wǎng)>>教育

生成式AI“幻覺”困境如何破解

2025年01月31日08:44 | 來源:科技日報
小字號

原標題:生成式AI“幻覺”困境如何破解

圖片來源:英國《自然》網(wǎng)站

圖片來源:英國《自然》網(wǎng)站

人工智能(AI)技術(shù)正以前所未有的速度發(fā)展,生成式AI憑借其驚人的創(chuàng)造力,不斷刷新人們的認知。然而,即便是看似“聰明絕頂”的AI,也難逃“幻覺”的困擾。這里的“幻覺”,指的是AI生成看似合理但實際不準確或虛假的信息。

英國《自然》雜志網(wǎng)站在1月22日的報道中指出,AI“幻覺”可能會引發(fā)嚴重后果,科學(xué)家正各出奇招,力求降低其發(fā)生率。這些措施包括增加事實核查、對AI進行“腦部掃描”等,以促進AI的健康、高效發(fā)展。

主因是數(shù)據(jù)模糊

各種生成式AI,包括由大語言模型驅(qū)動的聊天機器人,常常會編造信息。它們有時會模糊事實與虛構(gòu),在看似真實的陳述中夾雜錯誤信息。這既是其創(chuàng)造力的體現(xiàn),也是其不足之處。

美國佐治亞理工學(xué)院理論計算機科學(xué)家桑托什·威姆帕拉解釋稱,大語言模型的設(shè)計原理并非輸出準確事實,而是通過模式識別生成答案。其內(nèi)部復(fù)雜的運行機制迄今仍像一個“黑匣子”,人們難以洞悉其推理過程。

美國加州Vectara公司旨在減少生成式AI的“幻覺”。其聯(lián)合創(chuàng)始人阿姆爾·阿瓦達拉表示,在訓(xùn)練過程中,這些模型會壓縮數(shù)萬億個單詞間的關(guān)系,隨后通過一個龐大的網(wǎng)絡(luò)模型重新展開這些信息。盡管這些模型能夠重構(gòu)出接近98%的訓(xùn)練內(nèi)容,但剩下2%的內(nèi)容卻會讓其“誤入歧途”,生成不準確或虛假信息。

導(dǎo)致AI出現(xiàn)“幻覺”的原因多種多樣,其中訓(xùn)練數(shù)據(jù)中的模糊性和錯誤是常見因素。也有人認為,即使訓(xùn)練數(shù)據(jù)準確無誤,AI也有可能產(chǎn)生“幻覺”。這種現(xiàn)象與某一事實的稀缺程度密切相關(guān)。因此,即使經(jīng)過人類反饋調(diào)整過的聊天機器人,也無法完全避免出錯。

多領(lǐng)域面臨考驗

AI的“幻覺”可能會給人們的工作和生活帶來較大影響。

在新聞領(lǐng)域,大語言模型可能生成虛假新聞事件,擾亂信息傳播秩序,誤導(dǎo)公眾認知。Vectara公司針對文檔內(nèi)容開展的研究表明,一些聊天機器人編造事實、虛構(gòu)信息的幾率高達30%。世界經(jīng)濟論壇發(fā)布的《2025年全球風險報告》顯示,錯誤和虛假信息是2025年全球面臨的五大風險之一。

在法律領(lǐng)域,它可能引用虛構(gòu)的法律條文和案例。比如,2023年美國律師史蒂文·施瓦茨就因“輕信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在醫(yī)學(xué)領(lǐng)域,它可能提供錯誤的診斷和治療建議,危及患者生命。

《自然》在報道中指出,AI“幻覺”在科學(xué)參考文獻方面出現(xiàn)錯誤的情況也極為普遍。2024年的一項研究發(fā)現(xiàn),各類聊天機器人在提及參考文獻時的出錯率在30%至90%之間。它們至少會在論文標題、第一作者或發(fā)表年份上出現(xiàn)偏差。雖然聊天機器人都帶有警告標簽,提醒用戶對重要信息進行二次核實。但如果用戶對聊天機器人的回復(fù)深信不疑,可能會引發(fā)一系列問題。

多舉措減少“幻覺”

為進一步提升AI的精確度,科學(xué)家正想方設(shè)法降低其“幻覺”。

例如,增加模型訓(xùn)練參數(shù)和訓(xùn)練時長可有效減少“幻覺”。但這種方法需要付出高昂的計算成本,并可能削弱聊天機器人的其他能力,如機器學(xué)習算法對未知數(shù)據(jù)的預(yù)測和處理能力。

此外,使用更大、更干凈的數(shù)據(jù)集進行訓(xùn)練,也是降低AI模型“幻覺”出現(xiàn)的有效途徑。然而,當前可用數(shù)據(jù)的有限性限制了這一方法的應(yīng)用。

檢索增強生成(RAG)技術(shù)也為減少AI“幻覺”提供了新思路。該方法通過讓聊天機器人在回復(fù)問題前參考給定的可信文本,從而確保回復(fù)內(nèi)容的真實性,以此減少“幻覺”的產(chǎn)生。在醫(yī)療和法律等需要嚴格遵循經(jīng)過驗證的知識的領(lǐng)域,RAG技術(shù)備受青睞。

不過,美國斯坦福大學(xué)計算機科學(xué)家米拉柯·蘇茲根表示,盡管RAG能提升內(nèi)容真實性,但其能力有限。蘇茲根團隊的研究表明,一些為法律研究開發(fā)的、號稱“無幻覺”的RAG增強模型雖有所改進,但仍存在不足。

開發(fā)者也可以使用一個與AI訓(xùn)練方式不同的獨立系統(tǒng),通過網(wǎng)絡(luò)搜索對聊天機器人的回復(fù)進行事實核查,谷歌的“雙子星”系統(tǒng)便是一個典型例子。該系統(tǒng)提供了“雙重核查響應(yīng)”功能:內(nèi)容如果突出顯示為綠色,表示其已通過網(wǎng)絡(luò)搜索驗證;內(nèi)容如果突出顯示為棕色,則表示其為有爭議或不確定的內(nèi)容。但是,這種方法計算成本高昂且耗時,而且系統(tǒng)仍會產(chǎn)生“幻覺”,因為互聯(lián)網(wǎng)上錯誤信息泛濫。

在去年6月出版的《自然》雜志上,英國牛津大學(xué)科學(xué)家刊發(fā)論文稱,他們利用“語義熵”,通過概率來判斷大語言模型是否出現(xiàn)了“幻覺”。語義熵是信息熵的一種,被用于量化物理系統(tǒng)中所包含的信息量。通過評估AI模型在特定提示詞下生成內(nèi)容的不確定性,來計算模型的困惑程度,從而為用戶或模型提供警示,提醒其采取必要的循證措施,確保更準確的答案輸出。

美國卡內(nèi)基梅隆AI研究人員安迪·鄒采用的方法是在大語言模型回答問題時,繪制其內(nèi)部計算節(jié)點的激活模式。他形象地稱之為“給AI做腦部掃描”。利用不同的計算節(jié)點活動模式,可以告訴我們AI模型是在“說真話”,還是在“胡說八道”。(記者 劉 霞)

(責編:郝孟佳、孫競)

分享讓更多人看到

推薦閱讀
返回頂部
久久久久亚洲精品天堂_久久综合噜噜激激的五月天_一本久道久久综合_日韩精品久久久久影院
  • 欧美亚洲日本国产| 欧美一级黄色片| 91成人免费在线| 久久99精品国产.久久久久| 精品国产网站在线观看| 国产高清无密码一区二区三区| 中文文精品字幕一区二区| 男男成人高潮片免费网站| 偷拍日韩校园综合在线| 日韩理论片网站| 亚洲精品视频在线| 欧美伊人久久大香线蕉综合69| 亚洲一二三区视频在线观看| 亚洲尤物视频在线| 91美女蜜桃在线| 91亚洲永久精品| 欧美高清性hdvideosex| 国产精品麻豆久久久| 五月综合激情婷婷六月色窝| 6080yy午夜一二三区久久| 日本丰满少妇一区二区三区| 亚洲精品欧美在线| 91精品办公室少妇高潮对白| 国产一区二区三区最好精华液| 成人激情文学综合网| 亚洲美女一区二区三区| 日韩欧美中文字幕制服| 奇米影视一区二区三区| 亚洲女厕所小便bbb| 色婷婷综合久色| 99久久久无码国产精品| 国产麻豆精品在线| 五月天激情小说综合| 一区二区三区不卡视频在线观看| 国产精品丝袜黑色高跟| 欧美日韩一区国产| 欧美日韩免费一区二区三区视频| 99re66热这里只有精品3直播| 欧美激情一区二区在线| 午夜精品国产更新| 在线不卡的av| 国产精品国产三级国产aⅴ原创| 欧美高清在线一区二区| 亚洲一区二区三区自拍| 懂色av一区二区三区免费看| 欧美亚洲综合久久| 日韩色在线观看| 欧美一区二区三区免费视频| 成人亚洲精品久久久久软件| 99亚偷拍自图区亚洲| 亚洲成人激情社区| 91极品美女在线| 精品久久久久久综合日本欧美| 欧美日本一区二区在线观看| 亚洲永久精品大片| 国产校园另类小说区| 国产精品盗摄一区二区三区| 91免费国产视频网站| 欧美日本在线视频| 日韩欧美二区三区| 午夜国产精品影院在线观看| 国产99精品在线观看| 91在线一区二区| 国产精品亚洲一区二区三区妖精| 欧美视频一区二区三区四区| 亚洲精品国产a久久久久久| 国产精品中文欧美| 国产一区二区三区在线观看精品| xf在线a精品一区二区视频网站| 欧美色图第一页| 日韩一区二区三区四区| 亚洲综合无码一区二区| 国产综合久久久久久鬼色| 91啪九色porn原创视频在线观看| 欧美国产日本韩| 国产精品国产三级国产aⅴ入口| 久久亚洲精精品中文字幕早川悠里| 亚洲婷婷综合色高清在线| 国产在线播放一区三区四| 亚洲欧洲av一区二区三区久久| 国产一区二区福利| 国产又黄又大久久| 国产精品国产精品国产专区不蜜| 麻豆国产精品777777在线| 国产欧美精品在线观看| 91丝袜呻吟高潮美腿白嫩在线观看| 国产精品一区二区久久精品爱涩| 国产不卡视频一区| 亚洲一区二区视频| 国产午夜亚洲精品午夜鲁丝片| 亚洲品质自拍视频网站| 51精品久久久久久久蜜臀| 国产人成亚洲第一网站在线播放| 国产精品国产馆在线真实露脸| 91年精品国产| 热久久久久久久| 三级一区在线视频先锋| 亚洲欧美欧美一区二区三区| 91麻豆免费视频| 国产在线精品一区在线观看麻豆| 亚洲 欧美综合在线网络| 国产一区二区三区在线观看免费视频| 日韩午夜精品视频| 日本麻豆一区二区三区视频| 日韩黄色在线观看| 日韩欧美电影在线| 一区二区国产视频| 色欧美片视频在线观看| 久久精品免费看| 国产日产欧美一区二区三区| 一本色道久久加勒比精品| 蜜臀av一区二区三区| 成人自拍视频在线| 国模娜娜一区二区三区| 三级久久三级久久| 一本大道av伊人久久综合| 成a人片亚洲日本久久| 91麻豆精品国产综合久久久久久| 国产精品538一区二区在线| 日韩av在线发布| 国产精品―色哟哟| 日韩国产精品久久| 欧美高清你懂得| 99视频精品全部免费在线| 精品免费日韩av| 欧美三级三级三级| 国产精品国模大尺度视频| 免费观看成人鲁鲁鲁鲁鲁视频| 7777精品久久久大香线蕉| 国产一区二区影院| 91视频免费观看| 久久精品夜夜夜夜久久| 在线区一区二视频| 午夜精品久久久久久久| 日本精品视频一区二区三区| 久久精品免费在线观看| 亚洲免费观看视频| 中文字幕精品—区二区四季| 中文字幕av在线一区二区三区| 久久午夜色播影院免费高清| 色琪琪一区二区三区亚洲区| 日韩欧美一区二区在线视频| 毛片av一区二区| 亚洲宅男天堂在线观看无病毒| 欧美精品一区二区三区蜜桃| 婷婷综合另类小说色区| 国产欧美一区二区精品久导航| 国内精品久久久久影院薰衣草| 另类小说综合欧美亚洲| 色综合久久久久综合体桃花网| 日韩毛片视频在线看| 97精品国产97久久久久久久久久久久| 国产精品久久久久久久午夜片| 国产成人精品三级麻豆| 欧美日韩中字一区| 经典一区二区三区| 99久久综合色| 国产乱对白刺激视频不卡| 一区二区三区高清在线| 偷窥国产亚洲免费视频| 国产精品电影院| 欧美tickling挠脚心丨vk| 91精品福利在线一区二区三区| 久久精品99国产精品日本| 亚洲视频在线观看一区| 亚洲欧美日韩国产综合在线| 2020国产成人综合网| 欧美日韩亚洲综合一区二区三区| 青草国产精品久久久久久| 国产精品久久综合| 538prom精品视频线放| 69堂精品视频| 日本不卡视频在线观看| 国产精品1区2区3区在线观看| 国产精品国产三级国产普通话蜜臀| 久久久久99精品一区| 国产成人午夜片在线观看高清观看| 在线观看免费一区| 91在线观看高清| 色域天天综合网| 丝袜脚交一区二区| 国产曰批免费观看久久久| 自拍偷拍欧美激情| 99国产欧美另类久久久精品| 亚洲天堂2016| 国产mv日韩mv欧美| 日本免费在线视频不卡一不卡二| 国产91露脸合集magnet| 欧美一区二区在线免费观看| 欧美综合亚洲图片综合区| 久久久噜噜噜久久人人看| 成人av在线一区二区三区| 日本三级亚洲精品| 色一情一伦一子一伦一区| av亚洲产国偷v产偷v自拍| 99久久免费精品高清特色大片| 欧美性淫爽ww久久久久无| 日韩一区二区在线观看| 精品亚洲成av人在线观看| 色综合色综合色综合色综合色综合|