首頁>要聞>熱點(diǎn)
超七成受訪大學(xué)生希望提升研發(fā)技術(shù)減少“AI幻覺”
當(dāng)AI釋放“信息煙霧彈”——
超七成受訪大學(xué)生希望提升研發(fā)技術(shù)減少“AI幻覺”
“AI在文獻(xiàn)檢索上的效率確實(shí)無可替代,能快速聚合相關(guān)研究,但當(dāng)AI撰寫新聞稿時,偶爾會對信息進(jìn)行錯誤拼接,甚至虛構(gòu)信息來填補(bǔ)報道空白。”作為新聞傳播相關(guān)專業(yè)學(xué)生,就讀于中國海洋大學(xué)的瞿銳捷對AI的使用始終保持警惕,這種警惕源于對新聞?wù)鎸?shí)原則的堅(jiān)守:“新聞的生命在于真實(shí),而AI生成的內(nèi)容往往游走在‘看似合理’與‘事實(shí)錯誤’的灰色地帶,稍不注意就會觸碰新聞失實(shí)的紅線。”
所謂“AI幻覺”,指的是AI會生成看似合理實(shí)際卻錯誤的信息,常見的表現(xiàn)是編造一些不存在的事實(shí)或細(xì)節(jié)。近期,中國青年報·中青校媒面向全國各地的大學(xué)生針對“AI幻覺”話題開展問卷調(diào)查,共回收有效問卷1461份。調(diào)查顯示,97.%受訪大學(xué)遇到過AI提供錯誤或虛假信息的情況。
AI給出的就是“完美答案”?
來自華南農(nóng)業(yè)大學(xué)歷史學(xué)專業(yè)的戴瑞對AI并不陌生。戴瑞第一次領(lǐng)教AI幻覺,是在寫論文找文獻(xiàn)時。“把主題‘喂’給AI,它會編出不存在的學(xué)者、論文,還像模像樣的,但去知網(wǎng)一搜,根本查不到相關(guān)信息。”如果不加核查,那些虛構(gòu)的作者和論文都能被老師一眼識破。
除了編造文獻(xiàn),AI還會犯“張冠李戴”的錯。戴瑞曾讓AI梳理歷史事件,結(jié)果年份和史實(shí)對不上,“比如把A年份的事件說成在B年份發(fā)生,或者把甲做的事說成乙做的”。這些錯誤讓她不得不返工,“本以為大功告成,結(jié)果前面全是虛假信息,只能推倒重來,重新核對史料”。
調(diào)查顯示,在受訪大學(xué)生使用AI時,57.63%受訪者遇到過數(shù)據(jù)或案例引用錯誤,55.03%受訪者面臨過學(xué)術(shù)參考文獻(xiàn)推薦錯誤,50.86%受訪者遇到過AI給出的常識性知識錯誤。
在上海一所高校讀博士的申杰也經(jīng)常遇到AI反饋虛假文獻(xiàn)的情況。AI會給出一些文獻(xiàn)的鏈接,但點(diǎn)進(jìn)去后是“404”,也有時AI不提供來源鏈接,申杰按照文獻(xiàn)名到學(xué)術(shù)論文網(wǎng)站上檢索后,發(fā)現(xiàn)“查無此文”。“當(dāng)我給AI工具反饋這篇文章不存在時,它還會‘嘴硬’,說這是因?yàn)槲覜]有認(rèn)真檢索,還會給出一個假的論文來源鏈接。”當(dāng)申杰拿出“實(shí)錘”——檢索截圖,AI工具則一言不發(fā),或者開始道歉。
即將就讀于復(fù)旦大學(xué)馬克思主義哲學(xué)專業(yè)的班世釗,回想起去年決定研究生報考方向時咨詢AI的情景,覺得AI給出的建議并不總是貼合實(shí)際。
“雖然AI對于標(biāo)準(zhǔn)明晰的指標(biāo)分析非常理性,但是一旦涉及更加復(fù)雜的情感決策時,它就容易出現(xiàn)偏離實(shí)際甚至是胡編亂造的情況。AI為了說服我選擇一位導(dǎo)師,編造出了這位老師從未公開發(fā)表過的言論。”
在一次簡歷投遞前,就讀于華東師范大學(xué)播音與主持藝術(shù)專業(yè)的高育格請AI潤色她的簡歷。“AI為了‘佐證’我的能力,編造出了這個項(xiàng)目的商業(yè)交易總額、場觀人次等數(shù)據(jù)。”作為活動的親歷者,她感到啼笑皆非。
談及AI幻覺的社會影響,瞿銳捷很認(rèn)可北京大學(xué)新聞與傳播學(xué)院教授胡泳關(guān)于“AI內(nèi)容生態(tài)”的觀點(diǎn):“當(dāng)社交媒體90%的內(nèi)容由AI生成,且公眾缺乏甄別能力時,就會陷入李普曼所說的‘?dāng)M態(tài)環(huán)境’困境——人們認(rèn)知的世界不再是真實(shí)世界,而是AI建構(gòu)的虛假鏡像。”瞿銳捷覺得更值得警惕的是AI的認(rèn)知偏向,“比如我曾問過不同國家的AI模型什么是‘世界最偉大的四個字’,它們會給出不同答案,這本質(zhì)上是算法背后的價值預(yù)設(shè)在起作用,若被當(dāng)作‘客觀事實(shí)’傳播,會潛移默化地影響公眾。”
談及AI幻覺的影響,戴瑞認(rèn)為對學(xué)術(shù)沖擊很大:“歷史研究靠史實(shí)說話,AI編造的虛假史實(shí)完全不符合規(guī)范。要是連年代、事件都錯了,基本史實(shí)都保證不了。”
調(diào)查顯示,導(dǎo)致作業(yè)/論文/工作出現(xiàn)錯誤(57.70%)、浪費(fèi)大量時間驗(yàn)證信息(52.29%)、誤導(dǎo)決策或研究方向(44.35%)都是受訪大學(xué)生認(rèn)為AI幻覺帶來的不良影響。
“寫專業(yè)課作業(yè)、搜尋史料時不用AI,得自己翻書查文獻(xiàn);但寫諸如發(fā)言稿、總結(jié)綱要時,使用能節(jié)省時間。”戴瑞強(qiáng)調(diào),AI帶來的是靈感還是抄襲,全在一念之間,“別讓自己的思維變懶惰、變僵化。”
理解AI規(guī)則,撥開信息迷霧
申杰在一則新聞上看到,一位用戶向AI工具提問,某座城市的立交橋?yàn)槭裁床捎媚撤N設(shè)計(jì)方式。然而,這個問題本身就有問題,該城市的立交橋設(shè)計(jì)并非用戶描述的那樣,但AI工具沒有指出問題的謬誤,而是迎合提問者,編出一套理由來回應(yīng)。“有些AI模型的底層邏輯,就是要優(yōu)先回答用戶的問題,而不是先判斷用戶提問是否符合實(shí)情。還有一些AI工具不聯(lián)網(wǎng),就更容易給出偏離事實(shí)的答案。”
班世釗觀察到,當(dāng)AI無法調(diào)用已有資源解答他的困惑時,它往往會搜尋甚至編造一些看似和他情形相近的例子試圖說服他。有時AI回復(fù)“那么我可以從以下具體案例入手”“應(yīng)該結(jié)合一些具體案例”,事實(shí)上這些案例往往真假參半。
AI的這一特性引起了班世釗的興趣。他比較了幾款熱門AI軟件的解答思路,感受到“AI幻覺”的產(chǎn)生或許是源自它們極強(qiáng)的“服務(wù)意識”:它們一直試圖為用戶提供邏輯閉環(huán)、有頭有尾的“滿分”解答,即便是面對超出它分析能力的提問,它也會“冒險”作答。
在新聞實(shí)操中,瞿銳捷多次遭遇AI的“幻覺陷阱”。例如在專業(yè)課上,老師要求模擬報道珠海某新聞事件時,由于官方信源有限,AI竟自行編撰“內(nèi)部文件”和“匿名訪談”來補(bǔ)充細(xì)節(jié)。“這些內(nèi)容邏輯自洽,甚至標(biāo)注了‘據(jù)知情人士透露’,但溯源后我發(fā)現(xiàn)這些全是虛構(gòu)的——這其實(shí)是AI在訓(xùn)練數(shù)據(jù)不足時,通過算法預(yù)測進(jìn)行的‘信息補(bǔ)全’,但這卻違背了新聞采集中‘信源可追溯’的基本要求。”
當(dāng)懷疑AI提供的信息存在問題時,65.43%受訪者會使用其他搜索渠道交叉驗(yàn)證,60.37%受訪者會查閱權(quán)威書籍或者文獻(xiàn),45.79%受訪者會咨詢老師或者專業(yè)人士,42.09%受訪者會通過實(shí)踐操作驗(yàn)證。
如今,核實(shí)信息已經(jīng)成為高育格使用AI時必不可少的步驟。她有時覺得自己不像是發(fā)出指令的用戶,反而像是AI的檢測員。雖然大部分錯誤她能夠一眼看出,但是面對陌生領(lǐng)域的知識時,她也會感到力不從心,而一些“七分真三分假”的文本更是大大增加了她檢驗(yàn)的時間成本。“每次大費(fèi)周章核實(shí)信息之后,我都會產(chǎn)生‘還不如自己寫’的心情。”
申杰發(fā)現(xiàn),一些AI工具在給出涉及健康、安全領(lǐng)域的答案時,會有特別提示。他最近幫朋友詢問了耳鳴和手指發(fā)麻可能是什么問題,AI工具回答的第一句話,就是“重要聲明:我是人工智能,無法提供醫(yī)療建議。以下信息僅供參考……強(qiáng)烈建議盡快咨詢醫(yī)生”,“盡快咨詢醫(yī)生”還被加粗顯示。“這在一定程度上能讓用戶警惕,AI的話不能全信。”
善用而不輕信,用理性思維校準(zhǔn)“AI濾鏡”
“會不會是我們對于AI的期待太高了?”對于班世釗而言,“AI幻覺”的存在使他重新思考自己與AI的關(guān)系。他一度認(rèn)為,AI所呈現(xiàn)出的超強(qiáng)檢索、整合與輸出能力能夠幫助他抵達(dá)思考的最后一站;而在一次次復(fù)雜情境之中,他意識到AI終究難以深入理解個體的真實(shí)處境,AI可以成為他的有力助手,但不該由它們按下決策鍵。
調(diào)查發(fā)現(xiàn),12.66%受訪者對AI幻覺表示非常擔(dān)憂,48.67%受訪者表示比較擔(dān)憂并在使用時格外謹(jǐn)慎,32.03%受訪者認(rèn)為這是技術(shù)發(fā)展的正常現(xiàn)象,6.64%受訪者對AI幻覺并不擔(dān)憂。
為了避免被AI誤導(dǎo),戴瑞會用知網(wǎng)或?qū)I(yè)數(shù)據(jù)庫交叉驗(yàn)證。她盡量不去依賴求助老師,主要靠自己查證,“老師大多反對用AI找史料,認(rèn)為這會丟了歷史學(xué)科的嚴(yán)謹(jǐn)性,但支持用AI做總結(jié)或梳理思路”。
在瞿銳捷看來,在AI時代必須強(qiáng)化AI素養(yǎng):“這不僅是辨別信息真?zhèn)危斫釧I生成內(nèi)容的邏輯——它本質(zhì)上是對既有數(shù)據(jù)的重組,而非原創(chuàng)。就像寫新聞時,AI可以幫你提煉政策背景的大綱,但采訪細(xì)節(jié)、信源核實(shí)必須親力親為。”他建議學(xué)校在課程體系中融入“AI內(nèi)容甄別”模塊:“比如通過案例教學(xué),分析AI如何編造信源,或開展模擬報道實(shí)訓(xùn),要求用AI輔助但必須標(biāo)注每處信息的溯源過程,以此強(qiáng)化‘求證意識’。”
要判斷AI給出的信息是真是假,用戶需要哪些層面的能力?
申杰專門就此問題詢問了AI,得到的答案是需要知識儲備、批判性思維和主動查證的能力,以及對AI工作原理的理解和使用AI工具的實(shí)踐經(jīng)驗(yàn)。其中后兩項(xiàng)是可以通過特定的培養(yǎng)和訓(xùn)練來實(shí)現(xiàn)的,正因如此,他覺得提升AI素養(yǎng)、彌合數(shù)字鴻溝的科普課程是必要的。
“代際反哺也很重要,年輕人也可以給自己的長輩多做普及。”申杰覺得如果把AI當(dāng)作“大腦”來使用,可能比較容易被AI幻覺影響,“但如果仍保有自己的思考,只把AI當(dāng)作輔助消化的‘腸胃’,能更好地排除AI生成內(nèi)容的不良影響”。
調(diào)查發(fā)現(xiàn),74.26%受訪者希望提升研發(fā)技術(shù)、優(yōu)化算法模型、嚴(yán)格數(shù)據(jù)治理,63.79%受訪者希望完善人工審核干預(yù)與用戶反饋機(jī)制,58.25%受訪者希望開發(fā)實(shí)時糾錯提示功能,50.31%受訪者期待AI向用戶明確標(biāo)注信息可信度,39.01%受訪者希望制定行業(yè)標(biāo)準(zhǔn)、加強(qiáng)監(jiān)管力度與從業(yè)人員教育培訓(xùn)。
瞿銳捷最期待AI工具“信源透明度”能夠提高:“就像學(xué)術(shù)論文必須標(biāo)注參考文獻(xiàn),AI生成的每一條事實(shí)性信息都應(yīng)附上溯源鏈接,這可以降低用戶的核實(shí)成本。”
在高育格看來,AI對用戶足夠“坦誠”或許可以成為研發(fā)團(tuán)隊(duì)的下一步目標(biāo)。如果信息并非源自權(quán)威期刊或是官方報道,那么AI應(yīng)當(dāng)充分、清晰地提示這一點(diǎn)。“我所需要的不是一個完美的外殼,而是有扎實(shí)基礎(chǔ)的答卷。”
(應(yīng)受訪者要求,申杰為化名)
實(shí)習(xí)生 賈明皓 何燁 中青報·中青網(wǎng)記者 王軍利 畢若旭 來源:中國青年報
2025年07月14日 06版
編輯:李敏杰