C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/12 11:19

BBC 研究:AI 聊天機(jī)器人總結(jié)新聞錯誤百出,分不清事實和觀點(diǎn)

IT之家  遠(yuǎn)洋

英國廣播公司(BBC)近期開展了一項大規(guī)模研究,旨在評估人工智能(AI)聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究結(jié)果顯示,這些工具在生成新聞總結(jié)時存在大量準(zhǔn)確性問題。

研究中,BBC 讓這些 AI 工具對 100 篇新聞報道進(jìn)行總結(jié),并基于總結(jié)提出內(nèi)容相關(guān)問題。結(jié)果顯示,AI 生成的答案中有超過一半存在“顯著問題”,其中約五分之一的答案引入了明顯的事實錯誤,這些錯誤包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息。BBC 新聞與時事首席執(zhí)行官德博拉 特內(nèi)斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章內(nèi)容時,超過十分之一的‘引文’被篡改或根本不存在于原文中。”

此外,研究還發(fā)現(xiàn),AI 助手在新聞總結(jié)時無法區(qū)分事實與觀點(diǎn),也無法辨別新聞報道中當(dāng)下的信息和歷史存檔的信息,在給出答案的時候還容易摻入主觀的觀點(diǎn)。特內(nèi)斯表示:“這些 AI 工具所生成的結(jié)果往往是各種問題的混合體,與消費(fèi)者所期望的經(jīng)過驗證的事實和清晰性相去甚遠(yuǎn)。”

值得注意的是,BBC 的研究還發(fā)現(xiàn),微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結(jié)時出現(xiàn)了更復(fù)雜的問題,相較于 ChatGPT 和 Perplexity,它們在區(qū)分觀點(diǎn)與事實、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)不佳。

IT之家注意到,AI 工具的準(zhǔn)確性問題并非僅限于這些聊天機(jī)器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯誤標(biāo)題而引發(fā)爭議,導(dǎo)致其暫時停用該功能,并遭到新聞機(jī)構(gòu)和自由團(tuán)體的批評。

BBC 呼吁,在與 AI 服務(wù)提供商進(jìn)行深入對話并找到解決方案之前,應(yīng)暫停使用 AI 生成的新聞總結(jié)。特內(nèi)斯表示:“我們希望通過合作,共同尋找解決辦法。”

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141