2025/2/12 11:19

BBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點(diǎn)

IT之家遠(yuǎn)洋

英國廣播公司（BBC）近期開展了一項大規(guī)模研究，旨在評估人工智能（AI）聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而，研究結(jié)果顯示，這些工具在生成新聞總結(jié)時存在大量準(zhǔn)確性問題。

研究中，BBC 讓這些 AI 工具對 100 篇新聞報道進(jìn)行總結(jié)，并基于總結(jié)提出內(nèi)容相關(guān)問題。結(jié)果顯示，AI 生成的答案中有超過一半存在“顯著問題”，其中約五分之一的答案引入了明顯的事實錯誤，這些錯誤包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息。BBC 新聞與時事首席執(zhí)行官德博拉特內(nèi)斯（Deborah Turness）指出：“AI 助手在引用 BBC 文章內(nèi)容時，超過十分之一的‘引文’被篡改或根本不存在于原文中。”

此外，研究還發(fā)現(xiàn)，AI 助手在新聞總結(jié)時無法區(qū)分事實與觀點(diǎn)，也無法辨別新聞報道中當(dāng)下的信息和歷史存檔的信息，在給出答案的時候還容易摻入主觀的觀點(diǎn)。特內(nèi)斯表示：“這些 AI 工具所生成的結(jié)果往往是各種問題的混合體，與消費(fèi)者所期望的經(jīng)過驗證的事實和清晰性相去甚遠(yuǎn)。”

值得注意的是，BBC 的研究還發(fā)現(xiàn)，微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結(jié)時出現(xiàn)了更復(fù)雜的問題，相較于 ChatGPT 和 Perplexity，它們在區(qū)分觀點(diǎn)與事實、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)不佳。

IT之家注意到，AI 工具的準(zhǔn)確性問題并非僅限于這些聊天機(jī)器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯誤標(biāo)題而引發(fā)爭議，導(dǎo)致其暫時停用該功能，并遭到新聞機(jī)構(gòu)和自由團(tuán)體的批評。

BBC 呼吁，在與 AI 服務(wù)提供商進(jìn)行深入對話并找到解決方案之前，應(yīng)暫停使用 AI 生成的新聞總結(jié)。特內(nèi)斯表示：“我們希望通過合作，共同尋找解決辦法。”

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

微軟蘋果

華工科技：全系列AI光模塊訂單還在激增
C114通信網(wǎng) 水易4-18
等你來戰(zhàn)！GSMA×GTI 新通話×AI挑戰(zhàn)賽報名通道已正式開啟
C114通信網(wǎng) 4-18
中國移動攜手華為打通基于“滿血版”DeepSeek的新通話首呼
C114通信網(wǎng) 4-18
乘客更稱心，維護(hù)更省心——北京移動以AI+智算筑基京石高鐵智能通信網(wǎng)絡(luò)
C114通信網(wǎng) 4-18

BBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點(diǎn)

BBC 研究：AI 聊天機(jī)器人總結(jié)新聞錯誤百出，分不清事實和觀點(diǎn)