天津8月14日電(記者 孫玲玲)記者13日從南開大學獲悉,近日,南開大學計算機學院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現有AI檢測方法的性能不足,並創新性地提出了「直接差異學習」(Direct Discrepancy Learning,DDL)優化策略,教會AI用「火眼金睛」辨別人機不同,實現AI檢測性能的巨大突破。相關成果論文已被計算機多媒體領域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。 圖為南開大學研究團隊提出的DetectAnyLLM檢測框架以及MIRAGE基準數據集亮點全析。(南開大學 供圖) 近日,OpenAI發布新一代人工智慧模型GPT-5,再次引發全球關注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從「新奇玩具」變成學習、工作中不可或缺的「生產力工具」,其伴生問題也日益凸顯:AI經常會「一本正經地胡說八道」,生成看似合理的虛假信息,造成「AI幻覺」;依賴AI工具代寫作業甚至畢業論文,極大衝擊著學術誠信和規範;論文AI率檢測系統有待完善,論文被誤判的問題時有發生……如何精準識別AI生成內容,成為亟待解決的熱點問題。 據了解,目前AI生成內容檢測主要有兩種路線,一種是「基於訓練的檢測方法」,使用特定數據訓練一個專用的分類模型;另一種是「零樣本檢測方法」,直接使用一個預訓練的語言模型並設計某種分類標準進行分類。 圖為AI生成內容檢測示意圖。(南開大學 供圖) 多項研究表明,現有檢測方法在應對複雜的現實場景時常顯不足。此前也曾有權威媒體報導,《荷塘月色》《流浪地球》等經典作品被某常用論文AI率檢測系統檢出高AI率。 為何現有的AI檢測工具會「誤判」?論文第一作者、南開大學計算機學院計算機科學卓越班2023級本科生付嘉晨解釋道:「如果把AI文本檢測比作一場考試,檢測器的訓練數據等同於日常練習題,現有檢測方法是機械刷題、死記硬背答題的固定套路,難以學會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。」 「要想實現通用檢測,理論上需收集所有大模型的數據進行訓練,但在大模型迭代飛速的今天幾乎不可能。」付嘉晨說,讓檢測器真正學會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關鍵。 為此,研究團隊提出了DDL方法另闢蹊徑,通過直接優化模型預測的文本條件概率差異與人為設定的目標值之間的差距,幫助模型學習AI文本檢測的內在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。 「使用DDL訓練得到的檢測器如同有了『火眼金睛』,即便只『學習』過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內容。」付嘉晨說。 團隊還提出了一個全面的測試基準數據集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構造了接近十萬條人類-AI文本對。 「MIRAGE是目前唯一聚焦於對商用大語言模型檢測的基準數據集。直觀地說,之前的基準數據集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯合命題,形成一套高難度、又有代表性的檢測試卷。」論文通訊作者、南開大學計算機學院副教授郭春樂說。 在MIRAGE的測試結果顯示,現有檢測器的準確率從在簡單數據集上的90%驟降至約60%;而使用DDL訓練的檢測器仍保持85%以上的準確率。與史丹福大學提出的DetectGPT相比,性能相對提升71.62%;與馬裡蘭大學、卡內基梅隆大學等共同提出的Binoculars方法相比,性能相對提升68.03%。 「AIGC發展日新月異,我們將持續迭代升級評估基準和技術,致力於實現更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。」研究團隊負責人、南開大學計算機學院教授李重儀說。(完)
中國新聞周刊記者:張馨予 發於2025.8.11總第1199期《中國新聞周刊》雜誌 採訪進行沒多久,我就意識到,這是一個有關「如何做出合理決策」的故事。 在這個故事中,儘管幾條運河是明面上的主角,但隱形的主角其實是推動修建運河的幾個省份和研究運河問題的一眾專家。幾條運河該不該修?該怎麼修?各方站在不同立場,各有主張,都在盡力提出依據,以求獲得更大支持。 有研究者極為振奮地提出「運河時代」的說法,我完全能夠理解他為什麼會這樣想。 2024年1月底,我第一次做平陸運河的選題。當時,我換乘了幾種不同的交通工具,在結束最後一段顛簸的泥路後,到達位於廣西欽州靈山縣的平陸運河馬道樞紐。那是一個大霧天,即便已經抵達現場,仍然很難看清工程的全貌,工程師開車帶我下到60多米深的基坑,我才看清十幾臺正在作業的機械。工程師指著我們的腳下說,馬道樞紐建成後,將是世界上規模最大的內河省水船閘,目前這裡正在建船閘閘室的邊墩。 在這片原本寂靜的山野中,即將誕生一個巨大的超級工程。在建設者的設想中,它將改寫廣西乃至整個西南地區的發展格局。這很難不讓參與其中的人感到激動。 而其他還未修建、仍在進行前期研究工作的運河,也承載著不同地方的「騰飛」理想。試想一下,在中國的不同省份,多個超級工程陸續開建,它們可能會徹底改寫一些不臨海省份的地理、經濟、人口格局,以線帶面,以各種方式推動區域經濟發展。 不過,隨著採訪不斷深入,我開始看到宏大敘事的更多細節。 今年4月,我再次來到廣西,沒有去平陸運河的施工一線,而是去了平陸運河沿線城市南寧和欽州的產業園區。對於廣西乃至西南地區而言,如果想要讓運河真正改寫區域發展格局,需要更多有前景的產業因運河聚集。然而,這一過程並不非常順利。 在南寧,雖然有比亞迪和太陽紙業這兩個百億項目已經直接或間接因為平陸運河而來,但百億項目也僅有這兩個,是當地政府反覆提及的「獨苗」。在欽州,相關部門始終沒有給出一份具有說服力的平陸運河經濟帶建設規劃,當地也沒有招引到能帶動工業發展的大項目。短期來看,平陸運河似乎只會穿過欽州,卻很難真正給城市帶來足夠的效益。顯然,平陸運河帶來的發展機遇不會隨著運河通航自然出現,而是要在各方的研究、引導下創造,這本身就不是一件容易的事。 至於其他幾條仍停留在規劃中的運河,它們是否能夠承載各方的厚望,發揮設想中的效益,這是一個更難回答的問題。爭論很多,兩方觀點的聲量都很大,沒有哪一種聲音蓋過了另一種。 兩位受訪者的觀點讓我記憶深刻。交通運輸部水運科學研究院研究員謝燮說,對相關工程研究機構來說,拿到一個項目,就是要論證其有必要、工程上可行。但他覺得,「需要建立不可行論證的機制,讓反對者進行數據翔實的不可行論證,讓反對的聲量更大,這樣就能有效避免巨量的無效投資,繼續加碼本已超高的地方債務」。 香港大學地理系原主任王緝憲則說,各種工程的可行性論證是不公開的,基本是認同這個工程的人來論證,那麼一定會論證出工程可行,「有時候,需要我這種不管不顧的人出來說幾句」。 在聽完兩方的聲音後,我並沒有堅定地站在哪一方,只是更加確信了這個故事的主題——這確實是一個有關「如何做出合理決策」的故事,而決策的做出不應該是容易的。 《中國新聞周刊》2025年第29期 聲明:刊用《中國新聞周刊》稿件務經書面授權
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
31279
87
2025-11-18 14:11
52176
47
2025-11-18 14:11
24189
43
2025-11-18 14:11
85972
43
2025-11-18 14:11
73589
42
2025-11-18 14:11
31598
71
2025-11-18 14:11
52194
39
2025-11-18 14:11
93671
63
2025-11-18 14:11
41578
78
2025-11-18 14:11
83621
64
2025-11-18 14:11
43658
28
2025-11-18 14:11
74162
54
2025-11-18 14:11
23749
16
2025-11-18 14:11
36984
41
2025-11-18 14:11
73482
68
2025-11-18 14:11
59346
28
2025-11-18 14:11
21465
61
2025-11-18 14:11
51684
16
2025-11-18 14:11
23746
74
2025-11-18 14:11
48621
19
2025-11-18 14:11
51762
16
2025-11-18 14:11
43796
19
2025-11-18 14:11
52148
84
2025-11-18 14:11
39852
93
2025-11-18 14:11
41983
73
2025-11-18 14:11
38425
93
2025-11-18 14:11
19253
59
2025-11-18 14:11
51234
85
2025-11-18 14:11
62175
68
2025-11-18 14:11
29536
41
2025-11-18 14:11
46391
46
2025-11-18 14:11
39576
91
2025-11-18 14:11
36218
68
2025-11-18 14:11
84392
14
2025-11-18 14:11
38629
25
2025-11-18 14:11
68372
61
2025-11-18 14:11
78193
39
2025-11-18 14:11
46723
12
2025-11-18 14:11
65128
92
2025-11-18 14:11
79145
69
2025-11-18 14:11
87243
45
2025-11-18 14:11
52749
18
2025-11-18 14:11
92615
15
2025-11-18 14:11
21576
85
2025-11-18 14:11
75946
96
2025-11-18 14:11
31765
19
2025-11-18 14:11
15639
31
2025-11-18 14:11
21398
54
2025-11-18 14:11
13842
54
2025-11-18 14:11
65287
35
2025-11-18 14:11
39675
59
2025-11-18 14:11
89136
31
2025-11-18 14:11
35867
69
2025-11-18 14:11
| 杏仁直播 | 心动直播 |
| 美女直播app | |
| 妲己直播 | 魅影app免费下载安装 |
| 趣播 | |
| 西瓜直播 | 少妇免费直播 |
| 橙色直播 | |
| 成人抖阴 | 花蝴蝶app直播 |
| 花儿直播 | |
| 花儿直播 | 妖精直播 |
| 山猫直播 | |
| 蜜糖直播 | 六月直播 |
| 小白兔直播 | |
| 打开b站看直播 | 山猫直播 |
| 香蕉app免费下载 | |
| 五楼直播 | 抖音成人版 |
| 绿茵直播 | |
| 520直播 | 奇秀直播 |
| 凤凰网直播 | |
| 春雨直播 | 花间直播 |
| 97播播 | |