天津8月14日電(記者 孫玲玲)記者13日從南開大學獲悉,近日,南開大學計算機學院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現有AI檢測方法的性能不足,並創新性地提出了「直接差異學習」(Direct Discrepancy Learning,DDL)優化策略,教會AI用「火眼金睛」辨別人機不同,實現AI檢測性能的巨大突破。相關成果論文已被計算機多媒體領域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。 圖為南開大學研究團隊提出的DetectAnyLLM檢測框架以及MIRAGE基準數據集亮點全析。(南開大學 供圖) 近日,OpenAI發布新一代人工智慧模型GPT-5,再次引發全球關注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從「新奇玩具」變成學習、工作中不可或缺的「生產力工具」,其伴生問題也日益凸顯:AI經常會「一本正經地胡說八道」,生成看似合理的虛假信息,造成「AI幻覺」;依賴AI工具代寫作業甚至畢業論文,極大衝擊著學術誠信和規範;論文AI率檢測系統有待完善,論文被誤判的問題時有發生……如何精準識別AI生成內容,成為亟待解決的熱點問題。 據了解,目前AI生成內容檢測主要有兩種路線,一種是「基於訓練的檢測方法」,使用特定數據訓練一個專用的分類模型;另一種是「零樣本檢測方法」,直接使用一個預訓練的語言模型並設計某種分類標準進行分類。 圖為AI生成內容檢測示意圖。(南開大學 供圖) 多項研究表明,現有檢測方法在應對複雜的現實場景時常顯不足。此前也曾有權威媒體報導,《荷塘月色》《流浪地球》等經典作品被某常用論文AI率檢測系統檢出高AI率。 為何現有的AI檢測工具會「誤判」?論文第一作者、南開大學計算機學院計算機科學卓越班2023級本科生付嘉晨解釋道:「如果把AI文本檢測比作一場考試,檢測器的訓練數據等同於日常練習題,現有檢測方法是機械刷題、死記硬背答題的固定套路,難以學會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。」 「要想實現通用檢測,理論上需收集所有大模型的數據進行訓練,但在大模型迭代飛速的今天幾乎不可能。」付嘉晨說,讓檢測器真正學會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關鍵。 為此,研究團隊提出了DDL方法另闢蹊徑,通過直接優化模型預測的文本條件概率差異與人為設定的目標值之間的差距,幫助模型學習AI文本檢測的內在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。 「使用DDL訓練得到的檢測器如同有了『火眼金睛』,即便只『學習』過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內容。」付嘉晨說。 團隊還提出了一個全面的測試基準數據集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構造了接近十萬條人類-AI文本對。 「MIRAGE是目前唯一聚焦於對商用大語言模型檢測的基準數據集。直觀地說,之前的基準數據集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯合命題,形成一套高難度、又有代表性的檢測試卷。」論文通訊作者、南開大學計算機學院副教授郭春樂說。 在MIRAGE的測試結果顯示,現有檢測器的準確率從在簡單數據集上的90%驟降至約60%;而使用DDL訓練的檢測器仍保持85%以上的準確率。與史丹福大學提出的DetectGPT相比,性能相對提升71.62%;與馬裡蘭大學、卡內基梅隆大學等共同提出的Binoculars方法相比,性能相對提升68.03%。 「AIGC發展日新月異,我們將持續迭代升級評估基準和技術,致力於實現更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。」研究團隊負責人、南開大學計算機學院教授李重儀說。(完)
上海8月8日電 (記者 鄭瑩瑩)OpenAI最新發布其人工智慧模型GPT-5,引發業界關注。AGI(通用人工智慧)加速來了嗎?北京開放傳神科技有限公司(OpenCSG)創始人兼CEO陳冉8日就此話題接受記者採訪時表示,目前行業模型的能力還處於中早期,在通往AGI的方向上還需要大幅提升,而這其中有個關鍵要素是適配的原生數據不足。 中國首個大模型創新生態社區——模速空間地處上海徐匯區。北京開放傳神科技有限公司是首批入駐模速空間的企業之一。 陳冉解釋,網際網路時代,伴隨各種App的湧現,用戶交互方式發生顯著變化,由此帶來信息爆炸;而AI(人工智慧)時代,真正的新交互方式還沒到來,包括人與智能體、智能體與智能體之間的信息交互還沒達到一個成熟的階段,仍待發展,因此能「投餵」給模型的數據也還需積攢、沉澱。 北京智譜華章科技股份有限公司總裁王紹蘭此前在2025世界人工智慧大會上指出,從大模型到AGI,行業還有很長的路要走。「如果比照自動駕駛分級,把從大模型到AGI分成5級的話,我們可能只在第3級,這條路走了一半都不到。大模型的基礎模型部分還在快速地發展,我們還要持續去做,也願意投入更大的力量。」 在大模型發展加速期,大模型企業該向左走(繼續大量投入基礎模型研發)還是向右走(深入落地來構建商業閉環)?行業怎麼平衡基礎模型的投入以及應用落地的努力? 王紹蘭認為,除了基礎模型「底座」,企業也要持續推動大模型的商業化應用。「因為大模型就是拿來用的,如果大模型一直是純理論研究,不去做商業化落地,我們怎麼證明大模型真正能改變產業呢?我們其實不需要等到大模型真的引領生產力革命的那一天,因為大模型的能力在不斷地擴充、不斷地發展。」 上海稀宇科技有限公司(MiniMax)副總裁嚴奕駿認為,自研底層技術能為企業帶來更高的發展上限,而產品能讓用戶體驗到大模型能力,從而進一步提高AI滲透率。(完)
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
68215
37
2025-12-29 13:00
78923
39
2025-12-29 13:00
38591
95
2025-12-29 13:00
58967
85
2025-12-29 13:00
48729
41
2025-12-29 13:00
14267
25
2025-12-29 13:00
15638
93
2025-12-29 13:00
41896
84
2025-12-29 13:00
38796
73
2025-12-29 13:00
79368
35
2025-12-29 13:00
16942
65
2025-12-29 13:00
15469
19
2025-12-29 13:00
49315
29
2025-12-29 13:00
38547
37
2025-12-29 13:00
23695
67
2025-12-29 13:00
31497
67
2025-12-29 13:00
59321
26
2025-12-29 13:00
28475
98
2025-12-29 13:00
49213
51
2025-12-29 13:00
87913
58
2025-12-29 13:00
23567
97
2025-12-29 13:00
54813
89
2025-12-29 13:00
58917
26
2025-12-29 13:00
25417
84
2025-12-29 13:00
81625
48
2025-12-29 13:00
31675
47
2025-12-29 13:00
56483
14
2025-12-29 13:00
12457
61
2025-12-29 13:00
24798
28
2025-12-29 13:00
16735
98
2025-12-29 13:00
67238
76
2025-12-29 13:00
42765
37
2025-12-29 13:00
23914
51
2025-12-29 13:00
79182
79
2025-12-29 13:00
78621
96
2025-12-29 13:00
81935
13
2025-12-29 13:00
37286
93
2025-12-29 13:00
54637
47
2025-12-29 13:00
25671
47
2025-12-29 13:00
97132
96
2025-12-29 13:00
63741
61
2025-12-29 13:00
72964
84
2025-12-29 13:00
72496
41
2025-12-29 13:00
61572
17
2025-12-29 13:00
27438
35
2025-12-29 13:00
42567
92
2025-12-29 13:00
25846
42
2025-12-29 13:00
19682
32
2025-12-29 13:00
84529
21
2025-12-29 13:00
89516
37
2025-12-29 13:00
89412
24
2025-12-29 13:00
| 九球直播 | 仙凡直播 |
| 韩国直播 | |
| 魅影直播 | 鲨鱼直播 |
| 婬色直播 | |
| 红桃直播 | 鲨鱼直播 |
| 魅影9.1直播 | |
| 香蕉直播 | 曼城直播 |
| 蜜桃直播 | |
| 免费真人视频网站直播下载 | 春雨直播全婐app免费 |
| 蜘蛛直播 | |
| 免费直播平台 | 月夜直播 |
| 秀色直播app下载安装app | |
| 免费直播行情网站大全 | tvn直播 |
| 荔枝直播 | |
| 优直播 | 蜜桃视频 |
| 咪咕直播 | |
| 飞速直播 | 色花堂直播 |
| 荔枝直播 | |
| sky直播 | 月夜直播app夜月 |
| 蜜糖直播 | |