天津8月14日電(記者 孫玲玲)記者13日從南開大學獲悉,近日,南開大學計算機學院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現有AI檢測方法的性能不足,並創新性地提出了「直接差異學習」(Direct Discrepancy Learning,DDL)優化策略,教會AI用「火眼金睛」辨別人機不同,實現AI檢測性能的巨大突破。相關成果論文已被計算機多媒體領域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。 圖為南開大學研究團隊提出的DetectAnyLLM檢測框架以及MIRAGE基準數據集亮點全析。(南開大學 供圖) 近日,OpenAI發布新一代人工智慧模型GPT-5,再次引發全球關注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從「新奇玩具」變成學習、工作中不可或缺的「生產力工具」,其伴生問題也日益凸顯:AI經常會「一本正經地胡說八道」,生成看似合理的虛假信息,造成「AI幻覺」;依賴AI工具代寫作業甚至畢業論文,極大衝擊著學術誠信和規範;論文AI率檢測系統有待完善,論文被誤判的問題時有發生……如何精準識別AI生成內容,成為亟待解決的熱點問題。 據了解,目前AI生成內容檢測主要有兩種路線,一種是「基於訓練的檢測方法」,使用特定數據訓練一個專用的分類模型;另一種是「零樣本檢測方法」,直接使用一個預訓練的語言模型並設計某種分類標準進行分類。 圖為AI生成內容檢測示意圖。(南開大學 供圖) 多項研究表明,現有檢測方法在應對複雜的現實場景時常顯不足。此前也曾有權威媒體報導,《荷塘月色》《流浪地球》等經典作品被某常用論文AI率檢測系統檢出高AI率。 為何現有的AI檢測工具會「誤判」?論文第一作者、南開大學計算機學院計算機科學卓越班2023級本科生付嘉晨解釋道:「如果把AI文本檢測比作一場考試,檢測器的訓練數據等同於日常練習題,現有檢測方法是機械刷題、死記硬背答題的固定套路,難以學會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。」 「要想實現通用檢測,理論上需收集所有大模型的數據進行訓練,但在大模型迭代飛速的今天幾乎不可能。」付嘉晨說,讓檢測器真正學會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關鍵。 為此,研究團隊提出了DDL方法另闢蹊徑,通過直接優化模型預測的文本條件概率差異與人為設定的目標值之間的差距,幫助模型學習AI文本檢測的內在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。 「使用DDL訓練得到的檢測器如同有了『火眼金睛』,即便只『學習』過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內容。」付嘉晨說。 團隊還提出了一個全面的測試基準數據集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構造了接近十萬條人類-AI文本對。 「MIRAGE是目前唯一聚焦於對商用大語言模型檢測的基準數據集。直觀地說,之前的基準數據集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯合命題,形成一套高難度、又有代表性的檢測試卷。」論文通訊作者、南開大學計算機學院副教授郭春樂說。 在MIRAGE的測試結果顯示,現有檢測器的準確率從在簡單數據集上的90%驟降至約60%;而使用DDL訓練的檢測器仍保持85%以上的準確率。與史丹福大學提出的DetectGPT相比,性能相對提升71.62%;與馬裡蘭大學、卡內基梅隆大學等共同提出的Binoculars方法相比,性能相對提升68.03%。 「AIGC發展日新月異,我們將持續迭代升級評估基準和技術,致力於實現更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。」研究團隊負責人、南開大學計算機學院教授李重儀說。(完)
■ 視點 據報導,2024年,武漢劉小姐花2萬多元參加了中公教育的培訓班,合同約定,若未能通過筆試,中公教育會退費1.7萬元。當沒能通過考試的劉小姐找到該機構時,對方表示可以退費,但1年只能退1000元,共需17年才能退完。「等我拿到這1.7萬,我都四十多歲了。」 從斬釘截鐵的「不過包退」,演變成磨磨唧唧的「不過包騙」,作為公職類職業教育培訓的頭部機構,既然承諾「不過包退」,那就不只是一句大話,而是寫在合同裡、必須履行的契約。縱觀近年來中公教育在履約上的一些忸怩舉動,可以看出,類似「不過包退」的大包大攬式發展模式,或許已經走到了盡頭。 儘管這些年的招錄人數也有增長,但仍然跑不贏參加公考的人數。數據顯示,2009年至2025年,全國公考報名人數從105.2萬增至341.6萬。這意味著,公考競爭越來越激烈。 當此之時,機構若仍以「不過包退」為標榜,勢必面臨著巨大的退費壓力。漂亮的營收數據背後,則是日後履約的「摳摳搜搜」。 為行業長久發展計,與其總是與學員上演類似「塌樓式互動」,搞什麼1.7萬元退17年,還不如針對公考培訓市場的新情況新變化,轉型求變,踏踏實實做好內部管理,目標更精準,路徑更務實,讓每一單培訓都物有所值,而不再搞粗放式大包大攬。 這也提醒市場監管應該採取更有針對性的措施。早在2021年,教育部等6部門就通知要求,校外培訓預收費須全部進入資金託管專用帳戶。對諸如公考費用等資金管理,也應納入相應的制度化管理。比如,可以建立統一的預付費監管平臺,方便消費者在該平臺查詢培訓機構的資金託管信息等。 說到底,針對公考培訓的問題,行業要有自律,學員要有理性,監管要將其納入制度化框架,這個規模不小的市場也才能成為一個健康、長遠發展的市場。 □胡棲安(媒體人)
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
29853
71
2026-01-27 13:18
25973
63
2026-01-27 13:18
73128
95
2026-01-27 13:18
93842
27
2026-01-27 13:18
69738
43
2026-01-27 13:18
97215
63
2026-01-27 13:18
68251
24
2026-01-27 13:18
68741
79
2026-01-27 13:18
45867
82
2026-01-27 13:18
67398
93
2026-01-27 13:18
43981
85
2026-01-27 13:18
58467
23
2026-01-27 13:18
71854
34
2026-01-27 13:18
14692
87
2026-01-27 13:18
73498
26
2026-01-27 13:18
21367
35
2026-01-27 13:18
29814
71
2026-01-27 13:18
84739
16
2026-01-27 13:18
23158
21
2026-01-27 13:18
16349
31
2026-01-27 13:18
18975
94
2026-01-27 13:18
25897
65
2026-01-27 13:18
45863
15
2026-01-27 13:18
13592
57
2026-01-27 13:18
46897
19
2026-01-27 13:18
32916
76
2026-01-27 13:18
93246
65
2026-01-27 13:18
64123
53
2026-01-27 13:18
29763
62
2026-01-27 13:18
18476
28
2026-01-27 13:18
28346
32
2026-01-27 13:18
53168
41
2026-01-27 13:18
32817
52
2026-01-27 13:18
52376
98
2026-01-27 13:18
93125
94
2026-01-27 13:18
39687
82
2026-01-27 13:18
23659
65
2026-01-27 13:18
93417
74
2026-01-27 13:18
27398
42
2026-01-27 13:18
64172
92
2026-01-27 13:18
19738
51
2026-01-27 13:18
76584
73
2026-01-27 13:18
87269
62
2026-01-27 13:18
67891
36
2026-01-27 13:18
24675
46
2026-01-27 13:18
45328
63
2026-01-27 13:18
84519
46
2026-01-27 13:18
47361
37
2026-01-27 13:18
41953
31
2026-01-27 13:18
12386
75
2026-01-27 13:18
37694
89
2026-01-27 13:18
| 祼女直播app | 蜘蛛直播 |
| 彼岸直播 | |
| 魅影直播游客免登录 | 伊人直播网站 |
| 春雨直播安装包 | |
| 妲己直播 | 少妇免费直播 |
| 魅影看b站直播 | |
| 免费播放片色情a片 | 嫦娥直播 |
| 趣播 | |
| 尖叫之夜免费直播 | 魅影app下载免费版 |
| 私密直播全婐app | |
| 心跳直播 | 黑白直播 |
| 魅影看b站直播 | |
| 心跳直播 | 妲己直播 |
| 桃子直播 | |
| 魅影直播 | 榴莲视频 |
| 魅影直播 | |
| 蜜桃视频 | 免费直播 |
| 杏仁直播 | |
| 魅影app下载免费版 | 桃花直播 |
| 桃鹿直播 | |