天津8月14日電(記者 孫玲玲)記者13日從南開大學獲悉,近日,南開大學計算機學院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現有AI檢測方法的性能不足,並創新性地提出了「直接差異學習」(Direct Discrepancy Learning,DDL)優化策略,教會AI用「火眼金睛」辨別人機不同,實現AI檢測性能的巨大突破。相關成果論文已被計算機多媒體領域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。 圖為南開大學研究團隊提出的DetectAnyLLM檢測框架以及MIRAGE基準數據集亮點全析。(南開大學 供圖) 近日,OpenAI發布新一代人工智慧模型GPT-5,再次引發全球關注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從「新奇玩具」變成學習、工作中不可或缺的「生產力工具」,其伴生問題也日益凸顯:AI經常會「一本正經地胡說八道」,生成看似合理的虛假信息,造成「AI幻覺」;依賴AI工具代寫作業甚至畢業論文,極大衝擊著學術誠信和規範;論文AI率檢測系統有待完善,論文被誤判的問題時有發生……如何精準識別AI生成內容,成為亟待解決的熱點問題。 據了解,目前AI生成內容檢測主要有兩種路線,一種是「基於訓練的檢測方法」,使用特定數據訓練一個專用的分類模型;另一種是「零樣本檢測方法」,直接使用一個預訓練的語言模型並設計某種分類標準進行分類。 圖為AI生成內容檢測示意圖。(南開大學 供圖) 多項研究表明,現有檢測方法在應對複雜的現實場景時常顯不足。此前也曾有權威媒體報導,《荷塘月色》《流浪地球》等經典作品被某常用論文AI率檢測系統檢出高AI率。 為何現有的AI檢測工具會「誤判」?論文第一作者、南開大學計算機學院計算機科學卓越班2023級本科生付嘉晨解釋道:「如果把AI文本檢測比作一場考試,檢測器的訓練數據等同於日常練習題,現有檢測方法是機械刷題、死記硬背答題的固定套路,難以學會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。」 「要想實現通用檢測,理論上需收集所有大模型的數據進行訓練,但在大模型迭代飛速的今天幾乎不可能。」付嘉晨說,讓檢測器真正學會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關鍵。 為此,研究團隊提出了DDL方法另闢蹊徑,通過直接優化模型預測的文本條件概率差異與人為設定的目標值之間的差距,幫助模型學習AI文本檢測的內在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。 「使用DDL訓練得到的檢測器如同有了『火眼金睛』,即便只『學習』過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內容。」付嘉晨說。 團隊還提出了一個全面的測試基準數據集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構造了接近十萬條人類-AI文本對。 「MIRAGE是目前唯一聚焦於對商用大語言模型檢測的基準數據集。直觀地說,之前的基準數據集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯合命題,形成一套高難度、又有代表性的檢測試卷。」論文通訊作者、南開大學計算機學院副教授郭春樂說。 在MIRAGE的測試結果顯示,現有檢測器的準確率從在簡單數據集上的90%驟降至約60%;而使用DDL訓練的檢測器仍保持85%以上的準確率。與史丹福大學提出的DetectGPT相比,性能相對提升71.62%;與馬裡蘭大學、卡內基梅隆大學等共同提出的Binoculars方法相比,性能相對提升68.03%。 「AIGC發展日新月異,我們將持續迭代升級評估基準和技術,致力於實現更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。」研究團隊負責人、南開大學計算機學院教授李重儀說。(完)
我們很多人都養成了開倍速聽播客、有聲書和其他在線內容的習慣。對年輕人來說,這也許已經成了常態。舉個例子,一項針對美國加利福尼亞州學生的調查表明,89%的學生會把在線講座的錄播視頻調成倍速觀看。同時,有許多媒體文章描述了倍速瀏覽的普遍性。 開倍速的好處顯而易見:你可以在同樣的時間內消費更多的內容,或者通過反覆觀看同樣的內容來加深理解。 這在教育層面尤為重要,因為學生可以騰出時間去鞏固知識、做模擬考試等。而且,開倍速或許也可以讓人全程集中注意力、全情投入,避免走神。 但這樣做的壞處呢?其實也不少。 研究人員發現,一個人接收到口語信息並形成記憶,需要經歷三個階段:編碼信息,存儲信息,以及之後的檢索信息。在編碼階段,大腦需要一定的時間去處理和理解剛剛輸入的語音,大腦必須實時地從記憶裡提取出字詞以及它們的語境含義。 人們的講話速度通常在每分鐘150詞左右,即便語速達到它的兩倍(300詞/分)或三倍(450詞/分),也是在人類可理解的範圍內。但主要的問題在於我們所形成記憶的質量和持久性。 我們接收到的信息會被臨時存儲在一個名為工作記憶(working memory)的記憶系統裡。它可以將大量的信息進行轉換、組合,並形成可存入長期記憶的形式。由於工作記憶的容量是有限的,所以如果我們短時間內接收到太多信息,可能會超過它的負荷。這會導致認知過載和信息流失。 倍速瀏覽與大腦信息提取 近期,記憶研究領域的一項薈萃分析調查了24項關於學習講座視頻的研究。這些研究的設計各不相同,但總的來說都把參與者分為了兩組,其中一組原速(1×)觀看講座視頻,另一組開倍速(1.25×,1.5×,2×和2.5×)觀看同一個講座視頻。 與醫學中用於檢驗療效的隨機對照試驗一樣,參與者被隨機分到了兩組中的其中一組。觀看視頻後,兩組完成了同樣的測試,以檢驗他們對視頻材料的掌握程度。這些測試要麼要求他們回憶信息,要麼用選擇題考察記憶,或兩者結合。 這項薈萃分析表明,以越高的倍速看視頻,測試表現越差。1.5倍速的影響微乎其微,但2倍速及以上的影響顯著。 具體來說,如果一批學生的平均分是75%,且通常情況下會上下浮動20%,那麼把觀看視頻的速度提到1.5倍速則會把平均值拉低2%。而2.5倍速則會導致17%的降幅。 老年群體 有趣的是,該薈萃分析中的一項研究還調查了老年人(61~94歲),結果發現他們比年輕人(18~36歲)更容易受到倍速看視頻的影響。這也許反映了記憶容量在健康人群體中也會隨著年齡而衰減,這表明老年人更應該原速觀看甚至減速觀看視頻來彌補不足。 不過,我們尚不清楚是否可以通過頻繁地開倍速播放視頻來減少它帶來的壞處。也就是說,有一種可能性是年輕人只不過是更經常開倍速,因此能更好地應對增加的認知負荷。同樣,這也意味著我們無法確定年輕人是否可以通過經常開倍速來減輕這種行為對信息記憶能力的負面影響。 另一個尚不明確的點是,開倍速播放視頻是否會對心智功能與大腦活動造成長期影響。理論上,這些影響可能是積極的,比如提高一個人應對認知負荷的能力。這些影響也可能是負面的,比如更大的認知負荷可能引發精神疲勞,但我們仍然沒有科學證據來解答這些疑問。 最後一個現象是,雖然開1.5倍速不會影響記憶能力,但是有證據表明人們的觀看體驗會有所下降。這也許會影響到人們學新東西的動力和體驗,可能讓他們找到更多藉口來逃避學習。另一方面,開倍速已然成為常態,因此也許當人們習慣這樣做之後,就不會有什麼大問題——希望我們在未來的幾年裡能更好地理解這些過程。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
91836
68
2025-11-07 15:15
41685
65
2025-11-07 15:15
84165
51
2025-11-07 15:15
34957
18
2025-11-07 15:15
75498
87
2025-11-07 15:15
79631
37
2025-11-07 15:15
43179
63
2025-11-07 15:15
17358
24
2025-11-07 15:15
47158
74
2025-11-07 15:15
34862
45
2025-11-07 15:15
72431
48
2025-11-07 15:15
63892
52
2025-11-07 15:15
18495
94
2025-11-07 15:15
38659
81
2025-11-07 15:15
47398
41
2025-11-07 15:15
65912
32
2025-11-07 15:15
72531
53
2025-11-07 15:15
25341
39
2025-11-07 15:15
19763
58
2025-11-07 15:15
87539
96
2025-11-07 15:15
74913
54
2025-11-07 15:15
18743
41
2025-11-07 15:15
24679
48
2025-11-07 15:15
24639
78
2025-11-07 15:15
34875
15
2025-11-07 15:15
13859
64
2025-11-07 15:15
35782
73
2025-11-07 15:15
74258
59
2025-11-07 15:15
96283
15
2025-11-07 15:15
98731
34
2025-11-07 15:15
17639
37
2025-11-07 15:15
31485
16
2025-11-07 15:15
46385
78
2025-11-07 15:15
62418
79
2025-11-07 15:15
96732
12
2025-11-07 15:15
38162
86
2025-11-07 15:15
19782
26
2025-11-07 15:15
65237
53
2025-11-07 15:15
86314
13
2025-11-07 15:15
13675
98
2025-11-07 15:15
51296
68
2025-11-07 15:15
91834
12
2025-11-07 15:15
58174
13
2025-11-07 15:15
56741
86
2025-11-07 15:15
32157
15
2025-11-07 15:15
63972
64
2025-11-07 15:15
36721
56
2025-11-07 15:15
62581
49
2025-11-07 15:15
71583
26
2025-11-07 15:15
15478
54
2025-11-07 15:15
69538
87
2025-11-07 15:15
| 花蝴蝶app直播 | 雪梨直播 |
| 520直播 | |
| 荔枝网直播 | 名模直播 |
| 韩国直播 | |
| 蜜桃app | 免费直播行情网站 |
| 蜜疯直播 | |
| 月夜直播app夜月 | 鲍鱼直播 |
| 杏爱直播 | |
| 成人性做爰直播 | 零七直播 |
| 小k直播姬 | |
| 直播黄台app凤蝶 | 黄瓜直播 |
| 柠檬直播 | |
| 月夜直播 | 牡丹直播 |
| 69美女直播 | |
| 午夜直播 | 蜜桃视频 |
| 小白兔直播 | |
| 魅影直播视频 | 暖暖直播 |
| 春雨app直播免费看 | |
| 看少妇全黄a片直播 | 午夜直播 |
| 桃子直播 | |