天津8月14日電(記者 孫玲玲)記者13日從南開大學獲悉,近日,南開大學計算機學院媒體計算實驗室取得最新研究成果,不僅從評估的角度揭示了現有AI檢測方法的性能不足,並創新性地提出了「直接差異學習」(Direct Discrepancy Learning,DDL)優化策略,教會AI用「火眼金睛」辨別人機不同,實現AI檢測性能的巨大突破。相關成果論文已被計算機多媒體領域國際頂級會議ACM MM2025(ACM International Conference on Multimedia)接收。 圖為南開大學研究團隊提出的DetectAnyLLM檢測框架以及MIRAGE基準數據集亮點全析。(南開大學 供圖) 近日,OpenAI發布新一代人工智慧模型GPT-5,再次引發全球關注。隨著DeepSeek、ChatGPT、通義千問、豆包等AIGC大模型逐漸從「新奇玩具」變成學習、工作中不可或缺的「生產力工具」,其伴生問題也日益凸顯:AI經常會「一本正經地胡說八道」,生成看似合理的虛假信息,造成「AI幻覺」;依賴AI工具代寫作業甚至畢業論文,極大衝擊著學術誠信和規範;論文AI率檢測系統有待完善,論文被誤判的問題時有發生……如何精準識別AI生成內容,成為亟待解決的熱點問題。 據了解,目前AI生成內容檢測主要有兩種路線,一種是「基於訓練的檢測方法」,使用特定數據訓練一個專用的分類模型;另一種是「零樣本檢測方法」,直接使用一個預訓練的語言模型並設計某種分類標準進行分類。 圖為AI生成內容檢測示意圖。(南開大學 供圖) 多項研究表明,現有檢測方法在應對複雜的現實場景時常顯不足。此前也曾有權威媒體報導,《荷塘月色》《流浪地球》等經典作品被某常用論文AI率檢測系統檢出高AI率。 為何現有的AI檢測工具會「誤判」?論文第一作者、南開大學計算機學院計算機科學卓越班2023級本科生付嘉晨解釋道:「如果把AI文本檢測比作一場考試,檢測器的訓練數據等同於日常練習題,現有檢測方法是機械刷題、死記硬背答題的固定套路,難以學會答題邏輯,一旦遇到全新難題,準確率就會顯著下降。」 「要想實現通用檢測,理論上需收集所有大模型的數據進行訓練,但在大模型迭代飛速的今天幾乎不可能。」付嘉晨說,讓檢測器真正學會舉一反三,即提升檢測器的泛化性能,是提升AI文本檢測性能的關鍵。 為此,研究團隊提出了DDL方法另闢蹊徑,通過直接優化模型預測的文本條件概率差異與人為設定的目標值之間的差距,幫助模型學習AI文本檢測的內在知識,可以精準捕捉人機文本間的深層語義差異,從而大幅提升檢測器的泛化能力與魯棒性。 「使用DDL訓練得到的檢測器如同有了『火眼金睛』,即便只『學習』過DeepSeek-R1的文本,也能精準識別像GPT-5這樣最新大模型生成的內容。」付嘉晨說。 團隊還提出了一個全面的測試基準數據集MIRAGE,使用13種主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4種先進的開源大模型(如Qwen等),從AI生成、潤色、重寫三個角度構造了接近十萬條人類-AI文本對。 「MIRAGE是目前唯一聚焦於對商用大語言模型檢測的基準數據集。直觀地說,之前的基準數據集是由少而且能力簡單的大模型命題出卷,而MIRAGE是17個能力強大的大模型聯合命題,形成一套高難度、又有代表性的檢測試卷。」論文通訊作者、南開大學計算機學院副教授郭春樂說。 在MIRAGE的測試結果顯示,現有檢測器的準確率從在簡單數據集上的90%驟降至約60%;而使用DDL訓練的檢測器仍保持85%以上的準確率。與史丹福大學提出的DetectGPT相比,性能相對提升71.62%;與馬裡蘭大學、卡內基梅隆大學等共同提出的Binoculars方法相比,性能相對提升68.03%。 「AIGC發展日新月異,我們將持續迭代升級評估基準和技術,致力於實現更快、更準、更低成本的AI生成文本檢測,以AI之力,讓每一篇成果更出彩。」研究團隊負責人、南開大學計算機學院教授李重儀說。(完)
世界人形機器人運動會將於8月14日開幕,作為重要項目之一的足球賽預選賽已先一步開賽。來自國內高校的參賽隊GeoHBots在比賽中早早陷入了以少打多的局面。團隊成員向北京商報記者解釋稱,他們的機器人在比賽中吃到紅牌被罰出場,原因是算法不會識別對方的機器人而導致的對抗,被裁判視作背後惡意衝撞,「它只會看球、場地」。 據悉,參加3v3比賽的團隊每支有四個機器人可供使用,三名首發一名替補,少一人的局面無疑讓GeoHBots團隊非常被動。 在綠茵場上跌跌撞撞的金屬身影,實則是一場關乎產業未來的技術練兵——笨拙的動作調試、程序算法的優化、失敗案例的積累,都是人形機器人從實驗室走向商業化場景這一進化路徑上這樣那樣的微調。 技術的綜合考試 機器人足球賽從不是為了復刻人類球賽的精彩,而是給技術能力搭了個實戰考場。 加速進化機器人公司售後技術支持負責人呂明向北京商報記者拆解了這場考試的核心考點:「機器人的運控,就是運動能力、步態這些,下肢能走多快、用什麼樣的步態、有什麼樣的腳法,都是機器人能踢球的基礎;上半身則是感知,主要是視覺,能不能看得準,看得準才能踢得準;最後是決策,就是在什麼情況下用什麼樣的動作,怎麼樣去做接下來要做的動作。」 賽場邊各支隊伍的備賽細節,透出相似的技術打磨縮影:來自馬來西亞的Team Robotedge團隊向北京商報記者介紹,比賽開始前他們要反覆通過電腦調整機器人的靈敏度、運控參數,還要讓機器人持續識別、捕捉比賽用球——這是在針對性訓練運控與感知能力。GeoHBots也向記者透露,他們需要在賽前把自己的代碼、程序刷進去,其中包含視覺、動作、策略等細節,都是為實戰而做的準備。 在現場,你時常能看到一個人類隊員舉著一臺電腦跟著一臺人形機器人,二者通過一根長長的、有點像牽引繩的數據線相連,這正是他們在調試準備——機器人將數據畫面等傳到電腦,人類基於這些數據進行調優。當然,在比賽的時候,這些機器人都需要放開繩子,自主發揮。但考試並不一帆風順,呂明向北京商報記者進一步分析稱,如果機器人的視覺不行,那就看不清、定位不好、踢不準;如果決策不行,該用什麼動作卻做了錯誤判斷。這幾個因素一疊加,強隊跟弱隊的區別就很大了——有的機器人因視覺盲區對著空場地狂奔,有的因決策失誤放棄防守猛衝前場,最終被踢成大比分的慘敗。 但這些考砸了的時刻並非毫無價值——就像企業技術迭代的「錯題本」,每一次失誤都在為算法優化提供精準坐標。 為應用試金 或許有人疑惑,興師動眾讓這麼多人和機器人在賽場折騰,意義何在?答案藏在那些並不非常外顯的技術細節裡。 呂明指著一位在場上做著橫移動作的機器人向北京商報記者解釋:「你看他有那種橫移的,像螃蟹步,這就算是盤帶了。」這種賽場練就的移動步伐,未來可能就是家庭中服務機器人在客廳繞開茶几的靈活身法。 呂明還提到,這些機器人很多是一天要踢四場比賽,在劇烈、頻繁的碰撞下依然能正常運作,摔倒也能自己站起來——這種穩定、耐用,可自我調整的硬體性能,正是工業協作、家庭陪護等場景的核心需求。 前述機器人那種「只認球不認人」的識別局限,也可通過更複雜的算法解決,把環境感知數據練好,未來就能分清水杯、遙控器和毛巾,避免服務場景中的烏龍。 參賽生態還藏著產業進階的新生力量。Geo-HBots團隊向北京商報記者透露,他們賽前僅用不到兩個月準備,依託的正是廠商提供的開源基礎平臺;呂明也向記者表示,現在其實還很難談比賽質量,更多是讓大家上場激發熱情。人形機器人在國內剛起步,加速進化公司的機器人在交付參賽團隊時就自帶一套開源Demo算法供參賽者調試。「要讓學生通過比賽走完流程,對機器人有理解,再有興趣去研究,畢竟做運控、做感知、做策略,理論和實踐是很不一樣的。」 每次有進球發生,現場參賽隊成員總會爆發出不亞於自己踢比賽進球時的歡呼,看得出他們確實很高興,像是以一種主教練的身份——這種包容性強的參與生態,正在培育未來的開發者群體。 慢功夫裡的大未來 比賽當中,有些進攻輪次非常簡單粗暴——某隊的機器人在中場附近大力射門,然後球就徑直跨過半場,滾進對方球門。 但人形機器人產業的進化,不可能是一蹴而就的爆發,需要在包括賽場在內的試錯中沉澱慢功夫。 呂明向北京商報記者強調比賽數據的核心價值:「我們會持續做相關的解決方案,掌握的數據越來越多,機器人模型的學習能力、判斷能力也會變強。最終還是要推動人形機器人領域發展,比賽只是其中一種形式,也是為了驗證我們的硬體、軟體、算法能力,讓它以後能服務更多其他場景。」 這些在綠茵場上積累的硬控穩定性、感知精準度、決策合理性,正在編織一張技術網絡:硬體耐用性達標了,機器人才能走進真實場景;算法識別準了,才能理解人類需求;多模塊協同順了,商業化落地才有底氣。 或許十年後,當家庭機器人熟練地幫你遞水、工廠機器人精準搬運零件時,它們的運動神經和大腦邏輯,最早正是在這場笨拙的足球賽裡,被一群學生和工程師一點點打磨出來的。 眼前跌跌撞撞的機械身影,正在用成功或失敗的動作,攢下人形機器人產業的未來底氣。 北京商報記者 陶鳳 實習記者 王天逸
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
92584
63
2025-10-26 03:12
69732
58
2025-10-26 03:12
75231
68
2025-10-26 03:12
39514
89
2025-10-26 03:12
53214
93
2025-10-26 03:12
29643
37
2025-10-26 03:12
75239
93
2025-10-26 03:12
92631
31
2025-10-26 03:12
24539
28
2025-10-26 03:12
35729
38
2025-10-26 03:12
46913
45
2025-10-26 03:12
56391
53
2025-10-26 03:12
87146
58
2025-10-26 03:12
39167
79
2025-10-26 03:12
12589
94
2025-10-26 03:12
48532
96
2025-10-26 03:12
38176
78
2025-10-26 03:12
62851
21
2025-10-26 03:12
59816
58
2025-10-26 03:12
51729
49
2025-10-26 03:12
27586
53
2025-10-26 03:12
72984
56
2025-10-26 03:12
91732
12
2025-10-26 03:12
49215
24
2025-10-26 03:12
53614
61
2025-10-26 03:12
42895
49
2025-10-26 03:12
76891
52
2025-10-26 03:12
98516
15
2025-10-26 03:12
67129
28
2025-10-26 03:12
41695
16
2025-10-26 03:12
72581
61
2025-10-26 03:12
85123
43
2025-10-26 03:12
17946
96
2025-10-26 03:12
57124
56
2025-10-26 03:12
67183
48
2025-10-26 03:12
56293
19
2025-10-26 03:12
47856
36
2025-10-26 03:12
69528
71
2025-10-26 03:12
65231
12
2025-10-26 03:12
41652
82
2025-10-26 03:12
45698
59
2025-10-26 03:12
31257
32
2025-10-26 03:12
62548
93
2025-10-26 03:12
56712
67
2025-10-26 03:12
49617
87
2025-10-26 03:12
78593
41
2025-10-26 03:12
28795
56
2025-10-26 03:12
39467
78
2025-10-26 03:12
58613
93
2025-10-26 03:12
92763
87
2025-10-26 03:12
49136
85
2025-10-26 03:12
16853
28
2025-10-26 03:12
57491
63
2025-10-26 03:12
| 魅影看b站直播 | 秀色直播app下载 |
| 成人抖阴 | |
| 小猫咪视频 | 魅影app免费下载安装 |
| 仙凡直播 | |
| 花儿直播 | 小狐狸直播 |
| 520直播 | |
| 樱花直播nba | 就要直播 |
| 伊人app | |
| 樱桃直播 | 花瓣直播 |
| 妖姬直播 | |
| 伊人直播网站 | 杏爱直播 |
| 蜜糖直播 | |
| 水仙直播 | 榴莲视频 |
| 九球直播 | |
| 优直播 | 青柠直播 |
| 樱花直播nba | |
| 抓饭直播 | 直播黄台app凤蝶 |
| 小蝌蚪app | |
| 桔子直播 | 鲨鱼直播 |
| 魅影9.1直播 | |