國內首個通過人機辯論圖靈測試的大模型在上海誕生

2025-07-29 18:37:22 來源: 科技日報點擊數：

馮妍科技日報記者王春

“如果能一鍵消除所有痛苦回憶，要不要按？”大屏幕上，兩名服裝、長相一模一樣的辯手對這個涉及情感、倫理、心理學、哲學等的論題展開激烈辯論。這背后，一方是真人辯手武漢大學教師陳銘，另一方則是上海企業MiniMax提供的大模型。在7月26日舉辦的“2025中國·AI盛典”的辯論賽賽后投票中，42%的觀眾把大模型認作是人類，這表示大模型已經通過了人機辯論的圖靈測試。

圖靈測試是衡量機器是否具備人類智能水平的經典標準，由被譽為“人工智能之父”的圖靈在1950年提出：如果一臺機器在自然語言對話的過程中能“騙過”超過30%的人類參與者，那么就可以被視作具有智能。

這是國內大模型首次通過人機辯論圖靈測試，不僅標志著我國在AI自然語言理解和邏輯思維方面取得重大進展，更展現了上海作為全球人工智能高地的創新實力。據了解，這位“辯手”的文本大模型學習了萬億條人類數據，而其語音大模型僅需6秒聲音片段即能模擬真實人聲。辯論影像則由節目組運用AI技術統一處理，100位觀眾僅憑辯論內容、語言風格和思維邏輯判斷誰是人類。

在辯論中，模型表現亮點眾多。如在論點構建中，針對“人工智能是否應擁有法律人格”等辯題，模型能快速檢索法律條文、倫理案例，構建多層次論證框架；在臨場應變時，面對人類辯手的即興詰問，模型半秒內即可生成反駁話術，例如在“技術失業”議題中能結合制造業自動化數據提出“崗位結構轉型”新視角；在情感渲染方面，模型通過語音合成技術模擬語氣變化，在“教育公平”辯論中以富有感染力的敘述引發觀眾共鳴。

賽后，曾多次獲得國際辯論賽冠軍的陳銘發微博稱：“對于推理能力的成熟程度，辯論幾乎是最佳試金石。以我這次的親身體驗來看，經過針對性訓練的推理大模型，辯論能力恐已超過90%的人類辯手。觀點、邏輯、梗、金句、上價值，再加上極富感染力的輸出，AI流暢無比，信手拈來，在語言技術上人類幾乎已經沒有什么自留地了。”同時，他也認為AI尚未完美，“最后的榮耀，還是在那些‘大’問題的深度思考上。對于根本性哲學思考的觀點突圍，AI仍力有不逮。”

上海交通大學人工智能學院院長李頡指出，該模型在辯論場景的突破為政務咨詢、金融談判等強交互領域提供了新范式。目前，MiniMax已與復旦大學合作，將相關技術應用于科技倫理審查智能體系統“一鑒”，實現倫理風險自動標注與合規性分析。

中國工程院院士、之江實驗室主任王堅認為，這場圖靈測試的意義，早已超越了簡單的“辨別人機”。他表示：“當年的圖靈測試為人工智能定了一個極具挑戰的目標，今天我們看到，通過圖靈測試只是人工智能的下一個新的開始。”

責任編輯：孫瑩

一级大片免费_成人免费观看在线_国产一区二区三区精品久久久无广告_久久99精品久久久久久青青91_com.黄_久久久久久久国产免费看

國內首個通過人機辯論圖靈測試的大模型在上海誕生

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續瀏覽