關注民生 服務社會 發(fā)掘真相 傳播價值 感謝您瀏覽江蘇蘇訊網。 歡迎投稿:郵箱724922822@qq.com 客服電話:025-86163400 18061633398

DeepSeek重磅上新,對標美國行業(yè)巨頭,“所有群聊都炸鍋了!”

2025-12-03 10:24 來源: 騰訊網 編輯:玖柒六 瀏覽量:0

深度求索(DeepSeek)新品重磅發(fā)布,再度引爆AI圈。12月1日,中國人工智能(AI)初創(chuàng)企業(yè)DeepSeek推出兩款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

據介紹,DeepSeek-V3.2定位“平衡實用”,其在主流推理基準測試中達到美國OpenAI的GPT-5水平;而在推理能力上大幅增強的DeepSeek-V3.2-Speciale,則在推理基準測試中取得了媲美谷歌深度思維11月下旬剛推出的新一代AI模型“雙子座3專業(yè)版”(Gemini 3.0 Pro)。

DeepSeek還透露,其V3.2-Speciale版本在國際數學奧林匹克競賽(IMO 2025)、國際信息學奧林匹克競賽(IOI 2025)等均斬獲金牌級表現(xiàn)。這一成績直接對標行業(yè)巨頭,此前僅有OpenAI和谷歌深度思維未對外公開的內部測試模型達成過這一成就。

香港《南華早報》2日報道指出,這一來自開源實驗室的技術突破再次引發(fā)AI研究領域的廣泛熱議,尤其DeepSeek此次上新恰逢“AI界的奧斯卡”——2025年神經信息處理系統(tǒng)大會(NeurIPS)召開前夕。

作為當前全球最負盛名的機器學習和AI研究領域頂尖學術會議之一,NeurIPS大會每年舉辦一次,被中國計算機學會列為A類會議,在谷歌學術發(fā)布的全球學術期刊和會議影響力排名中位列第7.與國際機器學習會議(ICML)、國際學習表征會議(ICLR)并稱為AI領域難度最大、水平最高、影響力最強的三大會議,代表著當今機器學習與AI領域的最高水平。

盡管向來行事低調的DeepSeek尚未公布是否會派員參會,但正在圣地亞哥參加NeurIPS大會的弗洛里安·布蘭德(Florian Brand)已難掩興奮。

這位專門研究中國開源AI生態(tài)系統(tǒng)的專家告訴港媒,如果DeepSeek的研究人員現(xiàn)身會場,大概率會引發(fā)高度關注。

他還透露:“DeepSeek發(fā)布新模型的消息一出,今天所有相關交流群都炸開了鍋。(All the group chats today were full after DeepSeek’s announcement)”

港媒還提到,本屆NeurIPS大會首次采用雙會場形式,在美國加州圣地亞哥和墨西哥首府墨西哥城同步舉辦。這一安排主要源于主辦方對國際研究人員獲取美國簽證可能遇阻的擔憂,目前已有許多中國參會者選擇前往墨西哥城會場參會。

據官方介紹,DeepSeek-V3.2定位平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用智能體任務場景。在公開的推理類基準測試(Benchmark)中,V3.2達到了GPT-5的水平,僅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。

DeepSeek評價稱,V3.2“在智能體評測中達到當前開源模型最高水平”,大幅縮小了開源模型與閉源模型的差距,且未針對測試工具進行特殊訓練。此外,該模型還是DeepSeek推出的首個將思考融入工具使用的模型,并且同時支持思考模式與非思考模式的工具調用。

DeepSeek-V3.2-Speciale則為“極致推理”而生,是V3.2的長思考增強版,同時結合了DeepSeek-Math-V2 的定理證明能力,以探索模型能力的邊界。該模型具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力,在主流推理基準測試上的性能表現(xiàn)媲美Gemini-3.0-Pro。

更令人矚目的是,V3.2-Speciale成功斬獲國際數學奧林匹克(IMO 2025)、中國數學奧林匹克(CMO 2025)、國際大學生程序設計競賽全球總決賽(ICPC World Finals 2025)及國際信息學奧林匹克(IOI 2025)金牌。其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。

目前,DeepSeek官方網頁端、App和API均已更新為正式版V3.2.Speciale版本目前僅以臨時API服務形式開放,以供社區(qū)評測與研究。相關模型已開源。

與兩款新模型同步發(fā)布的,還有配套的技術報告。谷歌深度思維的首席研究工程師蘇珊·張(Susan Zhang)在社交媒體上對此給予好評,稱贊報告內容詳盡,同時肯定了這家初創(chuàng)企業(yè)在模型訓練后穩(wěn)定性優(yōu)化及智能體能力提升方面的努力。

彭博社指出,這一成果已清晰表明,中國開源AI系統(tǒng)至少在部分核心指標上,已經與硅谷頂尖專有模型具備同等競爭力。

美媒進一步解讀稱,此次新品發(fā)布也釋放出一個重要信號:繼今年1月推出突破性模型顛覆AI領域后,這家頗具影響力的AI實驗室正持續(xù)加大研發(fā)力度,致力于提升AI運算的速度與效率,力求鞏固其在中國AI賽道中的領先優(yōu)勢。

就在上周,DeepSeek剛發(fā)布了開源模型DeepSeek-Math-V2.該模型展現(xiàn)出強大的數學定理證明能力。

開源AI初創(chuàng)公司Hugging Face的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克萊門特·德朗格(Clement Delangue)在社交平臺X上盛贊道,“想象一下,你可以免費擁有世界上最優(yōu)秀數學家之一的大腦?!?/p>

他強調,用戶可以不受限制地探索、微調、優(yōu)化這款中國AI模型,并在自有硬件上運行,“沒有任何公司或政府可以收回它。這正是AI和知識民主化的最佳體現(xiàn)。”

“據我所知,此前沒有任何聊天機器人或API能讓你接觸到一個IMO 2025金牌水平的模型?!钡吕矢裱a充說。

另據英國《金融時報》上周報道,美國麻省理工學院(MIT)和Hugging Face的一項研究發(fā)現(xiàn),過去一年,中國團隊開發(fā)的開源AI模型下載量占比上升至17%,超過了美國開發(fā)團隊的15.8%。這是中國團隊首次在這一指標上超越美國同行,取得AI技術全球應用中的關鍵優(yōu)勢。

在席卷全球科技行業(yè)的AI熱潮之中,美國OpenAI、谷歌和Anthropic等科技巨頭傾向于“封閉”策略,保持對先進AI技術的完全掌控,通過用戶訂閱和企業(yè)合作等方式獲利。與之相比,中國科技公司傾向于更加開放的策略,發(fā)布了一系列開源模型。

德國智庫墨卡托中國研究中心的高級分析師溫迪·張(Wendy Chang)指出,“比起美國,開源在中國更像是一種主流趨勢。美國公司不愿這樣做,它們依靠這些高估值賺錢,不想公開自己的商業(yè)機密?!?/p>

根據MIT和Hugging Face的數據,DeepSeek和阿里云的Qwen是下載量最多的中國開源模型。《金融時報》稱,DeepSeek-R1模型震驚了硅谷,該模型使用的成本和算力很低,但性能足以與美國頂尖模型比肩,引發(fā)各界對于美國AI實驗室是否還能保持競爭優(yōu)勢的質疑。

MIT研究員謝恩·隆普雷(Shayne Longpre)表示,中國科技公司正在改變AI模型發(fā)布的范式,許多中國公司每周或每兩周發(fā)布一次模型,并提供多種版本供用戶選擇。相比之下,美國科技公司往往每六個月或一年才發(fā)布一系列模型。

業(yè)內人士告訴《金融時報》,盡管美國出臺了芯片出口管制等一系列打壓措施,但中國擁有大量優(yōu)秀人才,他們在開發(fā)開源模型的過程中展現(xiàn)出極強的創(chuàng)造力。

“當美國AI實驗室押注于通過推動智能突破來獲取巨額利益的同時,中國的開源模型競爭者更專注于推動AI的廣泛應用,”《經濟學人》總結道,“如果他們成功,DeepSeek的沖擊可能僅僅只是一個開始。”

原文地址:https://news.qq.com/rain/a/20251202A05I3T00
江蘇蘇訊網客服:025-86163400
【責任編輯:陸超】

江蘇蘇訊網版權及免責聲明:凡本網注明“來源:XXX(非江蘇蘇訊網)”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。 如因作品內容、版權和其它問題需要同本網聯(lián)系的,本網按規(guī)定給予一定的稿費或要求直接刪除,請致電025-86163400 ,聯(lián)系郵箱:724922822@qq.com。