關(guān)注民生 服務(wù)社會(huì) 發(fā)掘真相 傳播價(jià)值 感謝您瀏覽江蘇蘇訊網(wǎng)。 歡迎投稿:郵箱724922822@qq.com 客服電話:025-86163400 18061633398

東大團(tuán)隊(duì)原創(chuàng)理論獲“中國智能科學(xué)技術(shù)最高獎(jiǎng)”一等獎(jiǎng)

2026-03-10 09:09 來源: 交匯點(diǎn)新聞 編輯:陸文 瀏覽量:0

讓AI“讀懂”復(fù)雜世界!東大團(tuán)隊(duì)原創(chuàng)理論獲“中國智能科學(xué)技術(shù)最高獎(jiǎng)”一等獎(jiǎng)

長期以來,如何讓機(jī)器理解復(fù)雜語義,是人工智能領(lǐng)域的一塊“硬骨頭”。日前,東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院、軟件學(xué)院、人工智能學(xué)院耿新教授團(tuán)隊(duì),憑借在“標(biāo)記分布學(xué)習(xí)理論與方法”上的原創(chuàng)性突破,榮獲2025年度吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)自然科學(xué)獎(jiǎng)一等獎(jiǎng)。這個(gè)被譽(yù)為“中國智能科技最高獎(jiǎng)”的榮譽(yù),背后是團(tuán)隊(duì)近二十年的深耕。

從“有什么”到“有多少”

“機(jī)器學(xué)習(xí),就是利用算法從數(shù)據(jù)中自動(dòng)歸納規(guī)律,并利用這些規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)或決策?!闭劶矮@獎(jiǎng)項(xiàng)目,耿新舉例解釋,傳統(tǒng)監(jiān)督學(xué)習(xí)在面對(duì)一個(gè)復(fù)雜對(duì)象時(shí),往往只能給出簡單的“是或否”的判斷?!氨热缯f,一幅圖像里有貓、狗、大樹等多個(gè)元素,傳統(tǒng)的標(biāo)注會(huì)告訴我們‘有貓、有狗、有樹’。但它不會(huì)告訴我們,不同元素在這一畫面里占了多少比重,‘顯著程度’分別有多高,這可能導(dǎo)致機(jī)器在面對(duì)真實(shí)世界的復(fù)雜場(chǎng)景時(shí),理解出現(xiàn)偏差?!?/p>

面對(duì)這一痛點(diǎn),耿新教授團(tuán)隊(duì)在2016年正式提出了一種全新的學(xué)習(xí)范式——標(biāo)記分布學(xué)習(xí)。這一范式不僅僅是給圖像打上標(biāo)簽,而是要為每一個(gè)標(biāo)簽賦予“描述度”。這相當(dāng)于讓AI完成了一次認(rèn)知升維:從判斷圖像里“有什么”,進(jìn)階到理解每個(gè)元素“有多少”,從而對(duì)復(fù)雜對(duì)象進(jìn)行更細(xì)膩、更精確的刻畫。

理論“無人區(qū)”里的堅(jiān)守

標(biāo)記分布學(xué)習(xí)理論與方法的雛形最早可追溯到2007年,團(tuán)隊(duì)經(jīng)過近十年的積累與打磨,2016年作為完整范式被提出。但真正的攻堅(jiān),才剛剛開始。

“提出范式還不夠,想要讓它立得住,還得建立基礎(chǔ)理論、開發(fā)相應(yīng)算法、推進(jìn)應(yīng)用落地……從理論到應(yīng)用都得走通?!惫⑿禄貞?,最難的就是構(gòu)建基礎(chǔ)理論這一塊?!氨热缫粋€(gè)核心點(diǎn)叫‘標(biāo)記增強(qiáng)機(jī)制’。現(xiàn)實(shí)中,大家為了節(jié)省標(biāo)注成本,往往只標(biāo)一個(gè)簡單的邏輯標(biāo)記,并沒有給出描述度信息。我們要做的,就是通過數(shù)據(jù)分析,把這些缺失的描述度給恢復(fù)出來?!?/p>

為了保證恢復(fù)出來的效果是可靠的,團(tuán)隊(duì)需要構(gòu)建完整的理論框架?!肮馐沁@個(gè)難點(diǎn),我們就打磨了三年多。”耿新感慨地說,針對(duì)另一個(gè)核心點(diǎn)“標(biāo)記分布泛化理論”,團(tuán)隊(duì)同樣打磨近三年時(shí)間。

從中國原創(chuàng)走向國際標(biāo)準(zhǔn)

標(biāo)記分布學(xué)習(xí)因其在處理復(fù)雜、模糊語義上的獨(dú)特優(yōu)勢(shì),不僅成為了學(xué)術(shù)界的“寵兒”,更被應(yīng)用在了諸多高精尖領(lǐng)域。目前,標(biāo)記分布學(xué)習(xí)已形成機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新興研究方向,吸引了大量國際同行跟研,包括哈佛、斯坦福、耶魯、牛津、劍橋等世界頂尖科研單位。

自2018年起,美國宇航局(NASA)在“好奇號(hào)”火星車的礦物分析任務(wù)中,就采用了標(biāo)記分布學(xué)習(xí)作為核心算法?!盎鹦堑V物的化學(xué)成分非常復(fù)雜,以前的統(tǒng)計(jì)方法很難預(yù)測(cè)超過三種元素的化學(xué)成分?!眻F(tuán)隊(duì)成員、東南大學(xué)計(jì)算機(jī)學(xué)院副教授徐寧介紹,該算法通過分析礦物晶體的X射線衍射數(shù)據(jù),能精準(zhǔn)預(yù)測(cè)多種化學(xué)元素及其豐度,幫助科學(xué)家還原火星地質(zhì)歷史。此外,標(biāo)記分布學(xué)習(xí)還被應(yīng)用于集成電路領(lǐng)域,支撐構(gòu)建了芯片設(shè)計(jì)大模型,已服務(wù)于諸多頭部企業(yè),助力芯片設(shè)計(jì)自主化。

“我們發(fā)現(xiàn)在大模型研究中還有很多問題需要用標(biāo)記分布學(xué)習(xí)去解決?!毙鞂幫嘎叮瑘F(tuán)隊(duì)目前正在將這一技術(shù)應(yīng)用于大模型的“安全對(duì)齊”研究。

“大模型生成的內(nèi)容,有時(shí)候可能不安全,或者跟人類的價(jià)值觀有沖突。”徐寧表示,如何讓大模型與人類的價(jià)值觀對(duì)齊,使其更符合人類預(yù)期,這些核心問題恰好是標(biāo)記分布學(xué)習(xí)未來可以發(fā)揮作用的方向。

來源:交匯點(diǎn)新聞

江蘇蘇訊網(wǎng)客服:025-86163400
【責(zé)任編輯:陸超】

江蘇蘇訊網(wǎng)版權(quán)及免責(zé)聲明:凡本網(wǎng)注明“來源:XXX(非江蘇蘇訊網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,本網(wǎng)按規(guī)定給予一定的稿費(fèi)或要求直接刪除,請(qǐng)致電025-86163400 ,聯(lián)系郵箱:724922822@qq.com。

圖片新聞
熱點(diǎn)資訊
熱點(diǎn)聚焦