從“認(rèn)得出”到“讀得懂”——AI助力“猴臉識(shí)別”再升級(jí)
來(lái)源:陜西日?qǐng)?bào) 2025-07-24 08:16

暑假期間,科研人員在野外觀察金絲猴(資料照片)。 受訪者供圖
7月21日,西北大學(xué)生命科學(xué)學(xué)院的實(shí)驗(yàn)室里,科研人員點(diǎn)開(kāi)一段野外視頻。畫面中的秦嶺密林里,金絲猴或嬉戲或覓食,而手機(jī)小程序“猴臉識(shí)別2.0”宛如懂猴語(yǔ)的“翻譯官”,將它們的一舉一動(dòng)拆解成了可解讀的行為信號(hào)。
這不是簡(jiǎn)單的“認(rèn)猴”,而是一場(chǎng)AI與野生動(dòng)物的“深度對(duì)話”。
“識(shí)猴”之困催生技術(shù)探索
西北大學(xué)金絲猴研究團(tuán)隊(duì)為了研究金絲猴,付出了艱辛的努力。20多年前,該團(tuán)隊(duì)在教授李保國(guó)的帶領(lǐng)下,經(jīng)過(guò)艱難探索,實(shí)現(xiàn)了對(duì)野生金絲猴的近距離觀察和個(gè)體識(shí)別。
如何準(zhǔn)確、快速地對(duì)野生金絲猴進(jìn)行個(gè)體識(shí)別,一直是全世界動(dòng)物學(xué)家向往卻無(wú)法突破的難題。
“長(zhǎng)期以來(lái),在動(dòng)物行為學(xué)的研究中,個(gè)體識(shí)別的數(shù)據(jù)采集主要依靠‘一筆一本一(望遠(yuǎn))鏡’人工觀察記錄方式。這種方式極度依賴觀察者的經(jīng)驗(yàn)。”西北大學(xué)生命科學(xué)學(xué)院教授郭松濤介紹。例如,每只金絲猴的圖像樣本需要覆蓋四季,研究人員想要識(shí)別一只猴子,至少要為其拍攝七八百?gòu)堈掌?,還要錄制大量視頻,難度很大。
2015年,團(tuán)隊(duì)開(kāi)始嘗試通過(guò)跨學(xué)科合作,利用新興技術(shù)解決這些問(wèn)題。團(tuán)隊(duì)與本校計(jì)算機(jī)科學(xué)領(lǐng)域、西安電子科技大學(xué)計(jì)算機(jī)科學(xué)領(lǐng)域的專家深度交流,組建了動(dòng)物AI研究團(tuán)隊(duì)。歷經(jīng)無(wú)數(shù)次嘗試與優(yōu)化,團(tuán)隊(duì)終于“訓(xùn)練”出了高精度的識(shí)別模型——“猴臉識(shí)別”系統(tǒng)。
該系統(tǒng)顛覆了依靠動(dòng)物個(gè)體特征或者人為標(biāo)記特征的傳統(tǒng)方法,實(shí)現(xiàn)了對(duì)野生個(gè)體準(zhǔn)確身份識(shí)別和連續(xù)跟蹤采樣的功能。2020年7月,“猴臉識(shí)別”系統(tǒng)研究成果發(fā)表在《細(xì)胞》旗下綜合性子刊《交叉科學(xué)》上,獲得“為在‘理想條件下’實(shí)現(xiàn)‘無(wú)觀察者干擾效應(yīng)’的動(dòng)物學(xué)研究提供了可能”的評(píng)價(jià)。
“猴臉識(shí)別”系統(tǒng)的誕生,使西北大學(xué)金絲猴研究團(tuán)隊(duì)的“識(shí)猴”水平邁向一個(gè)新高度。
“猴臉識(shí)別”系統(tǒng)的進(jìn)化
“猴臉識(shí)別”系統(tǒng)類似于人臉識(shí)別,先通過(guò)提取金絲猴面部特征信息,建立秦嶺金絲猴個(gè)體的身份信息庫(kù);接入野外采集的視頻、圖像后,能夠自動(dòng)識(shí)別、匹配,實(shí)現(xiàn)了在復(fù)雜條件下對(duì)動(dòng)物個(gè)體的探測(cè)、識(shí)別和追蹤。
“不過(guò),金絲猴臉部皮膚區(qū)域小,帶毛區(qū)域多,紋理特征更為復(fù)雜。這對(duì)識(shí)別系統(tǒng)的深度學(xué)習(xí)能力提出了極高要求。為此,團(tuán)隊(duì)采集了數(shù)量更多、質(zhì)量更高的個(gè)體圖像樣本,不斷優(yōu)化算法?!惫蓾榻B。
與此同時(shí),團(tuán)隊(duì)把識(shí)別的范圍擴(kuò)大到秦嶺金絲猴的多個(gè)種群上千只個(gè)體,啟動(dòng)建立秦嶺金絲猴個(gè)體信息庫(kù),并結(jié)合野外和圈養(yǎng)條件下識(shí)別動(dòng)物的不同應(yīng)用場(chǎng)景與需求,進(jìn)行個(gè)性化識(shí)別功能的研發(fā)。
但是,復(fù)雜場(chǎng)景下野生動(dòng)物行為識(shí)別仍然面臨多重共性挑戰(zhàn):哺乳動(dòng)物行為由多樣姿勢(shì)與動(dòng)作組合構(gòu)成,卻無(wú)獨(dú)立標(biāo)簽;行為連續(xù)且交互性強(qiáng),時(shí)間跨度差異大,起止時(shí)間難以精準(zhǔn)確定……
為解決行為智能分析中面臨的共性難題,團(tuán)隊(duì)以行為學(xué)原理為根基,融合人工智能技術(shù),歷時(shí)4年研發(fā)出“猴臉識(shí)別2.0”——自動(dòng)識(shí)別與測(cè)量AI框架。這個(gè)AI框架如同一位神奇的“翻譯官”,從行為的結(jié)構(gòu)分析入手,通過(guò)在動(dòng)物的整個(gè)身體布列出多個(gè)關(guān)鍵信息點(diǎn),利用這些點(diǎn)的結(jié)構(gòu)運(yùn)動(dòng)來(lái)分析其行為。
“它不再局限于解讀某一姿勢(shì)或動(dòng)作,而是對(duì)動(dòng)物行為全流程進(jìn)行分析,結(jié)果更加客觀,排除了人為觀察的干擾,可以幫助我們更‘懂猴’。”郭松濤介紹,該技術(shù)已在4大類群、10種代表性物種上得到了驗(yàn)證。
“我們希望借助AI的力量,共同推動(dòng)動(dòng)物行為學(xué)研究手段的進(jìn)步,促進(jìn)技術(shù)快速迭代?!惫蓾f(shuō)。
學(xué)科交叉孕育創(chuàng)新碩果
學(xué)科交叉的力量始終貫穿在“識(shí)猴”到“懂猴”的技術(shù)發(fā)展過(guò)程中。
在“猴臉識(shí)別”系統(tǒng)的研發(fā)過(guò)程中,西北大學(xué)金絲猴研究團(tuán)隊(duì)的科研人員憑借對(duì)金絲猴長(zhǎng)期的觀察和了解,提供了豐富的物種特征數(shù)據(jù)及行為學(xué)知識(shí),為計(jì)算機(jī)科學(xué)領(lǐng)域的科研人員構(gòu)建識(shí)別模型提供了重要的依據(jù)。
西北大學(xué)、西安電子科技大學(xué)計(jì)算機(jī)科學(xué)領(lǐng)域的團(tuán)隊(duì)則運(yùn)用神經(jīng)網(wǎng)絡(luò)原理、人工智能算法等技術(shù)手段,將生物學(xué)數(shù)據(jù)轉(zhuǎn)化為可被機(jī)器識(shí)別和處理的信息。
“在這個(gè)過(guò)程中,我們開(kāi)發(fā)了深度神經(jīng)網(wǎng)絡(luò)模型,讓計(jì)算機(jī)能夠?qū)W習(xí)和識(shí)別金絲猴復(fù)雜的面部特征及身體結(jié)構(gòu)和運(yùn)動(dòng)特征。在面對(duì)數(shù)據(jù)量龐大、特征復(fù)雜等問(wèn)題時(shí),計(jì)算機(jī)科學(xué)的大數(shù)據(jù)處理能力、算法優(yōu)化能力得以充分發(fā)揮。”西北大學(xué)信息科學(xué)與技術(shù)學(xué)院教授許鵬飛說(shuō)。
在郭松濤和許鵬飛看來(lái),學(xué)科交叉的力量之所以能很好發(fā)揮,在于他們?cè)诮徊嬷卸颊业搅藢儆谧约簩W(xué)科要突破的共性問(wèn)題。
例如,生命科學(xué)希望借助新技術(shù)、新手段,解決復(fù)雜場(chǎng)景下野生動(dòng)物行為識(shí)別的行業(yè)難題;信息科學(xué)需要解決機(jī)器識(shí)別中,目標(biāo)相似難識(shí)別和目標(biāo)狀態(tài)易變難識(shí)別等技術(shù)難題。
在交流合作中,他們相互啟發(fā)。
“我們生命科學(xué)的研究者從計(jì)算機(jī)科學(xué)的快速發(fā)展中獲得靈感,思考如何將新技術(shù)應(yīng)用于動(dòng)物行為研究?!惫蓾f(shuō)。
“計(jì)算機(jī)科學(xué)領(lǐng)域的研究者則在了解生物學(xué)問(wèn)題的過(guò)程中,拓展了算法應(yīng)用的邊界,開(kāi)發(fā)出更適合解決生物領(lǐng)域問(wèn)題的技術(shù)?!痹S鵬飛介紹。