比如,黃鐵軍巧妙地捕捉到,監(jiān)控視頻具有背景相對不變的特點,提出了基于場景建模的視頻編碼方法。僅靠這項技術(shù),就把視頻編碼的效率提高了1倍。“采用現(xiàn)行標(biāo)準(zhǔn),全國3千萬個攝像頭采集的視頻,若保質(zhì)保量存儲3個月的內(nèi)容就需要2千億元。用上這項技術(shù)后,等量的內(nèi)容存儲成本可降至500億元?!彼f。
云計算改變了信息的應(yīng)用和服務(wù)模式,但大量攝像頭拍攝的視頻很難傳至云端,于是黃鐵軍又“腦洞大開”。
“傳到‘云’里的視頻不是給人看,而是給機(jī)器‘看’(進(jìn)行分析識別),所以只要傳回機(jī)器識別所需的視覺特征就可以了?!彼f,采用這個技術(shù)思路,視頻傳輸流量可減少90%以上,大大減輕了傳輸壓力。
基于上述兩項創(chuàng)新成果,由黃鐵軍牽頭的團(tuán)隊獲得了2017年度國家技術(shù)發(fā)明獎二等獎。
在新領(lǐng)域?qū)覄?chuàng)佳績的黃鐵軍,卻一直沒忘了自己的“老本行”——圖像識別。在該研究領(lǐng)域,他依舊體現(xiàn)出了與眾不同的研究視角。
長久以來,一些科學(xué)家習(xí)慣以人類自身為標(biāo)準(zhǔn)思考機(jī)器如何“看”,以為機(jī)器視覺和人類視覺一樣,但黃鐵軍卻不這么認(rèn)為。
“人總喜歡把自己的感受強(qiáng)加于別人,現(xiàn)在又強(qiáng)加于機(jī)器。一些人單純地以為,把視頻給機(jī)器看,機(jī)器就能識別,這種思路有些局限。”黃鐵軍說,其實機(jī)器能比人“看”得更準(zhǔn)、更快。
于是,跳出人類思維局限,打造真正的機(jī)器視覺,即類腦視覺,成了黃鐵軍當(dāng)下的目標(biāo)。
做真正有價值的東西
由黃鐵軍牽頭研制的超速全時仿視網(wǎng)膜芯片,便是他們向類腦視覺走出的探索一步。黃鐵軍把這款芯片,比作新一代人工智能的“電眼”。
它能干什么?“舉例來說,在高速旋轉(zhuǎn)的電風(fēng)扇葉片上寫2個字,電風(fēng)扇轉(zhuǎn)起來后,人眼看到的是模糊一片,‘電眼’卻能把字看得清清楚楚。”他說,“電眼”可用在人工智能界的“網(wǎng)紅”無人駕駛汽車、無人機(jī)和智能機(jī)器人上。
該芯片的研制團(tuán)隊中,有計算機(jī)科學(xué)、神經(jīng)科學(xué)、醫(yī)學(xué)等眾多領(lǐng)域的專家,形成了一個強(qiáng)大的跨學(xué)科隊伍,他們從生物和信息兩個角度進(jìn)行探索,最終才研制成功。
因為設(shè)計這只“電眼”,讓黃鐵軍有機(jī)會將視頻編碼與“老本行”圖像識別結(jié)合起來,運用上這兩種不同領(lǐng)域的技術(shù)。“以前,我們實驗室里的學(xué)生分兩撥搞研究,一撥做圖像識別,一撥做視頻編碼,就像兩條并行的鐵軌?,F(xiàn)在,他們可以一起做項目,按照全新的技術(shù)體系,創(chuàng)造新的可能。”他說。
實驗室的學(xué)生對科技日報記者說,開放性思維是黃鐵軍的標(biāo)志性特點。“黃老師善于從全局角度看問題,常會把兩種看似沒有關(guān)系的事物聯(lián)系在一起,讓它們碰撞出火花。”
在生活中,黃鐵軍也依舊如此。他喜歡跟性格各異、領(lǐng)域不同的人打交道,他說這樣能通過別人的視角來發(fā)現(xiàn)新問題。
對科研,黃鐵軍表示自己喜歡另辟蹊徑,反對跟隨和模仿?!耙郧?,一些科研人員十分注重成果的數(shù)量,現(xiàn)在則更重視開拓科研‘無人區(qū)’??蒲腥藛T應(yīng)該珍視自己的學(xué)術(shù)生命,做真正有價值的東西,否則你所做的事情就會像沙灘上的腳印,一陣?yán)舜蜻^來就會無影無蹤?!彼f。