一種新的仿生傳感器可以從視頻中在一幀內(nèi)識(shí)別移動(dòng)物體,并成功預(yù)測(cè)它們將移動(dòng)到哪里?!蹲匀煌ㄓ崱返囊黄撐闹忻枋隽诉@種智能傳感器,它將在一系列領(lǐng)域成為一種有價(jià)值的工具,包括動(dòng)態(tài)視覺(jué)傳感、自動(dòng)檢測(cè)、工業(yè)過(guò)程控制、機(jī)器人制導(dǎo)和自動(dòng)駕駛技術(shù)。
當(dāng)前的運(yùn)動(dòng)檢測(cè)系統(tǒng)需要許多組件和復(fù)雜的算法來(lái)進(jìn)行逐幀分析,這使得它們效率低下且耗能高。受人類視覺(jué)系統(tǒng)的啟發(fā),阿爾托大學(xué)的研究人員開(kāi)發(fā)了一種新的神經(jīng)形態(tài)視覺(jué)技術(shù),該技術(shù)將傳感、記憶和處理集成在一個(gè)可以檢測(cè)運(yùn)動(dòng)和預(yù)測(cè)軌跡的設(shè)備中。
他們技術(shù)的核心是一系列光調(diào)制器,這是一種響應(yīng)光產(chǎn)生電流的電氣設(shè)備。當(dāng)光線關(guān)閉時(shí),電流不會(huì)立即停止。相反,它會(huì)逐漸衰減,這意味著光調(diào)制器可以有效地“記住”它們最近是否暴露在光線下。因此,由光調(diào)制器陣列制成的傳感器不僅像相機(jī)那樣記錄場(chǎng)景的即時(shí)信息,而且還包括先前瞬間的動(dòng)態(tài)存儲(chǔ)器。
領(lǐng)導(dǎo)這項(xiàng)研究的研究員譚宏偉解釋道:“我們技術(shù)的獨(dú)特之處在于它能夠?qū)⒁幌盗泄鈱W(xué)圖像集成在一幀中?!泵總€(gè)圖像的信息作為隱藏信息嵌入到以下圖像中。換句話說(shuō),視頻中的最后一幀也具有關(guān)于所有先前幀的信息。這讓我們可以通過(guò)簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)只分析最后一幀來(lái)更早地檢測(cè)視頻中的運(yùn)動(dòng)。其結(jié)果是一個(gè)緊湊而高效的傳感單元。
為了演示這項(xiàng)技術(shù),研究人員使用視頻一次顯示一個(gè)單詞的字母。因?yàn)樗袉卧~都以字母“E”結(jié)尾,所以所有視頻的最后一幀看起來(lái)都很相似。傳統(tǒng)的視覺(jué)傳感器無(wú)法判斷屏幕上的“E”是否出現(xiàn)在“APPLE”或“GRAPE”中的其他字母之后。但光調(diào)制器陣列可以在最后一幀中使用隱藏的信息來(lái)推斷之前的字母,并以接近100%的準(zhǔn)確率預(yù)測(cè)單詞是什么。
在另一項(xiàng)測(cè)試中,該團(tuán)隊(duì)展示了一個(gè)模擬人以三種不同速度移動(dòng)的傳感器視頻。該系統(tǒng)不僅能夠通過(guò)分析單個(gè)幀來(lái)識(shí)別運(yùn)動(dòng),而且還能正確預(yù)測(cè)下一幀。
準(zhǔn)確檢測(cè)運(yùn)動(dòng)和預(yù)測(cè)物體的位置對(duì)自動(dòng)駕駛技術(shù)和智能交通至關(guān)重要。自動(dòng)駕駛汽車(chē)需要準(zhǔn)確預(yù)測(cè)汽車(chē)、自行車(chē)、行人和其他物體的移動(dòng)方式,以指導(dǎo)其決策。通過(guò)在光調(diào)制器陣列中添加機(jī)器學(xué)習(xí)系統(tǒng),研究人員表明,他們的集成系統(tǒng)可以基于全信息幀的傳感器內(nèi)處理來(lái)預(yù)測(cè)未來(lái)的運(yùn)動(dòng)。
Sebastiaan van Dijken教授說(shuō):“我們緊湊的傳感器內(nèi)存和計(jì)算解決方案為自主機(jī)器人和人機(jī)交互提供了新的機(jī)會(huì)。我們?cè)谑褂霉庹{(diào)制器的系統(tǒng)中獲得的幀內(nèi)信息避免了冗余的數(shù)據(jù)流,從而實(shí)現(xiàn)了實(shí)時(shí)的節(jié)能決策?!?