受到跳蛛的啟發(fā),哈佛大學(xué)約翰·保爾森工程與應(yīng)用科學(xué)學(xué)院(SEAS)的研究人員開發(fā)了一種緊湊而高效的深度傳感器。該傳感器將多功能,扁平的金屬元素與超高效算法結(jié)合在一個單鏡頭里來測量深度??捎糜谖⑿蜋C器人、小型可穿戴設(shè)備或輕量級的虛擬現(xiàn)實和增強現(xiàn)實頭盔。(該研究發(fā)表在《美國國家科學(xué)院院刊》上)
盡管我們的技術(shù)不斷進步,但在研發(fā)方面,沒有什么能打敗自然的進化,比如跳蛛。盡管它們的大腦很小,但這種小蛛形綱動物有著令人印象深刻的深度感知能力,這使得它們能夠從幾倍長于身體長度的距離精確地?fù)湎蚝翢o戒心的目標(biāo)。
于是,受到跳蛛的啟發(fā),哈佛大學(xué)約翰·保爾森工程與應(yīng)用科學(xué)學(xué)院(SEAS)的研究人員開發(fā)了一種緊湊而高效的深度傳感器。該傳感器將多功能,扁平的金屬元素與超高效算法結(jié)合在一個單鏡頭里來測量深度??捎糜?a href="http://www.ujy.org.cn/zixun/search.php?kw=%E5%BE%AE%E5%9E%8B%E6%9C%BA%E5%99%A8%E4%BA%BA" target="_blank">微型機器人、小型可穿戴設(shè)備或輕量級的虛擬現(xiàn)實和增強現(xiàn)實頭盔。
下圖顯示了金屬深度傳感器實時捕獲半透明蠟燭火焰的深度的過程。左邊的兩個圖像是相機傳感器捕獲的原始圖像,這兩張圖像由金屬元素形成,并且模糊程度略有不同。通過這兩幅圖像,研究人員實時計算出物體的深度,結(jié)果如下圖右邊所示。
圖片來源:Qi Guo and Zhujun Shi /哈佛大學(xué)
“進化產(chǎn)生了各種各樣的光學(xué)配置和視覺系統(tǒng),而這些光學(xué)配置和視覺系統(tǒng)是為不同目的量身定制的。而光學(xué)設(shè)計和納米技術(shù)最終使我們能夠探索人造深度傳感器和其他視覺系統(tǒng),這些系統(tǒng)同樣具有多樣性和有效性?!闭撐暮现摺⑽锢韺W(xué)博士Zhujun Shi 這樣表示。
當(dāng)今許多深度傳感器,例如手機、汽車和視頻游戲機中的深度傳感器,都使用集成光源和多個攝像頭來測量距離。例如,智能手機上的人臉識別使用數(shù)千個激光點來映射人臉輪廓,這適用于有足夠空間放置電池和快速電腦的大型設(shè)備,但對于像智能手表或微型機器人這樣的功率和計算能力有限的小型設(shè)備呢? 明顯是不適用的。而事實證明,進化為我們提供了許多選擇。
我們知道,人類使用立體視覺來測量深度,這意味著當(dāng)我們看著一個物體時,我們的兩只眼睛中的每只正在收集略有不同的圖像。嘗試以下操作:將手指直接放在您的臉部前面,然后交替睜開和閉合雙眼??纯词种甘侨绾我苿拥??事實上,我們的大腦獲取了這兩個圖像,并逐個像素地對其進行檢查,然后根據(jù)像素的移動方式計算到手指的距離。
但是,這種匹配計算,即你獲取兩幅圖像,然后搜索對應(yīng)的部分,在計算上是很繁瑣的。人類有一個很好的、很大的大腦來進行這些計算,但是蜘蛛沒有。不過,如今跳蛛已經(jīng)進化出一種更有效的深度測量系統(tǒng):跳蛛的每只主眼都有一些分層排列的半透明視網(wǎng)膜,這些視網(wǎng)膜可測量具有不同模糊量的多個圖像。
例如,如果一只跳躍的蜘蛛用一只主眼注視著一只果蠅,那么該果蠅在一個視網(wǎng)膜的圖像中會顯得更清晰,而在另一幅視網(wǎng)膜的圖像中則更模糊。正是這種模糊變化編碼了果蠅的飛行距離信息。
金屬深度傳感器可以實時捕捉果蠅的深度
在機器視覺中,這種距離計算稱為離焦深度。但是到目前為止,要復(fù)制大自然,就需要配備有內(nèi)部動力元件的大型攝像頭,這些攝像頭可以隨時間捕獲不同焦點的圖像。但很明顯,這限制了傳感器的速度和實際應(yīng)用。
而金屬元素可以解決這一問題。