日韩一级精品一区二区三区-天天在线视频免费公开-久草精品视频在线观看-日韩欧美一区二区三区自拍

 
當前位置: 首頁 » 技術(shù)方案 » 前沿科技 » 正文

引入光學神經(jīng)網(wǎng)絡 解決機器視覺系統(tǒng)諸多缺點


  來源: 中國光學 時間:2021-04-06 編輯:儀器儀表WXF
分享到:

?

在自動化和智能技術(shù)發(fā)展日益成熟的今天,機器視覺系統(tǒng)在許多領(lǐng)域被廣泛應用,包括自動駕駛汽車、智能制造、自動化手術(shù)和生物醫(yī)學成像等。


這些機器視覺系統(tǒng)大多使用基于普通光學鏡頭模組的相機,在拍攝通常高達具有數(shù)百萬像素的圖像或視頻后,通常將其饋送到如GPU等數(shù)字邏輯處理單元從而來執(zhí)行一定的機器學習任務,例如物體識別、分類和場景分割等。


藝術(shù)效果圖:基于光學神經(jīng)網(wǎng)絡的機器視覺系統(tǒng)

藝術(shù)效果圖:基于光學神經(jīng)網(wǎng)絡的機器視覺系統(tǒng)


這種經(jīng)典的機器視覺架構(gòu)具有如下幾個方面的缺點:


第一,高像素傳感器拍攝帶來大量信息使其難以實現(xiàn)極高速的圖像或視頻數(shù)字化存儲和分析,尤其在使用移動設備和電池供電的設備時更是帶來了能耗和性能的平衡問題;


第二,所捕獲的圖像通常包含許多對機器學習任務無用的冗余信息,帶來了后端處理器某種程度上的性能負擔,和資源浪費,從而導致在功耗和內(nèi)存需求方面效率低下。


第三,在可見光的波長以外的電磁波段制造高像素數(shù)圖像傳感器(如手機相機中的傳感器)具有很大的挑戰(zhàn)性,且其成本十分昂貴,因而也限制了機器視覺系統(tǒng)在更長波段(如太赫茲)上的應用。


最近,加州大學洛杉磯分校(UCLA)的研究人員開發(fā)了一種新的單像素機器視覺系統(tǒng),通過引入光學神經(jīng)網(wǎng)絡的方式規(guī)避了傳統(tǒng)機器視覺系統(tǒng)的諸多缺點。


新型單像素機器視覺系統(tǒng)

圖1 來自加州大學洛杉磯分校的研究人員發(fā)明了一個新型單像素機器視覺系統(tǒng),該系統(tǒng)可以將物體的空域信息編碼為功率譜,從而實現(xiàn)對圖像進行分類和重建。


該成果以Spectrally encoded single-pixel machine vision using diffractive networks為題發(fā)表在Science Advances。


研究人員借助深度學習技術(shù),設計了一個由多個衍射層組成的衍射光學神經(jīng)網(wǎng)絡(Diffractive Optical Neural Networks)(拓展閱讀?),這些衍射層由計算機自動優(yōu)化設計,可將經(jīng)過的輸入光場調(diào)制成一定的目標分布,從而能夠執(zhí)行計算和統(tǒng)計推斷任務。


與常規(guī)的基于鏡頭模組的相機不同,該衍射光學神經(jīng)網(wǎng)絡以被寬帶光照明的物體作為其輸入,將物體的空域特征信息提取并編碼到衍射光的光譜上,而后光譜信號由具有頻譜探測能力的單像素超快傳感器所收集。通過將物體對應的不同的類別分配給不同波長的光頻譜分量,該系統(tǒng)僅使用單像素傳感器探測到的輸出光譜即可自動對輸入對象完成分類,從而無需圖像傳感器陣列和后端數(shù)字處理。這種框架實現(xiàn)了全光學推理和機器視覺,在幀速率、內(nèi)存需求和功耗效率方面具有明顯優(yōu)勢,這些特點對于移動計算(名詞解釋?)應用而言尤為重要。


該系統(tǒng)使用寬帶光對物體進行照明

圖2. 該系統(tǒng)使用寬帶光對物體進行照明。系統(tǒng)分類結(jié)果取決于單像素傳感器測得的輸出光功率譜上10個波長位置上最強的信號,其波長對應的類別即是分類預測結(jié)果。功率譜信號還可以輸入到數(shù)字神經(jīng)網(wǎng)絡中被用于重建物體本身的圖像。


為驗證這一概念,研究人員通過使用單像素傳感器和3D打印的衍射層對使用手寫數(shù)字圖像數(shù)據(jù)集(MNIST)的所構(gòu)建的物體進行分類,在實驗中證明了該框架在太赫茲波段下的性能。研究者基于提前選定的10個波長對實驗系統(tǒng)進行了設計,這10個波長被逐一分配給輸入物的不同類別(對應手寫數(shù)字的0到9),對物的分類結(jié)果取決于傳感器輸出功率譜上10個波長位置上信號最強者的波長對應的類別。


實驗系統(tǒng)中的單像素探測方案基于太赫茲時域光譜術(shù)實現(xiàn),照明光為極短的太赫茲脈沖,網(wǎng)絡的推理以光速在瞬時間完成。


最終,該系統(tǒng)在手寫數(shù)字分類任務中實現(xiàn)了超過96%的分類精度,實驗結(jié)果也與數(shù)值模擬非常吻合,證明了該單像素機器視覺框架在構(gòu)建低延遲、高效的機器學習系統(tǒng)方面的可行性。除物體分類外,研究人員還將此衍射神經(jīng)網(wǎng)絡的輸出與一個簡單的全連接數(shù)字神經(jīng)網(wǎng)絡相連接,僅通過功率譜上10個波長處的信號強度來快速重建此輸入物的圖像,從而實現(xiàn)了圖像的重建或“解壓縮”。


總而言之,這種單像素對象分類和圖像重建框架可以為新的機器視覺系統(tǒng)的開發(fā)鋪平道路。該系統(tǒng)具有低像素數(shù)、低延遲、低功耗和低成本的特點,以高效、節(jié)省資源的獨特優(yōu)勢通過將物體信息進行頻譜編碼來實現(xiàn)特定的推理任務,有望廣泛應用于移動計算、邊緣計算(名詞解釋?)等領(lǐng)域。


此外,該新框架還可以擴展到各種光譜域測量系統(tǒng),例如光學相干斷層掃描、紅外波段成像等,有助于構(gòu)建基于衍射神經(jīng)網(wǎng)絡的光譜和空間信息編碼集成的新型3D傳感和成像方式。


關(guān)鍵詞:光學神經(jīng)網(wǎng)絡 機器視覺 缺點    瀏覽量:28177

聲明:凡本網(wǎng)注明"來源:儀商網(wǎng)"的所有作品,版權(quán)均屬于儀商網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編使用。
經(jīng)本網(wǎng)授權(quán)使用,并注明"來源:儀商網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源的作品,歸原版權(quán)所有人所有。目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如有作品的內(nèi)容、版權(quán)以及其它問題的,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
本網(wǎng)轉(zhuǎn)載自其它媒體或授權(quán)刊載,如有作品內(nèi)容、版權(quán)以及其它問題的,請聯(lián)系我們。相關(guān)合作、投稿、轉(zhuǎn)載授權(quán)等事宜,請聯(lián)系本網(wǎng)。
QQ:2268148259、3050252122。


讓制造業(yè)不缺測試測量工程師

最新發(fā)布
行業(yè)動態(tài)
技術(shù)方案
國際資訊
儀商專題
按分類瀏覽
Copyright ? 2023- 861718.com All rights reserved 版權(quán)所有 ?廣州德祿訊信息科技有限公司
本站轉(zhuǎn)載或引用文章涉及版權(quán)問題請與我們聯(lián)系。電話:020-34224268 傳真: 020-34113782

粵公網(wǎng)安備 44010502000033號

粵ICP備16022018號-4