如今機器學習系統(tǒng)到處都是,但它或多或少是隱形的。它隱藏在后臺優(yōu)化音頻,或在圖像中識別人臉。但這個新系統(tǒng)不僅是可見的,而且是物理的。它不是通過計算數(shù)字,而是通過彎曲光線來進行AI型分析。它怪異且獨特,但和人們的第一感覺恰恰相反,它反而很好地證明了這些“人工智能”系統(tǒng)是多么的簡單。
機器學習系統(tǒng),我們常把它稱作人工智能的一種形式,其核心是一系列基于數(shù)據(jù)的計算,每一組數(shù)據(jù)都是構建于最后一個反饋或循環(huán)中。計算本身并不是特別復雜,盡管它們不是你想的那種用鋼筆和紙做的數(shù)學運算。最終,所有這些簡單的數(shù)學計算最終會把輸入的數(shù)據(jù)與它“學會”識別的各種模式匹配。
但問題是,一旦這些“層”最終被“訓練”完成,在許多方面,它就會反復地執(zhí)行相同的計算。通常這意味著它可以優(yōu)化,從而不會占用太多的空間或CPU資源。但是來自加州大學洛杉磯分校的研究人員表明,它確實可以被固化,這些層本身就是3d打印的透明材料層,它們被復雜的衍射圖樣印在上面,就像數(shù)學運算時要把數(shù)字寫下來一樣。
如果這有點麻煩的話,想一個機械計算器。如今,這一切都是在計算機邏輯中數(shù)字化完成的,但在過去,計算器使用的是實際的機械部件移動,在某種程度上,這種“衍射深層神經(jīng)網(wǎng)絡”和以下情況很像:它使用和操作數(shù)字的物理表示,而不是電子表示。
正如研究人員所說:在給定層上的每個點都可以傳輸或反射射入的波,它代表一個人工神經(jīng)元,通過光學衍射與下面層的其他神經(jīng)元相連。每個“神經(jīng)元”都可通過改變相位和振幅來調(diào)節(jié)。
“我們的全光學深度學習框架,能夠以光速完成計算機神經(jīng)網(wǎng)絡可以實現(xiàn)的各種復雜功能。它的功能非常多,而且速度很快,這項技術在世界上也非常先進,”研究人員在描述他們的系統(tǒng)的論文中寫道。
為了證明這一點,他們訓練了一個深入的學習模型來識別手寫數(shù)字。一旦發(fā)現(xiàn)它是最終的,他們采取的層次矩陣數(shù)學,會將它轉(zhuǎn)換成一系列光學轉(zhuǎn)換。例如,一層可能是通過將兩層的光線重新聚焦到下一層的一個區(qū)域,并將值相加來實現(xiàn)的——真正的計算要復雜得多,但希望你能理解。
通過在印版上安排數(shù)以百萬計的微小變換,進入一邊的光線從另一端發(fā)出,這樣系統(tǒng)就能以超過90%的準確度分辨出它是1 2 3等等。
你問這有什么用?事實上現(xiàn)在還沒有。但是神經(jīng)網(wǎng)絡是一種非常靈活的工具,它完全有可能使系統(tǒng)識別字母而不是數(shù)字,使光學字符識別系統(tǒng)完全在硬件上工作,而幾乎不需要功耗或計算。為什么不需要基本的人臉或圖形識別,不需要CPU?那在你的相機里會有多大用處呢?
這里真正的限制是制造型的:很難用精確的精度來制造衍射板,并完成一些更苛刻的加工。畢竟,如果你需要計算到小數(shù)點后第七位,但是打印出來的版本只精確到第三位,這時你就會遇到麻煩。
這只是一個概念證明——事實上對于巨型數(shù)字識別機器的需求并不迫切——但這是一個非常有趣的機器。這一想法可能會對相機和機器學習技術產(chǎn)生影響,在現(xiàn)實世界而不是數(shù)字世界中構造光線和數(shù)據(jù)。它可能感覺是在倒退,但也許只是鐘擺在往相反的方向擺動。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )