大多數(shù)人懶得給照片加標(biāo)簽。如果你屬于這一類(大概率事件),那么你一定知道搜索某張照片有多辛苦。 但這很有可能即將成為過(guò)去。
本周,F(xiàn)acebook 披露了其機(jī)器學(xué)習(xí)平臺(tái) Lumos 的更多信息:Lumos 將使用戶們利用相片內(nèi)容進(jìn)行搜索,而不是圖片名稱或是標(biāo)簽。
Facebook 應(yīng)用機(jī)器學(xué)習(xí)負(fù)責(zé)人 Joaquin Quiñonero Candela 解釋說(shuō):
“換句話說(shuō),搜索‘黑襯衫照片‘時(shí),系統(tǒng)能識(shí)別出每張照片里是否有黑襯衫,并據(jù)此搜索;即便照片并沒(méi)有被添加標(biāo)簽也沒(méi)有關(guān)系。”
Lumos 利用了計(jì)算機(jī)視覺(jué)技術(shù)來(lái)識(shí)別照片中的人、動(dòng)物和一系列其他物體。但它遠(yuǎn)不止于此,而是更進(jìn)一大步,能識(shí)別出照片中發(fā)生的“事”。所以在識(shí)別某相片中有某個(gè)人之外,它還能夠判斷該人是在行走、騎馬、彈琴還是在做其他的事情。雷鋒網(wǎng)按,F(xiàn)acebook 并沒(méi)有提供一張 Lumos 所能識(shí)別的人物行為列表,因此目前并不清楚它究竟神通廣大到了何種地步,以及識(shí)別的正確率如何,會(huì)不會(huì)犯下“妖精打架”那樣的錯(cuò)誤。假使正確率尚在接受范圍以內(nèi),相比目前各照片管理軟件還停留于人臉識(shí)別的層次(除了 Google Photos),便是極大的進(jìn)步,其技術(shù)可能成為Google Photos 的直接競(jìng)爭(zhēng)對(duì)手。
Lumos,一個(gè)計(jì)算機(jī)視覺(jué)平臺(tái)
介紹 Lumos,就不得不提 FBLearner Flow。Facebook 使用了它的 FBLearner Flow 平臺(tái)來(lái)開(kāi)發(fā) Lumos。前者是一個(gè)通用型的機(jī)器學(xué)習(xí)流水線(pipeline),開(kāi)發(fā)它的初衷是讓 Facebook 工程師們能同時(shí)執(zhí)行多個(gè) AI 項(xiàng)目,而不需要每次都借助必要的硬件。據(jù) Facebook 透露,現(xiàn)在每月有超過(guò) 120 萬(wàn)個(gè) AI 實(shí)驗(yàn)在 FBLearner Flow 上運(yùn)行。包括 Lumos 在內(nèi)的這些項(xiàng)目,能夠獲取社交網(wǎng)絡(luò)和 app 上永不停歇的數(shù)據(jù)流。
雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))獲知,一開(kāi)始,F(xiàn)BLearner Flow 平臺(tái)只是 Facebook AI 研究部門(mén)(FAIR)的一個(gè)小研究項(xiàng)目。但當(dāng)它達(dá)到量產(chǎn)規(guī)模后,它和開(kāi)發(fā)團(tuán)隊(duì)被轉(zhuǎn)移到了應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)。現(xiàn)在,F(xiàn)BLearner Flow 已是 Facebook 計(jì)算機(jī)視覺(jué)團(tuán)隊(duì)的引擎。
建立在 FBLearner Flow 基礎(chǔ)上的 Lumos,是一個(gè) Facebook 為處理圖像和視頻理解任務(wù)而開(kāi)發(fā)的平臺(tái)。Facebook 的工程師并不需要接受過(guò)深度學(xué)習(xí)或者計(jì)算機(jī)視覺(jué)培訓(xùn),就能使用 Lumos 訓(xùn)練、布置新模型。Lumos 平臺(tái)在不斷改進(jìn),這主要有兩種途徑:
導(dǎo)入新添加標(biāo)記的數(shù)據(jù);
利用 Facebook 應(yīng)用中有注解的數(shù)據(jù)。
深度學(xué)習(xí)的進(jìn)步使得開(kāi)發(fā)者在圖像分類上取得巨大進(jìn)展——類似于“圖片中有什么”、“東西在哪?”這樣的問(wèn)題被系統(tǒng)以前所未有的精確度回答出來(lái)。 Facebook 表示,通過(guò)設(shè)計(jì)出能對(duì)給定圖片中的物體進(jìn)行檢測(cè)、分離的新技術(shù),他們大幅推動(dòng)了在該領(lǐng)域的研究。
當(dāng) Facebook 應(yīng)用這些技術(shù)時(shí),相片會(huì)穿過(guò)一個(gè)深度學(xué)習(xí)引擎,后者能分離圖像、識(shí)別物體和場(chǎng)景、向照片加入更多含義。這產(chǎn)生出任何 Facebook 產(chǎn)品、服務(wù)都能使用的豐富數(shù)據(jù)。
前景
Joaquin Quiñonero Candela 還表示,Lumos 涵蓋的技術(shù)有一系列廣闊的應(yīng)用場(chǎng)景,遠(yuǎn)不止于單純地優(yōu)化圖像搜索。他進(jìn)一步解釋:
“出于‘爭(zhēng)議內(nèi)容檢測(cè),反垃圾信息和自動(dòng)圖像抓取’等目的,已經(jīng)有超過(guò) 200 個(gè)視覺(jué)模型被十幾只不同團(tuán)隊(duì)訓(xùn)練出來(lái),并布置于 Lumos。它們的應(yīng)用領(lǐng)域十分廣,從我們的 Connectivity Labs (互聯(lián)實(shí)驗(yàn)室)到搜索團(tuán)隊(duì),再到 Accessibility (可達(dá)性)團(tuán)隊(duì),大家都在用 Lumos 的技術(shù)。”
雖然 Facebook 在 Lumos 上取得可喜進(jìn)展,但它還稱不上是獨(dú)步天下。谷歌一直在開(kāi)發(fā)圖像掃描 AI 來(lái)提高圖像搜索。去年,谷歌聲稱它的 Inception v3 AI 能夠以 93.9% 的精確度抓取圖片內(nèi)容。雷鋒網(wǎng)消息,最近 Inception v3 又有突破:在它基礎(chǔ)之上將開(kāi)發(fā)能預(yù)警皮膚癌的新 AI。
- 再傳新利好!消息稱極氪開(kāi)啟渠道升級(jí),擬引入代理制模式
- 歷史時(shí)刻!首款鴻蒙電腦問(wèn)世
- 企業(yè)數(shù)量5年暴增超190倍,江蘇東??h成全球穿戴甲核心產(chǎn)區(qū)
- AI CITY@城市智能體生態(tài)聯(lián)盟發(fā)起成立,智慧城市建設(shè)進(jìn)入Agent時(shí)代!
- 英特爾第一季度營(yíng)收127億美元,同比持平
- 國(guó)內(nèi)首個(gè)!百度宣布點(diǎn)亮昆侖芯3萬(wàn)卡集群
- 第三屆百度“文心杯”創(chuàng)業(yè)大賽啟動(dòng) 最高獎(jiǎng)金達(dá)7000萬(wàn)元
- 百度發(fā)布全球首個(gè)電商交易MCP、搜索MCP,幫助開(kāi)發(fā)者全面擁抱MCP
- 百度發(fā)布百度搜索開(kāi)放平臺(tái)·AI開(kāi)放計(jì)劃,開(kāi)放接入各類AI應(yīng)用,賦能應(yīng)用開(kāi)發(fā)者
- 百度發(fā)布多智能體協(xié)作應(yīng)用「心響」,一句話解決復(fù)雜任務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。