海量數(shù)據(jù)下,八戒知識產(chǎn)權是如何解決“以圖搜圖”難題的?

移動互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。

然而,即使是技術最為完善的文字搜索,往往也有其乏力的地方。比如,對于商標圖片,如果你不知道編碼,蒼白的文字描述是很難幫你正確檢索到你需要知道的商標圖形的。而此時,你就需要“以圖搜圖”的功能來實現(xiàn)。

正是發(fā)現(xiàn)這一市場痛點,八戒知識產(chǎn)權在2016年開始了商標圖形檢索系統(tǒng)的研發(fā),并于2017年1月成功上線。

海量數(shù)據(jù)下,八戒知識產(chǎn)權是如何解決“以圖搜圖”難題的?

  商標檢索結(jié)果頁面

告別繁復的檢索

近年來,隨著雙創(chuàng)浪潮的推動,以及品牌意識的逐步增強,企業(yè)對商標的重視程度可謂逐年提高。有數(shù)據(jù)顯示,2016年國內(nèi)商標申請注冊量為350萬件,年增速超過20%。隨著創(chuàng)業(yè)公司激增和品牌意識增強,商標申請量將繼續(xù)攀升,僅2018年全國商標注冊申請量就超過700萬件。

由于商標在注冊過程中需要進行唯一性審查,所以檢索重復商標就成了商標注冊代理機構(gòu)的首要工作。就商業(yè)領域而言,商標包括文字、圖形、字母、數(shù)字、三維標志和顏色組合。以往,大部分代理都采用白兔系統(tǒng)。但該系統(tǒng)僅能檢索文字商標,對于復雜的圖形商標,工作人員只能通過人工審查的方式進行,而用圖形內(nèi)容檢索的方式則無疑更加高效。

盡管包括Google、百度等搜索引擎均提供以圖搜圖功能,但因圖像相似度判別復雜度的影響,圖像檢索需要區(qū)分場景才能獲得最佳效果。由于商標圖形數(shù)據(jù)非常獨特,所以直接利用搜索引擎已有的圖形檢索,其結(jié)果往往無法滿足使用者需求。

八戒知識產(chǎn)權商標圖形檢索系統(tǒng)負責人王豪杰介紹,圖形商標搜索包含三步:識別、理解和檢索。在提取特征點進行基礎識別之后,搜索系統(tǒng)需要通過深度學習算法對圖片進行理解,找到相對精確的備選圖形,隨后通過檢索按照相似度排序為用戶提供最符合條件的圖形商標。

“一般而言,圖片搜索的運算量至少是文字搜索運算量的千倍以上,加上圖形搜索比較重視搜索場景,因此對硬件系統(tǒng)和軟件系統(tǒng)要求很高。而圖形商標由于抽象化、非標準化等特性,也使得這項技術比人臉搜索等圖形搜索難度要更大,研發(fā)周期也更長。”王豪杰說。

但這不符合創(chuàng)業(yè)者分秒必爭態(tài)度,所以,八戒知識產(chǎn)權希望利用圖像比較技術和搜索引擎技術,研發(fā)出了一套符合商標審查、準確、高效的商標圖形檢索系統(tǒng)。

海量數(shù)據(jù)下,八戒知識產(chǎn)權是如何解決“以圖搜圖”難題的?

  商標圖形檢索系統(tǒng)界面

跨入只需3秒的以圖搜圖時代

傳統(tǒng)商標審查需人工判別:630多萬個圖形商標按照1806種圖形要素分類,將每個要素下的商標與需判別的商標進行比對,以此判斷商標申請是否通過。

由于商標局審查員對于近似商標的判定具有較大的自由裁量權,八戒知識產(chǎn)權在深入了解審查原則和審查員習慣的基礎上,利用專業(yè)的圖像比較技術和搜索引擎技術,對商標圖像進行了視覺分析及特征提取,并對數(shù)據(jù)庫的數(shù)百萬張圖像特征創(chuàng)建了數(shù)據(jù)索引。在查詢時,自動對檢索結(jié)果進行優(yōu)化排序,并在輸出結(jié)果后提供了多種可自定義的篩選與條件過濾等功能。

經(jīng)過一年的時間,團隊五個技術成員,迭代了十幾版,目前八戒知識產(chǎn)權已將搜索系統(tǒng)運算速度從3分鐘壓縮到3秒以內(nèi),系統(tǒng)也由原來按照圖形商標1806種要素搜索改變?yōu)槿珟焖阉?,搜索結(jié)果的錯誤率在5%以內(nèi)。

同時,通過優(yōu)化核心算法,使硬件成本降低了30%,現(xiàn)在用7臺服務器可以實現(xiàn)原來運行十臺服務器的效果,降低了項目的運維成本。

如今,八戒知識產(chǎn)權的商標圖形檢索系統(tǒng),有著領先的圖片檢索技術,以圖搜圖只需要將目標圖片上傳,一鍵檢索即可找到相似商標圖形詳細信息,還可以對結(jié)果進行篩選,使得你找到更加精確的結(jié)果,不但節(jié)約的商標檢索的時間也大大提高了商標申請的通過率。

現(xiàn)在圖形商標搜索市場各路玩家陸續(xù)加入,從傳統(tǒng)的機構(gòu)如國方、集佳、社文到新興的互聯(lián)網(wǎng)機構(gòu),比如智慧芽,還有產(chǎn)業(yè)投資密集并購。大家齊頭并進,暫未出現(xiàn)一家獨大的局面。

對于來自領域內(nèi)蜂擁而至的競爭,王豪杰認為這并非壞事。“任何市場都有競爭,競爭一方面可以壓迫自身的不斷發(fā)展,另一方面也可以促進市場的繁榮。而最重要的,其實不是市場有多大,而是自己能吃下的蛋糕有多大。”

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-03-15
海量數(shù)據(jù)下,八戒知識產(chǎn)權是如何解決“以圖搜圖”難題的?
移動互聯(lián)網(wǎng)世界,我們的信息獲取方式很大程度上依賴于搜索。然而,即使是技術最為完善的文字搜索,往往也有其乏力的地方。

長按掃碼 閱讀全文