對(duì)AI開發(fā)還不熟?試試這個(gè)開源AI模型生產(chǎn)平臺(tái),秒成專家級(jí)水平

  近日,由云天勵(lì)飛首席科學(xué)家王孝宇博士等多位國(guó)際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺(tái)YMIR正式發(fā)布。

  什么是 YMIR?

  YMIR(挖米匠),是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的開源算法訓(xùn)練平臺(tái),能夠做到以無(wú)代碼開發(fā)的方式,實(shí)現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型驗(yàn)證等功能。YMIR遵從Apache 2.0 許可協(xié)議,商用及個(gè)人使用均免費(fèi)。

  YMIR是由國(guó)際AI科學(xué)家共同發(fā)起的AI基礎(chǔ)軟件平臺(tái)。發(fā)起成員包括:前Snap計(jì)算機(jī)視覺主 席,云天勵(lì)飛首席科學(xué)家王孝宇;美國(guó)硅谷NEC 實(shí)驗(yàn)室媒體分析部主管、UCSD教授,印裔科學(xué)家Manmohan Chandraker;前谷歌、亞馬遜、Snap機(jī)器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官,法裔科學(xué)家William Brendel等。

云天勵(lì)飛首席科學(xué)家 王孝宇

美國(guó)硅谷NEC 實(shí)驗(yàn)室媒體分析部主管、UCSD教授 Manmohan Chandraker

  前谷歌、亞馬遜、Snap機(jī)器學(xué)習(xí)研究員,硅谷初創(chuàng)公司Heali聯(lián)合創(chuàng)始人、首席AI官 William Brendel

  YMIR 的五大特點(diǎn)?

  YMIR是一個(gè)高度自動(dòng)化的AI模型開發(fā)產(chǎn)品。其將模型開發(fā)行為抽象為數(shù)據(jù)收集、模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注等基本操作,并形成標(biāo)準(zhǔn)流程,提供一站式服務(wù)。實(shí)際使用時(shí)以圖形化的交互界面完成數(shù)據(jù)與模型不斷更新迭代的完整流程。由此,YMIR極大降低了AI模型研發(fā)的技能要求,不再要求從業(yè)者具備專業(yè)的AI技能。只要對(duì)系統(tǒng)操作員加以數(shù)據(jù)集、模型訓(xùn)練、模型迭代等概念知識(shí)的少量培訓(xùn),其便具備模型開發(fā)的能力,因而對(duì)人工智能向各行各業(yè)的普及具備重大意義。

  針對(duì)具備一定專業(yè)能力的算法開發(fā)人員,YMIR平臺(tái)提供開放API,使用者可籍此將自己開發(fā)的模型訓(xùn)練、數(shù)據(jù)挖掘、數(shù)據(jù)標(biāo)注、模型診斷等工具對(duì)接YMIR開放接口實(shí)現(xiàn)端到端的一站式模型開發(fā)。

  YMIR 主要以數(shù)據(jù)為中心,集成了數(shù)據(jù)和模型版本控制,同時(shí)引入工作空間等概念,實(shí)現(xiàn)多個(gè)模型開發(fā)任務(wù)的并行快速迭代,為模型的大規(guī)模批量生產(chǎn)提供平臺(tái)性支持。

  YMIRV1.0新增模型生產(chǎn)項(xiàng)目管理

  1、傻瓜式迭代操作流程(保姆式模型開發(fā)流程指引)

  YMIR 新版本與上一版本相比,引入項(xiàng)目管理式的工作流程,使AI模型的生產(chǎn)進(jìn)一步標(biāo)準(zhǔn)化。與老版本相比,模型生產(chǎn)操作員上手時(shí)間大幅縮短,并通過(guò)標(biāo)準(zhǔn)化的生產(chǎn)方式實(shí)現(xiàn)AI模型品控。

  在以項(xiàng)目管理為理念的研發(fā)制式下,模型研發(fā)項(xiàng)目被切分為幾個(gè)關(guān)鍵模塊。每個(gè)模塊對(duì)應(yīng)一個(gè)任務(wù),這些任務(wù)具備前后依賴關(guān)系形成研發(fā)流程。只有流程前方任務(wù)完成后,流程后方任務(wù)才能被啟動(dòng)。如下圖所示,當(dāng)一個(gè)模型研發(fā)項(xiàng)目被創(chuàng)建后,即能看到頁(yè)面上方的任務(wù)迭代流程指引,清晰說(shuō)明當(dāng)前步驟與下一步驟,僅需按照指引點(diǎn)擊鼠標(biāo)操作即可,操作對(duì)小白用戶十分友好、非常銀杏化。

  賬號(hào)登錄后即可見項(xiàng)目創(chuàng)建頁(yè)面

  項(xiàng)目創(chuàng)建成功后的頁(yè)面

  項(xiàng)目創(chuàng)建后的任務(wù)流程指引頁(yè)面

  2、數(shù)據(jù)集自動(dòng)整理

  在AI模型開發(fā)的周期里,模型迭代占據(jù)90%以上的時(shí)間。而數(shù)據(jù)的迭代是模型迭代的關(guān)鍵部分,數(shù)據(jù)也是AI研發(fā)過(guò)程中最為重要的資產(chǎn),因此數(shù)據(jù)更新的追蹤和管理顯得尤為重要。能重現(xiàn)數(shù)據(jù)的更新過(guò)程,便能重復(fù)模型生產(chǎn)過(guò)程。

  YMIR新增數(shù)據(jù)集版本管理功能,能自動(dòng)生成數(shù)據(jù)集版本并記錄每次對(duì)數(shù)據(jù)集的操作。一方面,與上一版本相比,使用者無(wú)需通過(guò)手動(dòng)命名數(shù)據(jù)集對(duì)不同功能數(shù)據(jù)集進(jìn)行區(qū)分,系統(tǒng)會(huì)自動(dòng)進(jìn)行數(shù)據(jù)整理,歸入訓(xùn)練集、挖掘集、測(cè)試集等,并對(duì)這些數(shù)據(jù)集的更新進(jìn)行版本控制。數(shù)據(jù)集和模型的一一對(duì)應(yīng)關(guān)系亦被記錄下來(lái)。此功能對(duì)有大量數(shù)據(jù)挖掘的模型研發(fā)十分友好,減少數(shù)據(jù)集版本的冗余,提高數(shù)據(jù)集管理效率。YMIR用戶再也不用對(duì)著上百個(gè)雷同的數(shù)據(jù)集無(wú)從下手。另一方面,模型的研發(fā)過(guò)程被完整的記錄下來(lái),可輕易重新生產(chǎn)模型。傳統(tǒng)的算法研發(fā)人員工作交接涉及,數(shù)據(jù)集、模型、訓(xùn)練流程等多個(gè)復(fù)雜環(huán)節(jié)的交接,很難重復(fù)之前的工作。而在YMIR平臺(tái)上產(chǎn)生的研發(fā)過(guò)程,尤其是數(shù)據(jù)集的迭代均有完整追蹤,基本不需要交接流程,企業(yè)再也不用擔(dān)心員工突然的離職。

  數(shù)據(jù)集版本管理頁(yè)面(1)

  數(shù)據(jù)集版本管理頁(yè)面(2)

  模型迭代版本管理頁(yè)面

  YMIRV1.0無(wú)縫對(duì)接開放免費(fèi)的標(biāo)注工具LabelFree

  數(shù)據(jù)標(biāo)注的質(zhì)量與效率直接影響模型訓(xùn)練的質(zhì)量與效率,一個(gè)好的標(biāo)注工具可以讓模型訓(xùn)練事半功倍。LabelFree是一個(gè)開放的、可私有化部署的高性能數(shù)據(jù)標(biāo)注系統(tǒng)。其操作簡(jiǎn)單、數(shù)據(jù)可靠,為算法服務(wù)提供可靠的底層數(shù)據(jù)支撐。

  LabelFree項(xiàng)目管理頁(yè)面

  1.大幅提升標(biāo)注質(zhì)量

  LabelFree支持在數(shù)據(jù)標(biāo)注的早期階段對(duì)標(biāo)注質(zhì)量進(jìn)行嚴(yán)格把控。其支持多角色用戶管理功能,當(dāng)角色為質(zhì)檢員時(shí),可對(duì)標(biāo)注結(jié)果進(jìn)行檢查與復(fù)核。

  2.大幅提升標(biāo)注效率

  LabelFree可大幅提升個(gè)人標(biāo)注效率。其支持大量標(biāo)注步驟快捷鍵操作,通過(guò)人機(jī)交互的優(yōu)化顯著提升標(biāo)注效率。

  快捷鍵使用說(shuō)明

  LabelFree亦支持團(tuán)隊(duì)標(biāo)注。其支持多人協(xié)作完成同一標(biāo)注任務(wù),并實(shí)現(xiàn)任務(wù)自動(dòng)分發(fā)。

  同時(shí),LabelFree提供一鍵標(biāo)注服務(wù),幫助需要的個(gè)人及企業(yè)用戶在最短的時(shí)間內(nèi)獲取質(zhì)量可靠的標(biāo)注數(shù)據(jù)。

  3、可靠的數(shù)據(jù)安全管理

  數(shù)據(jù)的完全私有化管理,最大程度的保護(hù)數(shù)據(jù)安全。數(shù)據(jù)集管理服務(wù)依托具有彈性伸縮能力的原生對(duì)象存儲(chǔ),為機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析平臺(tái)提供高性能、高可用的數(shù)據(jù)基座。

  4、完全的免費(fèi)開放平臺(tái)

  LabelFree平臺(tái)對(duì)數(shù)據(jù)集大小、用戶數(shù)量、項(xiàng)目數(shù)量等功能均無(wú)限制,用戶可在平臺(tái)上進(jìn)行各種自定義的數(shù)據(jù)標(biāo)注任務(wù)并獲得良好的體驗(yàn)。

  重磅!挖米匠要開直播啦!手把手教大家使用 YMIR,小白也能成為算法工程師!

  歡迎大家試用新版本,接受所有吐槽哦~?部署或試用過(guò)程中有任何問題都?xì)g迎聯(lián)系小助手“挖米匠”。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )