11月7日,華為全聯(lián)接大會(HUAWEI CONNECT)2022中國站在深圳拉開帷幕。在“華為云AI持續(xù)創(chuàng)新,加速AI應(yīng)用走深向?qū)?rdquo;分論壇上,華為云發(fā)布《預(yù)訓(xùn)練大模型白皮書》,博瀚智能(深圳)有限公司CEO郭瑋、華為云EI服務(wù)產(chǎn)品部部長尤鵬、華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow、國際歐亞科學(xué)院院士田奇共同出席發(fā)布儀式。
由田奇帶領(lǐng)的華為云盤古大模型研發(fā)團隊認為,大模型將成為未來AI計算的“操作系統(tǒng)”,可以向下管理AI硬件、向上支撐AI算法,使得AI開發(fā)更加規(guī)范化、可復(fù)制。尤鵬表示,華為云希望通過編寫《預(yù)訓(xùn)練大模型白皮書》,將團隊在研究和實踐中的經(jīng)驗固化下來,幫助更多AI從業(yè)人員快速掌握AI技能,持續(xù)創(chuàng)造商業(yè)價值。
華為云發(fā)布《預(yù)訓(xùn)練大模型白皮書》
人工智能算法落地面臨碎片化困境。當前業(yè)界大部分人工智能開發(fā)者普遍沿用傳統(tǒng)的“小作坊模式”進行應(yīng)用開發(fā),即針對每個場景,獨立地完成模型選擇、數(shù)據(jù)處理、模型優(yōu)化、模型迭代等一系列開發(fā)環(huán)節(jié)。由于無法積累通用知識,而且不同領(lǐng)域的數(shù)據(jù)差異巨大、微調(diào)技巧也有所不同,導(dǎo)致開發(fā)效率比較低。
為了解決上述困境,預(yù)訓(xùn)練大模型相關(guān)研究和應(yīng)用呈井噴態(tài)勢。預(yù)訓(xùn)練大模型在大量圖像、文本等數(shù)據(jù)的基礎(chǔ)上,利用無監(jiān)督或者自監(jiān)督學(xué)習(xí)方法將數(shù)據(jù)中蘊含的知識提取出來,存儲在具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型中。遇到特定任務(wù)時,只需調(diào)用規(guī)范化的流程,就能釋放預(yù)訓(xùn)練大模型的能力,并且與行業(yè)經(jīng)驗結(jié)合,解決實際業(yè)務(wù)問題。
華為云盤古大模型于2021年4月正式發(fā)布,到2022年聚焦行業(yè)應(yīng)用落地,已經(jīng)發(fā)展出包括基礎(chǔ)大模型(L0)、行業(yè)大模型(L1)、行業(yè)細分場景模型(L2)三大階段的成熟體系。在華為全聯(lián)接大會2022中國站上,華為云進一步迭代盤古大模型的技術(shù)能力,擴展盤古大模型的服務(wù)范圍,發(fā)布盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項重磅服務(wù)。
華為云盤古氣象大模型,為行業(yè)數(shù)字化插上AI氣象分析的翅膀
極端天氣會帶來巨大的生命和財產(chǎn)損失。華為云盤古氣象大模型能夠秒級預(yù)測未來7天全球天氣情況,相比傳統(tǒng)預(yù)報算法,速度提升1000倍、精度提升20%。今年8月,盤古氣象大模型預(yù)測臺風(fēng)“馬鞍”的軌跡和登陸時間,準確率達90%,遠超行業(yè)平均水平。在海外,華為云為印尼打造了“國家海洋人工智能平臺”,助力預(yù)測海洋災(zāi)害,保障航行安全。此外,華為云AI for Meteorology還可以用于農(nóng)業(yè)、航空、航天等領(lǐng)域。
華為云盤古礦山大模型,讓AI推動礦山安全高效作業(yè),沉淀專家經(jīng)驗
為了解決AI在煤礦行業(yè)落地難、門檻高等問題,華為云打造了全棧性能領(lǐng)先的盤古礦山大模型。只需導(dǎo)入海量無標注的礦山場景數(shù)據(jù)進行預(yù)訓(xùn)練,盤古礦山大模型即可進行無監(jiān)督自主學(xué)習(xí),僅一個大模型就能覆蓋煤礦的采、掘、機、運、通等業(yè)務(wù)流程下的1000多個細分場景,讓AI應(yīng)用在煤礦普及更容易。
在主運場景中,基于盤古礦山大模型的AI主運智能監(jiān)測系統(tǒng)能夠精準識別大塊煤、錨桿等異常情況,異物識別準確率達98%。此外,相較于人工巡檢,盤古礦山大模型實現(xiàn)了全時段巡檢,幫助工作人員及時地發(fā)現(xiàn)問題,避免因漏檢造成的安全事故,縮短停機時間,同時提升井下巡檢人員的工作效率。
在掘進場景中,基于盤古礦山大模型的掘進作業(yè)序列智能監(jiān)測,動作規(guī)范識別準確率超過95%,用規(guī)范的AI流程來替代不確定的人工流程,讓AI成為礦工規(guī)范作業(yè)的好幫手,保障井下作業(yè)安全。
一個礦山大模型覆蓋多個業(yè)務(wù)場景,加速AI落地進程
華為云盤古OCR大模型,一個模型覆蓋通用文字識別場景
OCR技術(shù)是人工智能的基礎(chǔ)之一,能夠?qū)Y(jié)構(gòu)多變、種類多樣、來源豐富的非結(jié)構(gòu)化數(shù)據(jù)進行識別與提取。傳統(tǒng)的OCR廠商通常從特定的應(yīng)用切入,陸續(xù)發(fā)展出卡證識別、票據(jù)識別、文檔識別、表格識別、車牌識別、智能掃碼等一系列細分OCR能力,通過組合的方式服務(wù)于各個行業(yè)。行業(yè)中每產(chǎn)生一個的新的識別場景,都需要在標注后才能訓(xùn)練一個新的模型。這使得OCR服務(wù)的開發(fā)、維護成本居高不下。
華為云發(fā)布盤古OCR大模型,通過獨有的對比學(xué)習(xí)與掩膜圖像建模相融合的自監(jiān)督學(xué)習(xí)方法,學(xué)習(xí)并充分利用大規(guī)模的無標簽數(shù)據(jù),實現(xiàn)一個模型覆蓋多個領(lǐng)域的全部通用文字識別場景,并將標注工作量降低90%。此外,盤古OCR大模型在11項經(jīng)典數(shù)據(jù)集測試中取得顯著的精度提升,而且與原本領(lǐng)先的文字識別算法相比,盤古OCR大模型的精度平均提升5%以上。
日前,華為云盤古預(yù)訓(xùn)練大模型通過了中國信息通信研究院首輪大模型測評,在“模型開發(fā)”和“模型能力”兩部分達到當前最高標準(4+級),并在計算機視覺、自然語言處理、科學(xué)計算等領(lǐng)域為業(yè)界貢獻了覆蓋百余個業(yè)務(wù)場景的先進算法和解決方案。
未來,華為云將持續(xù)夯實盤古預(yù)訓(xùn)練大模型的能力,將AI技術(shù)以及行業(yè)落地經(jīng)驗云化、服務(wù)化,讓企業(yè)創(chuàng)新觸手可及。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )