袁岳,零點有數董事長,黑蘋果青年公益理事長,飛馬旅聯合創(chuàng)始人,獨立媒體人,發(fā)表關于數據科學、管理科學、社會群體研究等相關領域著作逾一千三百五十萬字。2021年,在世界人工智能大會之算法峰會期間,袁岳接受億歐專訪,就“算法產業(yè)化”進程中的機遇與挑戰(zhàn)分享了洞見。本次2023世界人工智能大會期間,袁岳再次接受媒體關于算法模型的專訪,闡述當下算法模型發(fā)展的產業(yè)價值,深化大模型背景下算法模型發(fā)展的新議題。
問:ChatGPT的到來引發(fā)了對模型的廣泛討論,而在此之前,我們更多提到的是算法,您認為“模型”和“算法”之間有什么聯系?
零點有數董事長袁岳:ChatGPT作為人工智能領域的熱門話題之一,引發(fā)了公眾對大模型的關注熱潮,并將其視為一個新興概念。實際上,"算法"和"模型"可以理解為同一概念,在我們談論人工智能時,算法模型作為其核心的基礎組成部分,不僅在模型精度上,在表達技術和系統(tǒng)鑲嵌方式上也存在差異。
未來的人工智能在實現其功能時需要多個系列的算法模型來支撐,把整個算法系列叢串聯起來,可以直觀地看到若干算法模型的組成。
首先,讀取算法在人工智能中扮演著關鍵角色,它能自動閱讀不同形式的數據,包括視覺、文本、數字,還是掃描探頭中的數據,并承擔著學習和數據分析的任務。最后數據讀取完成后,再通過分析算法進行數據分析,進一步做出相應的決策或針對性行動。
附圖 2021年億歐專訪零點有數董事長袁岳

不論是推理、預測、判別、搜索、推薦、匹配、治療、危機管理還是人員調度等任務,都涉及特定類別的算法模型。這些模型在協(xié)同工作中形成一個完整的人工智能系統(tǒng),為公眾提供了優(yōu)越的決策支持和行動能力。未來,這些模型將不斷優(yōu)化,為各領域發(fā)展帶來更廣闊的應用前景。
問:如今業(yè)界內大、中、小模型蓬勃發(fā)展,這三者之間有何區(qū)別?在大模型時代,中小模型將如何發(fā)展?
零點有數董事長袁岳:從小模型,中模型,再到大模型,其實可以看作是模型復雜程度和應用范圍的遞增關系。
附圖 袁岳在第三屆BPAA算法應用實踐典范進行主題分享

小模型通常用于解決具體的問題或細節(jié)場景,以股票交易為例,通過簡單算法的開發(fā),可設定一個止損點和最佳賣出點,當股票上漲到某個閾值時則自動賣出股票,同樣地,當股票下跌到一定程度時也將自動賣出,以免造成更大損失。
而大模型具有通用人工智能的特點,涉及高密度技術學習技術、算法模塊的自動組合技術,從而使其預備更強的遷移使用和算法生存能力。以ChatGPT為代表的大模型為例,其在開始階段就涵蓋多領域的算法模塊,具備更豐富的模塊組合能力、跨領域和多領域的行動能力及決策指導能力,能夠實現聊天、決策等多種功能。另一方面,大模型也為我們利用技術學習和算法生成技術來高效建設中小模型提供了重要基礎。
中模型則介于小模型和大模型之間,在特定領域中發(fā)揮作用。例如在相親網站上找對象,需要收集各類信息,考察其在不同維度上的表現,然后進行綜合判斷。在這種情況下,對算法的準確性和精度要求較高,需要集成多個算法模塊,形成一定規(guī)模和密集度的中模型。
如果把基礎算法作為我們得以展開技術建模的算法基本工具庫看成一層樓,那么通用算法就是二層樓,而GPT類的大模型建設為我們開發(fā)應用算法累積了足夠強悍的二層樓機制,它不僅為很多主體提供了便捷的問題探索解決方案,還為處在三層樓的我們在特定領域開發(fā)垂直應用算法提供了高效的支持。因此,我們今天需要形成起碼的小模型開發(fā)能力,在中模型領域形成實際的操作能力,再邁向具有實際意義的大模型建設。
問:2023 WAIC 數據要素與隱私計算高峰論壇上提到,數據流通與隱私安全的平衡,是大模型應用面臨的一個重要問題。您如何看待模型開源的重要性?
零點有數董事長袁岳:算法本身的快速發(fā)展高度依賴于開源,作為應用算法的開發(fā)工具和基礎條件,開源的算法資源庫對人工智能發(fā)展至關重要。全球范圍內,美國互聯網大廠、軟件巨頭和歐美相當部分的計算機大學為基礎算法的開發(fā)和開源做出了最重要的貢獻,在大模型和中模型部分也匯集了大量開源的通用算法和技術。目前GPT-3.5和GPT-3.0已經在很大程度上進行開源,國內的大模型項目也提供了開源和API接入合作,大幅降低技術更新成本,極大地改善了算法開發(fā)和演進的通道。
附圖 BPAA第三屆應用算法實踐典范正式啟動

開源的另一個意義在于模型的高度重復使用性。例如在智慧政務領域,我們不再需要所有部門建立系統(tǒng)和算法,而是通過高度可復用的模型進行開發(fā)。在各行政部門解決類似問題的情況下,可以復用和調用其中的模塊技術,通過重新集成和組合不同的可調用模塊技術,更快、更高效地開發(fā)出新的深度解決問題的算法模型。因此,即使在規(guī)模龐大的情況下,開源和有限范圍內的共享也能夠極大地提高數字化的效率,同時降低數字化成本,極大減少重復建設的投入。在這樣的背景下,算法模型將以更高的水平拓展,為社會提供更優(yōu)質、更智能的服務。
總的來說,算法模型是值得投資的領域。盡管對于僅擅長或熱衷于提供系統(tǒng)平臺開發(fā)和重復開發(fā)的數字化技術企業(yè)來說,這并不能算是好消息,因為其生意總量在減少,但從可持續(xù)性和真實需求的角度來看,特別是在當前經濟增長面臨巨大挑戰(zhàn)、政府財稅能力受限的情況下,通過算法模型的發(fā)展進入到數字化內容建設階段和高精度智能建設階段是十分重要且必要的。這個階段性價比更高,具有更清晰的建設目標和更高的建設精準度。
問:隨著ChatGPT興起,大模型爆發(fā)式涌現,有人提出大模型已成為發(fā)展趨勢,推動AI邁向通用人工智能,也有人認為大模型沒有投資價值,您對此持何看法?
零點有數董事長袁岳:我非常贊同最近一些業(yè)界人士的觀點,即我們當前在算法模型的發(fā)展方面應聚焦于垂直領域和關鍵領域,并在這些領域積累基礎數據語料,訓練出足夠精度的模型,并將其匯聚成具有領域解決能力和競爭力的綜合性解決方案。從我自身的觀點和敏感度來看,中模型領域是一個重點發(fā)展方向,我認為這種方法更具范例性,也更具投資價值。
附圖 第三屆BPAA應用算法實踐典范圓桌論壇

一方面,算法模型的發(fā)展將改變對數據的要求,推動和優(yōu)化數據的價值體現、供應能力和交易方式。模型的應用精度將隨著數據不斷豐富而提高,同時隨著算法模型不斷優(yōu)化,其數據處理效率和數據復用能力都將顯著提高。
另一方面,先進的算法需要更大的算力支持,算法的不斷進化對算力的要求不斷提高,需要高精度和高通量的算法支持,因此,對于建設算力中心和提供算力支持的要求變得更加明確、精準和清晰。從這個意義上說,算法實際上定義了算力和算量發(fā)展的最新方向和要求。
問:與國際相比,您認為我國算法模型發(fā)展是否已經能夠與ChatGPT等大模型競爭?
零點有數董事長袁岳:隨著ChatGPT的問世,網絡輿論中出現了所謂“百模大戰(zhàn)”的說法。盡管當前號稱的“大模型”引起了廣泛關注,給人以數量眾多的印象,但這些模型在用戶實際應用和競爭領域中,并未真正進入實戰(zhàn)場景,也沒有展現出實際競爭力??梢哉f,“百模大戰(zhàn)”也許只是一場虛張聲勢。
與國際相比,我國算法模型在整個大模型項目中缺乏競爭力。盡管科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國人工智能大模型地圖研究報告》(以下簡稱為《報告》)顯示,中國研發(fā)的大模型數量排名全球第二,僅次于美國,但實際上我們能夠真正達到大模型水平的數量有限,能與ChatGPT匹敵的模型更是沒有,無論是在投入準備、開發(fā)目標還是應用經驗方面,目前仍然沒有與GPT技術相對應的解決方案。
《報告》顯示,我國參數規(guī)模在10億以上的大模型數達79個,其中約有1/3的為通用大模型,其余2/3被稱為行業(yè)垂直大模型或行業(yè)應用大模型。
在這些通用大模型中,僅有1/5具備多領域的語料標注和實際場景的訓練和應用經驗,其余4/5的模型是基于GPT或準GPT等開源算法技術進行集成。這些集成提供了一些基礎工具和支持,但由于缺乏特定領域或場景的語料和基礎數據進行模型訓練和實際應用的實踐與探索,也可稱為大模型殼兒或技術框架。
行業(yè)垂直大模型在某個或多個領域中具有豐富的應用功能,積累了領域內的語料標注、模型訓練和應用經驗,并提供了一些解決方案。然而實際上,這些模型中預訓練模型、生成模型或為特定場景提供的解決方案數量很少,甚至有的尚未付諸實踐。
從這方面上看,在數字化解決方法中,算法模型的投入需求已十分迫切,亟需加強對關鍵領域的投入和投資,包括算法模型的開發(fā),以及算法模塊和算法系列的構建。
問:您認為當前算法模型建設需要如何努力?結合本次bpaa各領域賽道的案例呈現,您對其算法產業(yè)走向深層次應用有何展望?
零點有數董事長袁岳:當前算法模型建設面臨重重挑戰(zhàn),任重而道遠。各地的人工智能項目、智慧城市建設和智慧行業(yè)建設對于模型開發(fā)的預算不足,合作伙伴、客戶和供應商之間對于模型開發(fā)投入方面的觀念和結構也沒有發(fā)生重大調整。從這方面來說,我們不僅需要在算法模型領域進行投資,更需要加強對垂直化機制、智慧化建設和內容建設的投入。
在人才建設方面,目前也存在較大人才缺口,算法模型領域的前進步伐需要更多實用的前沿人才提供支撐,而現有人才教育機制的滯后性需要算法模型行業(yè)積極投身到算法模型人才培訓的一線,提供從系統(tǒng)概念、開發(fā)技能,到應用方法、實案訓練的全程支持。
附圖 BPAA算法應用實踐典范200強團隊


在大模型熱的背景下,應用算法為中模型及行業(yè)應用大模型的發(fā)展提供了更好的運行環(huán)境和技術基礎,為算法人才發(fā)展、部署和投入提供更多支持。從2020年上海世界人工智能大會上提出要重視算法產業(yè)化建設,到如今連續(xù)三年成功舉辦BPAA算法應用實踐典范,我們每年都積累了優(yōu)秀的算法模型TOP50代表,而在第三屆新設置創(chuàng)新組和創(chuàng)業(yè)組,分別評選TOP50算法模型代表,迄今為止積累了200強算法團隊。這些團隊是中國本土算法模型的先行者,是在中、小模型已有成就的建設者,也是未來大模型建設重要的支持力量。
在數字新基建的浪潮中,上海市首先強調算法要素建設,于2021年推出《上海新一代人工智能算法創(chuàng)新行動計劃》,同時在普陀區(qū)也形成了屬于自己的算法發(fā)展特色,為BPAA人才落地提供了有力支持。最后,期待更多算法人才和團隊能夠加入進來,助推上海算法產業(yè)化高質量發(fā)展。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )