#昇騰逐夢人# AI編程,是全球人工智能博弈的價值高地。孵化自北京大學(xué)的aiXcoder,在全球最早將深度學(xué)習(xí)應(yīng)用于代碼生成與代碼理解領(lǐng)域,更開創(chuàng)了"輕量化實現(xiàn)更強代碼生成效果"的技術(shù)新范式。
作者 |小葳
圖片來源|攝圖
2024年以來,AIGC for Code成為AI領(lǐng)域備受追捧的熱門賽道。
在硅谷,從火爆的AI編程助手Cursor,到Poolside、Replit等獨角獸的快速崛起,AI正在推動軟件開發(fā)完成從“人力密集”到“人機協(xié)同”、"智能增強"的歷史性跨越。
在國內(nèi)市場,aiXcoder是在代碼大模型領(lǐng)域嶄露頭角的明星企業(yè)。孵化自北京大學(xué)軟件工程研究所的aiXcoder,是全球最早將深度學(xué)習(xí)技術(shù)應(yīng)用于代碼生成與代碼理解領(lǐng)域的團隊。其智能化軟件開發(fā)解決方案已在金融、軍工、航天、通信、軟件服務(wù)、互聯(lián)網(wǎng)等行業(yè)實現(xiàn)規(guī)模化落地。
代碼大模型要穿透企業(yè)應(yīng)用的"最后一公里",算法創(chuàng)新與AI基礎(chǔ)軟硬件的融合已是必然趨勢。在昇騰AI創(chuàng)新大賽2024全國總決賽中,aiXcoder憑借“基于代碼大模型的企業(yè)智能化軟件開發(fā)解決方案”,從全國3700多支隊伍中脫穎而出,斬獲企業(yè)賽道(應(yīng)用創(chuàng)新組)金獎!
當越來越多企業(yè)對研發(fā)平臺提出更智能、更高效、自主可控的新需求,aiXcoder如何讓代碼大模型加速落地各行各業(yè)?aiXcoder與昇騰的強強聯(lián)合,又將為國內(nèi)代碼大模型市場帶來哪些新價值?
01 深入破局錨定技術(shù)與市場的最佳契合點
傳統(tǒng)軟件開發(fā)一直存在重復(fù)性勞動占比高、人力成本高、效率低下等諸多痛點。如何將前沿人工智能技術(shù)應(yīng)用于軟件工程領(lǐng)域,幫助開發(fā)者從繁瑣的編碼工作中解脫出來,將更多精力投入到核心業(yè)務(wù)邏輯的設(shè)計與實現(xiàn)上,是aiXcoder的初心。
早在2013年,北大aiXcoder就開始研究如何將深度學(xué)習(xí)應(yīng)用于代碼生成和代碼理解,并于2014年發(fā)表了該領(lǐng)域在全球范圍內(nèi)最早的論文。目前,aiXcoder累計在國際頂級期刊和會議發(fā)表論文100余篇,其中多篇是智能化軟件工程領(lǐng)域的首篇論文和引用率最高的論文。
ChatGPT誕生以來,主流廠商都推出了自己的大模型,然而通用大模型與企業(yè)級軟件開發(fā)場景間仍存在顯著能力鴻溝。aiXcoder自創(chuàng)立之初便深入洞察企業(yè)開發(fā)者真實需求,并根據(jù)這些痛點設(shè)計產(chǎn)品的底層邏輯:
首先,結(jié)合代碼特性訓(xùn)練的代碼大模型,是生成更準確代碼的根本所在?,F(xiàn)有通用大模型并未充分考慮軟件開發(fā)的具體場景,往往將代碼視作自然語言文本進行處理,忽略了代碼的結(jié)構(gòu)性和復(fù)雜的上下文關(guān)系,導(dǎo)致生成的代碼不夠準確。
其次,結(jié)合企業(yè)私域數(shù)據(jù)生成更符合特定行業(yè)和領(lǐng)域的代碼,是企業(yè)應(yīng)用大模型的關(guān)鍵。不同企業(yè)在業(yè)務(wù)需求、行業(yè)規(guī)范、軟件開發(fā)框架及運行環(huán)境方面千差萬別,這也是通用代碼大模型難以落地企業(yè)的原因。
“學(xué)習(xí)并掌握‘領(lǐng)域化’知識,才是大模型在企業(yè)成功落地的關(guān)鍵。為企業(yè)客戶解決領(lǐng)域化問題,正是我們的差異化價值所在。”aiXcoder商業(yè)合伙人兼總裁劉德欣曾這樣表示。
第三,數(shù)據(jù)隱私與安全合規(guī),是企業(yè)落地大模型的前提考慮。數(shù)據(jù)分析服務(wù)商Cyberhaven的數(shù)據(jù)顯示,員工直接發(fā)給ChatGPT的企業(yè)數(shù)據(jù)中,有11%都是敏感數(shù)據(jù)。代碼承載著企業(yè)核心數(shù)據(jù)資產(chǎn),很多企業(yè)應(yīng)用AI編程一個最關(guān)鍵的訴求就是私有化本地部署。
如何滿足企業(yè)對AI編程不斷升級的需求,aiXcoder在與昇騰的深度合作中探索出新的機遇,并在昇騰AI創(chuàng)新大賽中一展身手。作為面向AI開發(fā)者的頂級賽事,昇騰AI創(chuàng)新大賽既是aiXcoder展示技術(shù)實力的舞臺,也是與全國AI創(chuàng)新企業(yè)切磋交流的平臺。
“昇騰AI創(chuàng)新大賽對aiXcoder有獨特的吸引力。我們看到眾多優(yōu)秀參賽作品已經(jīng)將大模型能力在多個行業(yè)場景落地,展現(xiàn)出巨大潛力。同時各個參賽企業(yè)都具備很強的AI研發(fā)能力,并都從各自的角度探索與昇騰生態(tài)的深度結(jié)合,很高興能和這些很棒的團隊相遇。”aiXcoder一位技術(shù)負責人表示。
02 昇騰賦能軟硬協(xié)同的智能化開發(fā)突圍戰(zhàn)
昇騰AI創(chuàng)新大賽中,aiXcoder的獲獎方案“基于代碼大模型的企業(yè)智能化軟件開發(fā)解決方案”差異化優(yōu)勢明顯。這背后也離不開昇騰提供了從底層硬件到基礎(chǔ)軟件、社區(qū)資源在內(nèi)的全方位賦能。
優(yōu)勢一,以小參數(shù)量達到更強的代碼生成效果,以低延時、低資源占用的特點滿足企業(yè)私有化部署要求。
aiXcoder在模型預(yù)訓(xùn)練階段就做了大量工作讓模型理解代碼處理任務(wù),專門面向軟件工程領(lǐng)域預(yù)訓(xùn)練代碼大模型,以7B參數(shù)量實現(xiàn)超越5倍參數(shù)規(guī)模模型的代碼生成性能,以低延時、低資源占用特點去滿足企業(yè)用戶的私有化部署要求。
這背后,離不開aiXcoder多年在軟件工程和代碼大模型領(lǐng)域的技術(shù)積累。
2021年4月,團隊便推出完全自主知識產(chǎn)權(quán)的十億級參數(shù)代碼大模型 aiXcoder L 版,成為全球?個基于?模型的智能編程商?產(chǎn)品;
2022年6月,在ChatGPT發(fā)布之前,aiXcoder推出國內(nèi)第一個百億級參數(shù)的大模型,用于支持自然語言描述的方法級代碼生成;
2023年7月,具有代碼自動補全、代碼自動生成、代碼缺陷檢測與修復(fù)、單元測試自動生成等功能且聚焦企業(yè)適配的aiXcoder Europa重磅推出,可根據(jù)企業(yè)數(shù)據(jù)安全和算力要求,為企業(yè)提供私有化部署和個性化訓(xùn)練服務(wù);
2024年4月,aiXcoder正式推出并開源7B代碼大模型,在多個主流測評集上,aiXcoder 7B代碼生成與補全能力超越同級別及更高參數(shù)規(guī)模的開源模型。
2025年4月,aiXcoder進一步升級產(chǎn)品,推出Agent(智能體)模式,并內(nèi)置MCP(大模型上下文協(xié)議)功能,創(chuàng)新為軟件開發(fā)行業(yè)帶來全流程自動化解決方案。該技術(shù)通過模擬人類開發(fā)者的任務(wù)規(guī)劃、工具調(diào)用、自主反思、邏輯推理等能力,可智能完成項目級代碼生成、修改、調(diào)試、重構(gòu)等復(fù)雜軟件開發(fā)任務(wù),顯著提高企業(yè)研發(fā)效率,大幅縮短研發(fā)周期,助力企業(yè)數(shù)字化轉(zhuǎn)型。
基于AI技術(shù)最新發(fā)展持續(xù)迭代自研模型,aiXcoder構(gòu)建起覆蓋軟件開發(fā)全鏈條的技術(shù)壁壘,最終形成差異化的產(chǎn)品競爭力。
優(yōu)勢二,強大的深度定制能力,幫企業(yè)打造專屬領(lǐng)域化代碼大模型。
aiXcoder依托自身在軟件工程領(lǐng)域的深厚積累和多行業(yè)實踐,可以根據(jù)企業(yè)需求提供量身定制的領(lǐng)域化方案,支持有效個性化訓(xùn)練、領(lǐng)域基礎(chǔ)代碼prompt化、偏好對齊等領(lǐng)域化落地方式,讓大模型充分學(xué)習(xí)企業(yè)領(lǐng)域化知識。與此同時,從客戶的個性化需求中萃取出具有通用價值的能力與工具,形成標準化的產(chǎn)品和流程交付給客戶。
aiXcoder積累了深厚的垂直領(lǐng)域模型構(gòu)建能力,無論客戶是獨特的嵌入式代碼或企業(yè)自有IDE,甚至需要提供MATLAB等語言訓(xùn)練需求,都可以根據(jù)客戶私域數(shù)據(jù)及環(huán)境進行領(lǐng)域化訓(xùn)練和集成。
優(yōu)勢三,通過適配昇騰MindIE推理引擎實現(xiàn)推理速度提升6倍以上,通過并行解碼提升計算資源利用率和增強并行處理能力。
代碼大模型對系統(tǒng)響應(yīng)速度要求極高,任何低效和延遲都將擾亂開發(fā)者的工作節(jié)奏。aiXcoder 7B大模型通過了昇騰技術(shù)認證,更高推理速度可以提供更加高效、流暢的開發(fā)體驗。
為了讓代碼大模型更好地適配昇騰AI基礎(chǔ)軟硬件,aiXcoder研發(fā)團隊進行了大量調(diào)優(yōu)工作,包括權(quán)限設(shè)置問題、`rank_table_file.json` 配置、`config.json` 配置等。
這背后,昇騰社區(qū)和技術(shù)專家提供了全面支持。MindIE是基于昇騰硬件的運行加速、調(diào)試調(diào)優(yōu)、快速遷移部署的高性能深度學(xué)習(xí)推理框架,其支持主流第三方框架,并通過統(tǒng)一接口使能極簡開發(fā)。同時,昇騰社區(qū)完善的技術(shù)文檔、華為專家及時的技術(shù)解答也加快了aiXcoder的適配進程。
此外,在產(chǎn)品形態(tài)方面,aiXcoder與昇騰攜手推出“智能化軟件研發(fā)一體機”,為企業(yè)提供軟硬一體、安全可靠的大模型快速落地解決方案,助力企業(yè)實現(xiàn)從算力到軟件一站式部署。
硬件層面,一體機支持英偉達A800(2/4/8卡)、V100(4/8卡)、昇騰910B(8卡)等多種GPU配置,滿足復(fù)雜和高性能計算需求。
軟件層面,一體機以aiXcoder自研代碼大模型為核心引擎,具備代碼生成與補全、代碼解釋、代碼注釋生成、單元測試生成、代碼缺陷監(jiān)測、代碼智能問答等系統(tǒng)化軟件研發(fā)輔助能力,助力企業(yè)整體提高研發(fā)水平。
同時,一體機集成研發(fā)效能統(tǒng)計、權(quán)限管理、負載均衡、模型灰度發(fā)布和系統(tǒng)監(jiān)控等多項企業(yè)級管理功能,實現(xiàn)代碼大模型的有效管理和效果評估。
03 產(chǎn)業(yè)實踐從金融到航天的軟件開發(fā)變革
不同于通用型AI編程工具,aiXcoder聚焦領(lǐng)域Know-how沉淀,專注為大中型企業(yè)提供基于代碼大模型的智能化軟件開發(fā)解決方案,包含私有化部署、領(lǐng)域化大模型落地及定制化開發(fā)等服務(wù)。
經(jīng)過持續(xù)的技術(shù)迭代與場景驗證,目前aiXcoder已突破AI編程在企業(yè)落地中的"最后一公里",在軍工、金融、航天、軟件服務(wù)、機器人等行業(yè)已成功部署數(shù)十個項目,實現(xiàn)多場景落地應(yīng)用。
在金融行業(yè),針對某證券公司代碼質(zhì)量參差不齊、單元測試覆蓋率低、重復(fù)代碼多等痛點,aiXcoder解決方案實現(xiàn)代碼自動生成和補全占比達30%,代碼質(zhì)量大幅提升。
在軟件服務(wù)行業(yè),aiXcoder聯(lián)合全球領(lǐng)先的應(yīng)用軟件產(chǎn)品和解決方案提供商信華信,共同構(gòu)建軟件工程領(lǐng)域大模型,帶動軟件實踐項目缺陷數(shù)量降低近34%,代碼采納率平均達47%。
在航天領(lǐng)域,aiXcoder與航天502所聯(lián)合推出首個先進人工智能技術(shù)與軟件工程相結(jié)合、自動將控制算法生成程序代碼的軟件開發(fā)產(chǎn)品,極大提高航天軟件開發(fā)效率和質(zhì)量。
在機器人行業(yè),特斯聯(lián)科技集團通過引入aiXcoder智能輔助編程工具,實現(xiàn)研發(fā)整體提效近40%,單元測試行覆蓋率達85%。過去開發(fā)者理解1000行機器人代碼需要1小時,在aiXcoder幫助下僅需10分鐘就能完成。
結(jié)語
AIGC已推動軟件研發(fā)來到歷史變革的十字路口,aiXcoder與昇騰的深度協(xié)同,為中國AI for Code賽道樹立標桿意義:自主創(chuàng)新AI基礎(chǔ)設(shè)施與領(lǐng)域代碼大模型的深度耦合,為企業(yè)級軟件開發(fā)效率瓶頸找到了突破口。
在產(chǎn)業(yè)維度,依托領(lǐng)域代碼大模型構(gòu)建起"行業(yè)知識沉淀-開發(fā)流程再造-商業(yè)價值裂變"的增強回路。在生態(tài)維度,以全棧自主創(chuàng)新打通"算力供給-模型訓(xùn)練-場景落地"的創(chuàng)新鏈條。
aiXcoder與昇騰的強強聯(lián)手,不僅標志著軟件開發(fā)范式變革的臨界點已然到來,還預(yù)示著自主創(chuàng)新軟件開發(fā)生態(tài)正在形成新的護城河。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )