今年,Generative AI(生成式AI)席卷全球,各種熱點層出不窮,讓全球感受到生成式AI的熱度。
臨近年底,一年一度的云計算盛會--亞馬遜云科技 re:Invent大會上,從各種產(chǎn)品的發(fā)布,到重磅級的合作,再到激烈的討論,生成式AI理所當(dāng)然的成為主角。只不過,亞馬遜云科技對于生成式AI的視角更加令人值得期待。
在現(xiàn)場,亞馬遜云科技CEO Adam Selipsky面向五萬現(xiàn)場觀眾全面展示了亞馬遜云科技生成式AI三層技術(shù)棧:底層基礎(chǔ)設(shè)施層、中間AI大模型服務(wù)以及上層應(yīng)用,旨在幫助用戶提供加速模型訓(xùn)練和推理的先進(jìn)基礎(chǔ)設(shè)施、用于構(gòu)建大型語言模型的完善工具以及提供利用人工智能的豐富應(yīng)用,不斷降低生成式AI的門檻,從而真正推動生成式AI在企業(yè)中的落地。
讓模型訓(xùn)練與推理更加高效
生成式AI的興起,伴隨的是動輒幾千上萬GPU芯片組成的集群、處理龐大規(guī)模的數(shù)據(jù)量以及高效的數(shù)據(jù)傳輸網(wǎng)絡(luò)等,讓人們意識到基礎(chǔ)設(shè)施的重要性。
毫無疑問,云是生成式AI首選的基礎(chǔ)設(shè)施理想之地。從今年 re:Invent大會來看,亞馬遜云科技正在構(gòu)建最為先進(jìn)且可以充分給予用戶選擇權(quán)的基礎(chǔ)設(shè)施。
在大會上,亞馬遜云科技CEO Adam Selipsky表示,生成式AI正在重塑基礎(chǔ)設(shè)施,并與英偉達(dá)創(chuàng)始人黃仁勛共同討論了生成式AI的發(fā)展趨勢,同時宣布亞馬遜云科技是全球第一家在云端配備具有多節(jié)點NVLink技術(shù)的NVIDIA GH200 Grace Hopper Superchips的云服務(wù)商。
另外,英偉達(dá)DGX Cloud也將登陸亞馬遜云科技。黃仁勛介紹道,DGX Cloud是Nvidia的人工智能工廠。此前,DGX Cloud已經(jīng)與微軟Azure、谷歌OCP、Oracle等云廠商達(dá)成DGX Cloud的托管云服務(wù)合作。對于與亞馬遜云科技的DGX Cloud合作,黃仁勛表示非常期待。
據(jù)悉,DGX Cloud將部署在亞馬遜云科技的UltraCluster集群中,利用,Nitro System先進(jìn)虛擬化與安全平臺、Elastic Fabric Adapter(EFA)互連技術(shù)和UltraCluster(超大規(guī)模集群)擴(kuò)展能力,為訓(xùn)練基礎(chǔ)模型和構(gòu)建生成式AI應(yīng)用提供先進(jìn)的大模型訓(xùn)練與推理服務(wù)。
除了與英偉達(dá)合作之外,亞馬遜云科技還宣布了推出第二代推理芯片Trainium2,專為以高性能訓(xùn)練具有數(shù)萬億個參數(shù)或變量的基礎(chǔ)模型和大語言模型而構(gòu)建。相比于上一代芯片,Trainium2訓(xùn)練速度提升多達(dá)4倍、內(nèi)存提升3倍、能效比提升2倍,并能在EC2 UltraClusters中部署多達(dá)100000個芯片,可以在極短的時間訓(xùn)練基礎(chǔ)模型(FMs)和大語言模型(LLMs),同時能效提升多達(dá)2倍。
據(jù)悉,Databricks、Helixon、Money Forward以及 Amazon Search團(tuán)隊等眾多客戶都在使用Trainium訓(xùn)練大規(guī)模深度學(xué)習(xí)模型,隨著Trainium2芯片,以更低成本和更佳能效來更快地訓(xùn)練機(jī)器學(xué)習(xí)模型成為可能。Trainium2在新一代EC2 UltraClusters中可擴(kuò)展多達(dá)100,000個Trainium2加速芯片,并與Amazon Elastic Fabric Adapter(EFA)PB級網(wǎng)絡(luò)互聯(lián),提供的算力高達(dá)65 exaflops,客戶可按需獲得超級計算級別的性能。
此外,亞馬遜云科技還發(fā)布了Graviton4自研通用芯片,性能提升高達(dá)30%,獨立核心增加50%以上,內(nèi)存帶寬提升75%以上,為在Amazon EC2上運行的工作負(fù)載提供更優(yōu)的性能和能效。
從本次大會的發(fā)布來看,亞馬遜云科技的確是站在用戶視角去考慮基礎(chǔ)設(shè)施在生成式AI時代的發(fā)展。首先,尊重用戶的選擇性,構(gòu)建起多種基礎(chǔ)設(shè)施服務(wù),以滿足用戶對于基礎(chǔ)設(shè)施的不同需求;其次,充分利用在基礎(chǔ)設(shè)施集群、網(wǎng)絡(luò)、虛擬化等方面的深厚積累,以云服務(wù)的方式來降低生成式AI的復(fù)雜性,來保證大模型的高效輸出。
讓生成式AI應(yīng)用構(gòu)建更容易
如果說強(qiáng)大的基礎(chǔ)設(shè)施在幫助用戶們完成模型的訓(xùn)練、推理等基礎(chǔ)工作,那么生成式AI應(yīng)用的構(gòu)建則離不開強(qiáng)大的工具。對于絕大部分企業(yè)而言,面對市場中如此多的模型如何選,如何利用快速、高效的工具來基于大模型開發(fā)應(yīng)用,這是當(dāng)前普遍遇到的需求痛點。
亞馬遜云科技CEO Adam Selipsky在大會上也強(qiáng)調(diào),生成式AI還處于早期發(fā)展階段,存在著非常多的變化,不存在一個模型就適應(yīng)所有場景,而是不同模型通常會在不同的適用場景中表現(xiàn)更好,模型對于場景的適應(yīng)能力很重要。
因此,亞馬遜云科技在今年帶來了Amazon Bedrock服務(wù)。在本次大會上,Amazon Bedrock進(jìn)行了更新:模型的微調(diào)(Fine-tuning)、檢索增強(qiáng)生成(RAG)以及基于Amazon Titan大模型的持續(xù)預(yù)訓(xùn)練,為用戶帶來持續(xù)更多的模型選擇,包括新推出的Anthropic Claude 2.1和Meta Llama 2 70B以及最近推出的Stability AI Stable Diffusion XL 1.0、Meta Llama 2 Chat 13B、Cohere Command Light、Cohere Embed English和Cohere Embed等語言模型。
這其中,亞馬遜云科技是首個集成 Meta Llama 2 模型的云廠商。另外,與Anthropic的合作也值得關(guān)注。作為對比OpenAI的公司,Anthropic今年在市場收獲多筆融資,亞馬遜投資40億美元給Anthropic,雙方合作明顯提速,Anthropic利用亞馬遜云科技的專用機(jī)器學(xué)習(xí)芯片Trainium來訓(xùn)練他們的下一代復(fù)雜Claude模型,Amazon Bedrock的客戶將享有獨家早期使用權(quán),體驗其他地方都無法使用的先進(jìn)Claude定制和微調(diào)模型功能。
據(jù)悉,Amazon Bedrock服務(wù)自推出以來,已經(jīng)擁有超過一萬名顧客在使用,包括阿迪達(dá)斯、納斯達(dá)克等企業(yè)。亞馬遜云科技大中華區(qū)戰(zhàn)略生態(tài)部總經(jīng)理顧凡直言,Amazon Bedrock更新的諸多功能都是源自于客戶需求的迭代,核心能夠幫助用戶三點:一、增加模型評估,告訴客戶哪個模型適合自身業(yè)務(wù);二、保障大模型的高效輸出;三、降低模型幻覺帶來的影響。
從中間層Amazon Bedrock今年迅猛的發(fā)展態(tài)勢來看,亞馬遜云科技的確是切中了當(dāng)前市場用戶們的需求痛點,Amazon Bedrock對于大模型應(yīng)用構(gòu)建門檻的大幅降低,有利于生成式AI應(yīng)用的快速落地。
Amazon Q:不可小覷的生成式AI助手
對于企業(yè)而言,生成式AI并不是寫詩作畫,而且渴望通過生成式AI來實現(xiàn)效率提升和成本降低。
今年以來,OpenAI ChatGPT、谷歌Bard智能聊天機(jī)器人等,生成式AI助手的賽道競爭十分激烈。不過,亞馬遜云科技聚焦依然是企業(yè)級領(lǐng)域。如何服務(wù)好亞馬遜云科技平臺上數(shù)以百萬計的企業(yè)用戶群體,是亞馬遜云科技切入生成式AI助手賽道的核心目標(biāo)。
為此,亞馬遜云科技推出了Amazon Q。Amazon Q由亞馬遜云科技17年來積累的知識和經(jīng)驗訓(xùn)練而成,它能幫助用戶快速上手亞馬遜云科技的新服務(wù)、功能,輕松學(xué)習(xí)不熟悉的技術(shù)、構(gòu)建解決方案、發(fā)現(xiàn)問題、升級應(yīng)用程序等,真正改變了開發(fā)者和IT人員在亞馬遜云科技上構(gòu)建、部署和運維應(yīng)用程序和工作負(fù)載的方式。
例如,亞馬遜云科技CEO Adam Selipsky在大會上介紹了,亞馬遜云科技內(nèi)部團(tuán)隊使用Amazon Q將上千款應(yīng)用程序從Java8升級到了Java17,甚至還完成了對應(yīng)的測試,大幅提升了工作效率。
亞馬遜云科技大中華區(qū)戰(zhàn)略發(fā)展部總經(jīng)理顧凡直言,亞馬遜云科技平臺上的智能助手一定不能是一個通用型的助手,而且需要圍繞企業(yè)業(yè)務(wù)場景來回答問題,AmazonQ就是一個最懂亞馬遜云科技的智能助手,滿足在亞馬遜云科技平臺上各類人群的使用需求。
以BI可視化分析為例,Amazon QuickSight內(nèi)置Amazon Q之后,業(yè)務(wù)分析師只需簡單告知Amazon Q即可創(chuàng)建儀表板和報告。此外,亞馬遜呼叫中心服務(wù)Amazon Connect也接入Amazon Q,現(xiàn)在Amazon Connect通過機(jī)器學(xué)習(xí)、轉(zhuǎn)錄和分析使這變得更加容易,可以直接充當(dāng)使用者的客服代表,,解決下游用戶提出的問題。
總體來看,亞馬遜云科技在本次re:Invent大會上圍繞生成式AI進(jìn)行了組合拳式的發(fā)布,涵蓋了從底層基礎(chǔ)設(shè)施到中間工具層,再到上層應(yīng)用,覆蓋面和深度前所未有。自從生成式AI火爆以來,產(chǎn)業(yè)界都在關(guān)注生成式AI如何從消費端進(jìn)入到企業(yè)級領(lǐng)域,幫助廣大企業(yè)用戶充分利用人工智能技術(shù)。毫無疑問,亞馬遜云科技為生成式AI的普及做出了極好的示范。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 城市中年失業(yè)有多慘:除了送外賣,就是跑網(wǎng)約車
- 十年傅利葉,具身成翼
- 為什么想要做成一個電商平臺會這么難?
- 異構(gòu)智算 本地引擎|聯(lián)想推出六大創(chuàng)新黑科技,引領(lǐng)中國算力變革新時代
- 真相曝光,不僅殲10建功,連落后的梟龍也暴揍陣風(fēng),震撼全球
- 算了算上周“賬單”,很多人開始期待“靈活休假”
- AI大模型的商業(yè)“回旋鏢”,重新落到了云計算丨貿(mào)易戰(zhàn)下的產(chǎn)業(yè)韌性(二)
- 被關(guān)稅“重壓”出來的本土充沛算力資源丨貿(mào)易戰(zhàn)下的產(chǎn)業(yè)韌性(一)
- 華為又有劃時代產(chǎn)品問世,鴻蒙電腦打破西方長期壟斷
- SID2025啟幕在即,TCL華星將攜APEX臻圖和印刷OLED全家桶重磅亮相
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。