4月19-20日,專注于音視頻領域的多媒體技術峰會——LiveVideoStackCon在上海順利閉幕。本次大會以“技術開啟新視界”為主題,匯聚了全國音視頻技術的資深專家和從業(yè)者,圍繞畫質評價與增強、服務端與架構設計、前端與用戶端、音頻技術和解決方案等不同方向展開深入挖掘和探討,不斷拓展了音視頻技術的應用場景和行業(yè)邊界。
在“解決方案”專場的主題演講中,相芯科技資深圖形引擎開發(fā)經理蔡銳濤從音視頻內容互動技術、行業(yè)實踐及全鏈路人臉AR特效解決方案三個角度,全方位介紹了相芯科技內容互動技術在音視頻領域的新實踐,并展示了其豐富的AI+3D內容生成與互動的行業(yè)解決方案。
創(chuàng)新內容互動技術,20余款功能隨你挑
隨著經濟社會加速發(fā)展,與互聯(lián)網(wǎng)一起成長起來的Z世代正在成為社會新的消費主力。他們追求個性與自我,崇尚興趣至上,熱愛社交,渴望被關注,并將“虛擬”網(wǎng)絡世界當成他們追求精神活動的載體,從中尋求自我認同和自我成長。
如何吸引他們的目光,抓住他們的需求,進而助推音視頻行業(yè)發(fā)展?蔡銳濤從人臉內容互動技術切入,全面介紹了相芯科技通過技術提升內容層次、豐富內容趣味、拓展內容邊界,從而幫助用戶有效提升內容觸達率,大大強化了企業(yè)與用戶間的粘性。
(AI+3D內容互動新技術)
會上,蔡銳濤深入剖析了相芯科技的三款產品——NAMA、PTA、STA。這些產品基于不同的底層技術,為各類企業(yè)的內容創(chuàng)造提供了更多可能。以NAMA產品線為例,經過近3年的發(fā)展,已延伸出了美顏、貼紙、Animoji、背景分割、海報換臉等16項功能。其中,在美顏技術方面,相芯科技已擁有包含美顏、美妝、美型、濾鏡等在內的一套完整的解決方案,并于不久前推出了主打質感美顏的SDK包。
PTA(Photo-to-Avatar)是一項可以根據(jù)用戶上傳的自拍照片,生成與用戶相似且美觀的3D虛擬形象的服務。相芯科技的生成算法目前可以自動匹配臉型、五官特征、頭發(fā)胡子、膚色唇色、眼睛等,生成和輸出與人像高度匹配的3D數(shù)字化身。且生成后,還支持用戶進行捏臉調整,實時裝扮虛擬形象,及進行實時表情驅動。
STA(speech-to-animation)語音驅動是相芯科技研發(fā)的一套驅動虛擬形象嘴唇動作與語音實時同步呈現(xiàn)的產品技術。這一技術在內容動態(tài)呈現(xiàn)和內容制作兩方面有很好的落地場景,可為用戶提供一種內容創(chuàng)作低門檻、體驗更自然的語音人機交互方式。
“經過近3年的發(fā)展,我們已積累了400+家B端用戶,SDK月均鑒權調用已超10億次?!辈啼J濤說,目前相芯科技的全鏈路人臉AR特效解決方案,已經成為涵蓋內容生成、內容交互、內容渲染的一個完整解決方案,可滿足各類用戶對AI+3D內容創(chuàng)作的需求。
視頻社交成主流,SDK走向輕量化
近年來,在監(jiān)管收緊、技術迭代、消費升級、人工智能應用越來越廣的背景下,短視頻行業(yè)正在迎來一輪新的洗牌。如何在這一輪競爭中尋求突破口,為更多短視頻企業(yè)的發(fā)展賦能?以技術來撬動內容生產,滿足不同用戶的不同需求,是相芯科技一直以來的追求。
蔡銳濤指出,從今年初開始,市場上已出現(xiàn)了頭條多閃、聊天寶、馬桶MT等多個主打視頻社交的產品,陌生人社交或將成為年輕一代的主流模式。而相芯科技早已瞄準這一領域,并研發(fā)出了Avatar捏臉技術。
(動圖)
這一SDK開發(fā)包首先具有輕量級的渲染引擎,提供多種材質模板,可供客戶快速自定義渲染效果,且SDK包最小只有2.6M;其次,還支持用戶根據(jù)自己喜好對虛擬角色進行捏臉、換裝、換發(fā)等,制作出一個和自己很像且更美觀的3D數(shù)字化身;最后,還提供內容制作工具,方便讓客戶隨時做出想要的產品。
此外,針對模型道具制作過程中可能存在的運行內存問題,蔡銳濤表示,相芯科技研發(fā)了數(shù)據(jù)壓縮和模型優(yōu)化技術,力爭用最小的運行內存來實現(xiàn)用戶實時捏臉、驅動虛擬形象等效果。以模型8000個頂點、40個捏臉維度為例,全部模型內存占用最少需要458M,但經過壓縮優(yōu)化后,相芯科技可將運行內存降至60M,讓絕大部分的設備都可以使用。
(音視頻處理SDK架構)
“解決內存問題后,為提高客戶美術制作效率,我們還為客戶提供了自動模型生成工具,讓客戶可以一鍵生成表情動作模型。”蔡銳濤強調,相芯科技一直希望能深入客戶的各類應用場景,用技術幫助客戶解決問題,用產品賦能客戶發(fā)展,讓更多扎根于直播、短視頻、社交等領域的客戶創(chuàng)新變革,站上新起點,迎接新未來。
- “黑科技”亮相第三屆軟件創(chuàng)新發(fā)展大會 AI+VR駕駛模擬器引關注
- 哈啰Robotaxi破局之戰(zhàn):30億大手筆能否打破行業(yè)僵局?
- 小猿AI智慧教育引領行業(yè)新潮流,下載量飆升榜首,重塑學習新體驗
- 穩(wěn)定幣風波再起,京東嚴正聲明:堅決維護市場秩序
- 知乎直答升級:解鎖訂閱與內容分享,探索知識新玩法!
- 百望股份攜手沐曦集成電路,共創(chuàng)智能芯片新紀元
- 螞蟻科技開放香港四大核心技術:助力香港區(qū)塊鏈與人工智能發(fā)展,打造未來科技新生態(tài)
- 福特CEO反思中國電動汽車崛起:中國速度引發(fā)深思,電動汽車發(fā)展如何令人自慚形穢
- 小馬智行第七代Robotaxi落地新加坡:打破自動駕駛落地之困?
- 蘋果將推廉價版MacBook:破繭之作,A18 Pro芯片領銜,輕薄與性能并存
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。