在剛剛落幕的“Blizzard Challenge 2019”國際語音合成大賽中,靈伴科技的語音合成系統(tǒng)榮獲綜合評測指標(biāo)第二的優(yōu)異成績。這是繼靈伴在“Blizzard Challenge 2013”比賽中獲得綜合評測指標(biāo)排名第一后,時隔6年第二次參賽,再次斬獲殊榮。
史上最難“中文合成”挑戰(zhàn)
“Blizzard Challenge”國際語音合成大賽由美國卡耐基-梅隆大學(xué)和日本名古屋工業(yè)大學(xué)聯(lián)合發(fā)起,是語音合成領(lǐng)域最具權(quán)威性的國際技術(shù)評測比賽。它旨在構(gòu)建一個公開、統(tǒng)一的語音合成技術(shù)評測平臺,加強研究機構(gòu)之間的技術(shù)交流與溝通,推動語音技術(shù)快速發(fā)展。
與往屆比賽相比,本屆大賽的難度再創(chuàng)新高。大賽要求各參賽方利用大約8小時的羅振宇脫口秀聲音素材,合成出自然、易懂,并和羅振宇本人的特點盡量相似的語音。
更為重要的是,主辦方對聲音樣本的來源進行了嚴格的約束:羅振宇本人的聲音素材只允許使用主辦方提供的8小時錄音,禁止使用從其他渠道收集的數(shù)據(jù);羅振宇以外的說話人聲音素材可以隨意使用。
因此,本屆參賽方主要面對兩個挑戰(zhàn):如何用好羅振宇本人的為數(shù)不多的8小時錄音;如何利用其它說話人的語音來幫助算法更好地學(xué)習(xí)羅振宇本人的講話特點。
超穩(wěn)健合成系統(tǒng),語音“可懂度”最佳
在任務(wù)難度高、競爭對手實力強的情況下,靈伴提交的合成系統(tǒng)在自然度、相似度、可懂度三項評測指標(biāo)中均表現(xiàn)優(yōu)秀,獲得了關(guān)鍵指標(biāo)自然度第4名、相似度第2名、合成語音可懂度第2名、綜合排名第2名的優(yōu)異成績。
自然度和相似度分別表示合成聲音的自然程度以及與羅振宇本人的相似程度,分數(shù)越高表示合成的語音越自然、和羅振宇本人的相似程度越高。從分數(shù)角度來看,在自然度和相似度上靈伴分別獲得了4分和3.9分,共計7.9分,以微弱的差距落后于M。
從排名角度來看,靈伴在自然度、相似度和可懂度方面分別排在第4、第2以及第2名。
在同時考慮自然度和相似度的情況下,靈伴的排名為并列第2名。
在同時考慮自然度、相似度以及可懂度的情況下,靈伴的排名為第2名。
值得一提的是,靈伴的可懂度分數(shù)在相似度和自然度前十的隊伍中排名最高,這意味著靈伴的語音合成最能夠被“聽懂”。
人工智能技術(shù)落地的道路,往往是對系統(tǒng)能力的全方位考核。從語音合成需求的角度來看,自然度、相似度和可懂度都是實際應(yīng)用場景中的關(guān)鍵指標(biāo):其中相似度是語音合成模型定制業(yè)務(wù)中主要考察的對象;而可懂度在人機交互過程中,直接決定了客戶能否輕松而準(zhǔn)確地理解機器人所表述的內(nèi)容。
因此,靈伴在本次比賽中的技術(shù)選型主要考慮真實落地場景,選擇了相對穩(wěn)健的“不偏科”的解決方案。比賽的結(jié)果也充分體現(xiàn)了靈伴合成技術(shù)的全面優(yōu)勢。
自然度、相似度、可懂度三項指標(biāo)累加排名(越低越好)
“路漫漫其修遠兮,吾將上下而求索”,此次比賽的成績對靈伴人來說,既是榮譽,亦是鞭策。語音交互的探索之途,靈伴人和世界上同道科研工作者們還有很長的路要走。靈伴人將繼續(xù)腳踏實地,開拓創(chuàng)新,實現(xiàn)技術(shù)與產(chǎn)品的雙重提升,開創(chuàng)人類與智能機器人共同發(fā)展的美好未來。
Blizzard Challenge2013精彩回顧
2013年是靈伴這支新銳團隊首次參賽,在時間緊、任務(wù)重、對手強的多重困難下,團隊一舉戰(zhàn)勝諸多國際頂尖科研機構(gòu),在自然度、相似度兩個評測領(lǐng)域以絕對優(yōu)勢獲勝,斬獲當(dāng)年Blizzard Challenge國際語音合成大賽綜合評測第一名的桂冠,這也是主辦方公認的語音合成領(lǐng)域第三次里程碑式技術(shù)突破。
在自然度方面,靈伴(隊伍代碼為M)得分3.9分,超出第二名0.6分。
自然度得分情況(靈伴隊伍代碼為M)
- 蔚來新ET5/ET5T/EC6冠軍紀念版上市:運動化調(diào)教+專屬套件,價格親民!
- 華為鴻蒙智駕半年行駛里程超16億公里:80萬輛車見證智能出行新篇章
- 領(lǐng)克10 EM-P智能電混亮眼登場:四驅(qū)+激光雷達,科技與性能的完美融合
- 蘋果自研云芯大突破:降降亞馬遜云高價,重塑行業(yè)格局
- iPhone新功能遭熱議:制冷模式能否拯救炎炎夏日?
- Lumo AI合規(guī)助手:讓奇富科技告別繁瑣合規(guī)管理,效率提升20倍
- 現(xiàn)代汽車揭幕韓國氫能新篇章:2028投產(chǎn)氫燃料工廠,綠色未來已觸手可及
- 揭秘ChatGPT名稱由來:OpenAI高層道出背后故事,人工智能如何從無到有?
- 格力高管回應(yīng)董明珠掉出《財富》榜單:影響力不等于財富,傳奇仍在繼續(xù)
- ASML獨家披露:EUV光刻機僅售5臺,Intel悄然轉(zhuǎn)變,光刻機不再那么重要了
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。