在2018年移動世界大會上擁有三層展臺的數(shù)十億美元技術(shù)巨頭中,有一對企業(yè)家在談?wù)撊斯ぶ悄芊矫娴耐黄疲麄儎倓偘岩豢蠲麨镺tter.a(chǎn)i的新應(yīng)用程序在iOS和Android中推出。
當他們坐下來在Fira Barcelona 2號展廳后角的一個小會議室里談?wù)摃r,Sam Liang將他的iPhone放在桌子上,并點擊了Otter應(yīng)用程序中的記錄按鈕。作為Otter.a(chǎn)i背后公司Alexense的首席執(zhí)行官,Liang開始講述了加州15人創(chuàng)業(yè)小公司如何采用不同的方法來理解音頻數(shù)據(jù),不同于亞馬遜Alexa,谷歌助理和其他公司在語音識別上的努力。
在Liang發(fā)表講話時,Otter開始吐文,大概延遲了2-3秒。而且,由于Liang事先在應(yīng)用程序中設(shè)置了會議,所以當他的隊友Seamus McAteer提出自己的評論時,軟件會自動識別,或者會因其他人的后續(xù)問題而中斷。
盡管Otter的自然語言處理方式并不完美,標點缺失,詞語被誤解,說話人有時被錯誤識別,但它已經(jīng)非常接近了,特別是考慮到速度和應(yīng)用程序是免費的。
“我們的技術(shù)完全不同?!?Liang在接受ZDNet采訪時說。 “我們稱之為'Ambient Voice Intelligence'(環(huán)境聲音智能),我們使用ambient這個詞來表示這是在后臺工作......你的大腦只能記住10-20%的(會議)信息......所以我們認為我們可以幫助人們捕獲這些信息,然后快速搜索?!?/p>
搜索是最好的功能。錄制完成后,應(yīng)用程序的機器學習會自動創(chuàng)建約10個關(guān)鍵字,以便用戶了解會議的內(nèi)容。你可以馬上開始搜索全文。同樣有用的是,一旦你熟悉關(guān)鍵字,可以點擊播放按鈕來收聽發(fā)生的音頻部分。
該應(yīng)用程序的下一個最佳功能是可以共享記錄的會議。所以,如果你有一個會議,而一個同事不能參加,你可以隨后向他們發(fā)送記錄和音頻,以便他們找到與之相關(guān)的東西。
如果你將谷歌帳戶連接到應(yīng)用并導入聯(lián)系人,那么所有這些高級功能都是非常簡單的。因此,如果你的企業(yè)使用Google Apps,它可以非常順利地運行。跟谷歌的整合并不令人意外,因為Liang是谷歌前工程師。
McAteer從事移動和數(shù)據(jù)分析工作已有20多年。團隊的其他成員由前谷歌,F(xiàn)acebook,雅虎和Nuance員工以及麻省理工學院、斯坦福大學和其他頂尖科技計劃的博士和計算機科學家組成。
自2016年1月起,該團隊一直致力于研究Otter背后的技術(shù)。他們擁有在過去一年中授權(quán)給其他合作伙伴的API - 主要是在錄制完成后提供音頻文件的轉(zhuǎn)錄。 AISense利用所有的合作伙伴數(shù)據(jù)來調(diào)整和訓練算法。
今年1月,他們宣布與快速增長的視頻會議服務(wù)公司Zoom簽署了一項許可合作伙伴關(guān)系,現(xiàn)在該公司提供了一個錄制視頻會議的選項——由AISense提供支持。
隨著推出實時錄音的免費應(yīng)用程序,該公司正在進入下一個階段。它最終計劃推出其應(yīng)用程序的高級版本,該版本將建立在免費版本的功能上。例如,免費版本將允許你搜索過去90天的會議。高級版本將進一步擴大。
“能夠記住,搜索和分享你的語音對話是合作的下一個前沿?!?Liang說,“Otter授權(quán)用戶使用AI進行日常對話,因此他們可以專注于所說的內(nèi)容而忘記記筆記?!?/p>
可以在Otter.a(chǎn)i,Apple App Store和Google Play Store找到該應(yīng)用程序。 iOS版本在這一點上更加精細一些,但都值得關(guān)注這款應(yīng)用程序隨著時間的推移如何發(fā)展和提高。
IBM Watson提供實時的文本到語音服務(wù),但它背靠超級計算機。因此,AISense使用應(yīng)用程序和智能手機取得了令人印象深刻的成就,而且它可以說是2018年世界移動通信大會上宣布的最重要突破之一 ,盡管它一直以來十分低調(diào)。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )