(源初/文)周一,Gizmodo發(fā)現(xiàn)谷歌更新了其隱私政策,披露公司可能會使用從網(wǎng)絡(luò)上抓取的公共數(shù)據(jù)來訓(xùn)練其各種人工智能服務(wù),如Bard和Cloud AI。
谷歌發(fā)言人克里斯塔·馬爾登(Christa Muldoon)對The Verge表示:“我們的隱私政策一直都明確表示,谷歌使用來自開放網(wǎng)絡(luò)的公共可獲得信息來訓(xùn)練語言模型,用于Google翻譯等服務(wù)?!薄按舜胃聝H是澄清了新的服務(wù)(如Bard)也包括在內(nèi)。我們在開發(fā)AI技術(shù)時將隱私原則和保護措施納入其中,符合我們的AI原則?!?/p>
根據(jù)2023年7月1日更新后的內(nèi)容,谷歌的隱私政策現(xiàn)在表示,“谷歌使用信息改進我們的服務(wù)并開發(fā)有益于用戶和公眾的新產(chǎn)品、功能和技術(shù)”,并且公司可能會“使用公開可獲得的信息來幫助訓(xùn)練谷歌的AI模型,并構(gòu)建產(chǎn)品、功能和Google翻譯、Bard以及Cloud AI能力”。
從該政策的修訂歷史中可以看出,更新為使用收集的數(shù)據(jù)來訓(xùn)練的服務(wù)提供了一些額外的明確說明。例如,文件現(xiàn)在表示,該信息可能用于“AI模型”,而不是“語言模型”,這使得谷歌在使用公共數(shù)據(jù)進行訓(xùn)練和構(gòu)建系統(tǒng)時具有更多的自由。甚至該說明也被嵌入在政策的“您的本地信息”選項卡下的一個名為“公開可訪問的來源”的嵌入鏈接中,您必須點擊該鏈接才能打開相關(guān)部分。
更新后的政策明確指出,“公開可獲得的信息”用于訓(xùn)練谷歌的AI產(chǎn)品,但未說明公司將如何(或是否)防止包含受版權(quán)保護的材料在數(shù)據(jù)池中。許多公開可訪問的網(wǎng)站都有禁止數(shù)據(jù)收集或網(wǎng)絡(luò)抓取以用于訓(xùn)練大型語言模型和其他AI工具集的政策。這種方法在GDPR等全球法規(guī)的保護下可能會引發(fā)一些有趣的影響,這些法規(guī)旨在保護人們的數(shù)據(jù)不被未經(jīng)明確許可的方式濫用。
這種法律的組合以及市場競爭的增加使得像OpenAI的GPT-4這樣的受歡迎的生成式AI系統(tǒng)的制造商極為謹(jǐn)慎,不愿透露訓(xùn)練它們所使用的數(shù)據(jù)來源以及是否包括社交媒體帖子或人類藝術(shù)家和作者的受版權(quán)保護作品。當(dāng)前,關(guān)于公平使用原則是否適用于這種應(yīng)用的問題存在法律灰色地帶。這種不確定性引發(fā)了各種訴訟,并促使一些國家的立法者制定更嚴(yán)格的法律,以更好地監(jiān)管AI公司收集和使用其訓(xùn)練數(shù)據(jù)的方式。這也引發(fā)了關(guān)于如何處理這些龐大的訓(xùn)練數(shù)據(jù)以確保其不會導(dǎo)致AI系統(tǒng)出現(xiàn)危險故障的問題,處理這些數(shù)據(jù)的人員通常需要長時間工作且工作條件極其艱苦。
美國最大的報紙出版商甘奈特(Gannett)正在起訴谷歌及其母公司Alphabet,聲稱AI技術(shù)的進步幫助這家搜索巨頭在數(shù)字廣告市場上壟斷。谷歌的AI搜索測試版等產(chǎn)品也被稱為“抄襲引擎”,并因剝奪網(wǎng)站的流量而受到批評。
與此同時,Twitter和Reddit這兩個包含大量公共信息的社交平臺最近采取了極端措施,試圖阻止其他公司自由收集它們的數(shù)據(jù)。這些平臺對API進行了更改和限制,這些變化對各自社區(qū)產(chǎn)生了不良影響,因為反網(wǎng)絡(luò)抓取的變化對核心的Twitter和Reddit用戶體驗產(chǎn)生了負(fù)面影響。
- 無智聯(lián),不AI:品智聯(lián)接數(shù)據(jù)通信商業(yè)市場創(chuàng)新峰會成功舉辦
- 物聯(lián)網(wǎng)智能HVAC:商業(yè)建筑能效提升
- 凈零建筑的策略:太陽能儲能與熱電混合
- 擴展生成式人工智能:解鎖實際業(yè)務(wù)價值的運營模式革新
- 我國移動物聯(lián)網(wǎng)產(chǎn)業(yè)收入首度披露:2024年綜合收入達到452.71億元
- 建筑管理的未來:把握趨勢,引領(lǐng)變革
- 小米集團發(fā)布小米AI眼鏡;海爾已成立機器人事業(yè)部,也會與宇樹科技探討合作——2025年06月27日
- 綠色云:為互聯(lián)網(wǎng)提供可持續(xù)動力
- 為什么在工業(yè)運營中擴展視覺人工智能如此困難
- 為何傳統(tǒng)數(shù)據(jù)治理阻礙了人工智能時代的到來
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。