您的位置:首頁 >公共 >

當前最新:谷歌更新隱私政策 明確在用網(wǎng)上公共數(shù)據(jù)訓練AI

2023-07-06 08:09:44 來源:手機網(wǎng)易網(wǎng)


(相關資料圖)

7月6日消息,谷歌更新后的隱私政策表明,諸如Bard和Cloud AI等各種人工智能服務可能是用谷歌從網(wǎng)上抓取公共數(shù)據(jù)進行訓練的。

本周一,谷歌更新了隱私政策。其中提到Bard、Cloud AI以及谷歌翻譯等人工智能服務可能使用了收集到的公共數(shù)據(jù)。

谷歌發(fā)言人克里斯塔·馬爾登(Christa Muldoon)表示,“我們的隱私政策一直是透明的,谷歌使用來自開放網(wǎng)絡的公開信息來訓練語言模型,從而提供谷歌翻譯等服務?!薄白罱淮胃轮皇钦f明像Bard這樣的新服務也在內。我們將隱私原則和保障措施納入人工智能技術的開發(fā)中,這與我們的人工智能原則是一致的?!?/p>

在2023年7月1日進行更新后,谷歌隱私政策顯示,“谷歌使用信息來改進服務,開發(fā)有利于用戶和公眾的新產品、功能和技術”,公司可能“使用公開可用的信息來幫助訓練谷歌人工智能模型,開發(fā)諸如谷歌翻譯、Bard以及Cloud AI等產品和功能?!?/p>

從谷歌隱私政策的歷次更新中可以看出,關于使用收集的公開數(shù)據(jù)訓練哪些服務,這次谷歌的說法更為明確。例如,谷歌的隱私政策現(xiàn)在顯示,這些信息可能用于“人工智能模型”,而不只是“語言模型”,這讓谷歌在用公共數(shù)據(jù)訓練和開發(fā)大語言模型以外的其他系統(tǒng)方面有了更大自由度。但這條注釋被藏在隱私政策中“你的本地信息”標簽“公共可訪問資源”的嵌入式鏈接之下,用戶必須點擊這個鏈接才能看到相關內容。

更新后的隱私政策說明,“公開信息”將用于訓練谷歌的人工智能產品,但沒有說明谷歌是否或者如何阻止受版權保護的內容進入訓練數(shù)據(jù)庫。許多可公開訪問的網(wǎng)站都有相關政策,禁止為了訓練大語言模型和其他人工智能工具集開展的數(shù)據(jù)收集或網(wǎng)絡抓取行為。因為《通用數(shù)據(jù)保護條例》(GDPR)等法規(guī)保護用戶數(shù)據(jù)不會在未經明確許可的情況下被濫用。

這些法規(guī)加上日益激烈的市場競爭,使得GPT-4等主流生成式人工智能系統(tǒng)的開發(fā)商對他們從哪里獲得用于訓練模型的數(shù)據(jù),以及這些數(shù)據(jù)是否包括社交媒體內容或藝術家作家的版權作品,都非常謹慎。

但合理使用數(shù)據(jù)的原則是否可以延伸到這類人工智能應用,目前還處于法律監(jiān)管的灰色地帶。這種不確定性引發(fā)了各種訴訟,并促使一些國家出臺更嚴格的法律,更好地規(guī)范人工智能公司收集和使用訓練數(shù)據(jù)的方式。這種不確定性也帶來了各種問題,比如到底該如何處理這些數(shù)據(jù)、確保不會導致人工智能系統(tǒng)出現(xiàn)高危故障;還有負責整理這些海量數(shù)據(jù)的人通常要忍受長時間的極端工作條件。

美國最大報紙出版商Gannett正在起訴谷歌及其母公司Alphabet,聲稱人工智能技術的進步讓這家搜索行業(yè)巨頭進一步壟斷了數(shù)字廣告市場。谷歌測試版人工智能搜索等產品也被指是“抄襲引擎”,并因導致其他網(wǎng)站流量枯竭而受到批評。

與此同時,包含大量公共信息的社交媒體平臺推特和Reddit最近都采取了嚴厲措施,試圖阻止其他公司自由獲取他們平臺上的數(shù)據(jù)。但平臺調整和限制API現(xiàn)行機制的做法也遭到了各自用戶社區(qū)的強烈反對,因為這種出于反對網(wǎng)絡抓取數(shù)據(jù)的調整措施對核心用戶體驗產生了負面影響。(辰辰)

標簽: