濫用公眾人物聲音 AI技術(shù)玩過界引發(fā)質(zhì)疑

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-10-28 11:20:00 新華網(wǎng)

從“一眼假”到“真假難辨”再到“深度偽造”，生成一條音頻只需20秒。濫用公眾人物聲音惡搞，AI技術(shù)應(yīng)用“玩過界”被質(zhì)疑。

近日，一些短視頻平臺出現(xiàn)了大量某知名企業(yè)家吐槽的視頻。在這些視頻中，該企業(yè)家對堵車、調(diào)休、游戲等熱門話題進行了調(diào)侃和銳評，甚至夾雜不雅詞匯，引發(fā)網(wǎng)友熱議。事實上，這些吐槽視頻并非該企業(yè)家本人發(fā)聲，而是由網(wǎng)友利用AI軟件采集其原音生成的配音，逼真的效果讓不少人信以為真。

AI的發(fā)展為生活帶來便利的同時，也引發(fā)了質(zhì)疑。以AI語音合成技術(shù)為例，只需要打開軟件、動動手指，一條以假亂真的配音視頻就能新鮮出爐。然而，有的視頻越過了開玩笑的邊界，“偷走”他人聲音進行惡搞、造謠，帶來了惡劣的社會影響。

記者在社交軟件上檢索發(fā)現(xiàn)，不少用戶發(fā)布了AI配音的相關(guān)視頻生成教程。其中大部分配音都源于某擬真語音大模型應(yīng)用。在該應(yīng)用網(wǎng)站上，創(chuàng)作者上傳任意人物的一段音頻作為訓練素材，隨后AI通過學習可克隆出一個聲音角色。其他用戶只需輸入文本，便可以使用該聲音生成內(nèi)容。記者按照指引添加了上述知名企業(yè)家的聲音角色，輸入一段100字的文本后點擊“開始生成”，約20秒就生成了一條與該企業(yè)家聲音相似度極高的AI音頻。截至目前，該聲音角色已被使用79.9萬次，生成字符數(shù)達4455.5萬個。

被“偷走”聲音的公眾人物還有不少。今年9月底，一段據(jù)稱是某直播平臺老板盧某某的酒后錄音在網(wǎng)絡(luò)上流傳，整體呈現(xiàn)出盧某某對于消費者的傲慢態(tài)度，以及對相關(guān)人士的不尊重表達，為該平臺招致不小的爭議。后經(jīng)警方調(diào)查，音頻內(nèi)容不實，系大模型偽造而成。一位業(yè)內(nèi)人士表示，通過模仿音頻樣本的語調(diào)、語速、情感、口音、發(fā)聲方式等特征，AI技術(shù)已經(jīng)能夠高度還原音頻樣本的聲音，達到人耳和其他鑒定方式難以區(qū)分的程度。

12 全文共 2 頁下一頁

關(guān)閉

濫用公眾人物聲音 AI技術(shù)玩過界引發(fā)質(zhì)疑

相關(guān)新聞

今日熱點

頻道熱點