從“一眼假”到“真假難辨”再到“深度偽造”,生成一條音頻只需20秒。濫用公眾人物聲音惡搞,AI技術(shù)應(yīng)用“玩過界”被質(zhì)疑。
近日,一些短視頻平臺出現(xiàn)了大量某知名企業(yè)家吐槽的視頻。在這些視頻中,該企業(yè)家對堵車、調(diào)休、游戲等熱門話題進行了調(diào)侃和銳評,甚至夾雜不雅詞匯,引發(fā)網(wǎng)友熱議。事實上,這些吐槽視頻并非該企業(yè)家本人發(fā)聲,而是由網(wǎng)友利用AI軟件采集其原音生成的配音,逼真的效果讓不少人信以為真。
AI的發(fā)展為生活帶來便利的同時,也引發(fā)了質(zhì)疑。以AI語音合成技術(shù)為例,只需要打開軟件、動動手指,一條以假亂真的配音視頻就能新鮮出爐。然而,有的視頻越過了開玩笑的邊界,“偷走”他人聲音進行惡搞、造謠,帶來了惡劣的社會影響。
記者在社交軟件上檢索發(fā)現(xiàn),不少用戶發(fā)布了AI配音的相關(guān)視頻生成教程。其中大部分配音都源于某擬真語音大模型應(yīng)用。在該應(yīng)用網(wǎng)站上,創(chuàng)作者上傳任意人物的一段音頻作為訓練素材,隨后AI通過學習可克隆出一個聲音角色。其他用戶只需輸入文本,便可以使用該聲音生成內(nèi)容。記者按照指引添加了上述知名企業(yè)家的聲音角色,輸入一段100字的文本后點擊“開始生成”,約20秒就生成了一條與該企業(yè)家聲音相似度極高的AI音頻。截至目前,該聲音角色已被使用79.9萬次,生成字符數(shù)達4455.5萬個。
被“偷走”聲音的公眾人物還有不少。今年9月底,一段據(jù)稱是某直播平臺老板盧某某的酒后錄音在網(wǎng)絡(luò)上流傳,整體呈現(xiàn)出盧某某對于消費者的傲慢態(tài)度,以及對相關(guān)人士的不尊重表達,為該平臺招致不小的爭議。后經(jīng)警方調(diào)查,音頻內(nèi)容不實,系大模型偽造而成。一位業(yè)內(nèi)人士表示,通過模仿音頻樣本的語調(diào)、語速、情感、口音、發(fā)聲方式等特征,AI技術(shù)已經(jīng)能夠高度還原音頻樣本的聲音,達到人耳和其他鑒定方式難以區(qū)分的程度。
李純發(fā)文回應(yīng)自己日前發(fā)的博文,表示自己當時因為表述不清,引起了不必要的誤解,所以刪掉了微博。
2024-09-14 14:51:41李純