從“一眼假”到“真假難辨”再到“深度偽造”,生成一條音頻只需20秒。濫用公眾人物聲音惡搞,AI技術(shù)應(yīng)用“玩過界”被質(zhì)疑。
近日,一些短視頻平臺(tái)出現(xiàn)了大量某知名企業(yè)家吐槽的視頻。在這些視頻中,該企業(yè)家對(duì)堵車、調(diào)休、游戲等熱門話題進(jìn)行了調(diào)侃和銳評(píng),甚至夾雜不雅詞匯,引發(fā)網(wǎng)友熱議。事實(shí)上,這些吐槽視頻并非該企業(yè)家本人發(fā)聲,而是由網(wǎng)友利用AI軟件采集其原音生成的配音,逼真的效果讓不少人信以為真。
AI的發(fā)展為生活帶來便利的同時(shí),也引發(fā)了質(zhì)疑。以AI語音合成技術(shù)為例,只需要打開軟件、動(dòng)動(dòng)手指,一條以假亂真的配音視頻就能新鮮出爐。然而,有的視頻越過了開玩笑的邊界,“偷走”他人聲音進(jìn)行惡搞、造謠,帶來了惡劣的社會(huì)影響。
記者在社交軟件上檢索發(fā)現(xiàn),不少用戶發(fā)布了AI配音的相關(guān)視頻生成教程。其中大部分配音都源于某擬真語音大模型應(yīng)用。在該應(yīng)用網(wǎng)站上,創(chuàng)作者上傳任意人物的一段音頻作為訓(xùn)練素材,隨后AI通過學(xué)習(xí)可克隆出一個(gè)聲音角色。其他用戶只需輸入文本,便可以使用該聲音生成內(nèi)容。記者按照指引添加了上述知名企業(yè)家的聲音角色,輸入一段100字的文本后點(diǎn)擊“開始生成”,約20秒就生成了一條與該企業(yè)家聲音相似度極高的AI音頻。截至目前,該聲音角色已被使用79.9萬次,生成字符數(shù)達(dá)4455.5萬個(gè)。
被“偷走”聲音的公眾人物還有不少。今年9月底,一段據(jù)稱是某直播平臺(tái)老板盧某某的酒后錄音在網(wǎng)絡(luò)上流傳,整體呈現(xiàn)出盧某某對(duì)于消費(fèi)者的傲慢態(tài)度,以及對(duì)相關(guān)人士的不尊重表達(dá),為該平臺(tái)招致不小的爭(zhēng)議。后經(jīng)警方調(diào)查,音頻內(nèi)容不實(shí),系大模型偽造而成。一位業(yè)內(nèi)人士表示,通過模仿音頻樣本的語調(diào)、語速、情感、口音、發(fā)聲方式等特征,AI技術(shù)已經(jīng)能夠高度還原音頻樣本的聲音,達(dá)到人耳和其他鑒定方式難以區(qū)分的程度。
李純發(fā)文回應(yīng)自己日前發(fā)的博文,表示自己當(dāng)時(shí)因?yàn)楸硎霾磺?,引起了不必要的誤解,所以刪掉了微博。
2024-09-14 14:51:41李純