多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié) 一鍵復(fù)制粘貼引發(fā)擔(dān)憂

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-06-03 15:45:44 今日頭條

多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié)。近日，有人發(fā)現(xiàn)只需幾段特定的文字指令，就能讓人工智能生成包含露骨色情描寫或暴力血腥情節(jié)的內(nèi)容。這些指令可以被直接復(fù)制粘貼到AI對(duì)話框中，生成的劇情連貫且細(xì)節(jié)豐富，整個(gè)過程中沒有任何攔截措施。這種情況引發(fā)了對(duì)人工智能倫理和監(jiān)管的關(guān)注。多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié)！

幾段文字，就能讓AI秒變“黃暴寫手”！血腥劇情、露骨描寫一鍵生成，這類危險(xiǎn)指令正在大量網(wǎng)絡(luò)色情小說社群瘋傳。

近日，南方都市報(bào)、南都大數(shù)據(jù)研究院記者調(diào)查發(fā)現(xiàn)，社交平臺(tái)上，大量用戶公開分享各類完整AI指令，通過角色扮演劇本、互動(dòng)模擬器游戲等形式，輕松繞過部分主流國(guó)產(chǎn)大模型的安全審核機(jī)制。DeepSeek、元寶、Kimi、智譜清言等多款A(yù)I在輸入指令后生成露骨色情描寫或暴力血腥情節(jié)。調(diào)查發(fā)現(xiàn)，此類內(nèi)容傳播隱蔽、復(fù)制門檻低，被網(wǎng)絡(luò)色情小說寫手借AI批量生產(chǎn)低俗內(nèi)容。

社交平臺(tái)現(xiàn)AI“開車指令”

誘導(dǎo)AI生成色情內(nèi)容

正在小紅書等社交平臺(tái)上流傳的“*車指令”“*游指令”“指令***”，成為誘導(dǎo)AI生成低俗內(nèi)容的密碼。南都記者調(diào)查發(fā)現(xiàn)，大量用戶曬出與AI的低俗對(duì)話截圖，附上對(duì)應(yīng)指令或傳授誘導(dǎo)話術(shù)技巧，相關(guān)內(nèi)容動(dòng)輒收獲數(shù)千點(diǎn)贊、收藏，被圈內(nèi)網(wǎng)友奉為“熱門資源”。

多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié) 一鍵復(fù)制粘貼引發(fā)擔(dān)憂

社交平臺(tái)上，大量用戶公開分享各類完整AI指令，誘導(dǎo)AI生成低俗內(nèi)容。

順著多篇高熱度“技巧貼”，南都記者進(jìn)入幾個(gè)私域社群，獲取到圈內(nèi)傳播的十余套針對(duì)DeepSeek的完整指令。這些指令均是“精心打磨”的人設(shè)劇情模板：既有“高嶺之花劍尊×撩人不自知小徒弟”“狠戾暴君×和親公主”等古風(fēng)虐戀設(shè)定，也有“冷面上司×職場(chǎng)新人”“冷血高利貸債主×替兄還債舞蹈生”等現(xiàn)代組合，甚至包含師生、母子、強(qiáng)制愛等違背公序良俗的情節(jié)。每套指令都預(yù)設(shè)了人物性格、身份關(guān)系與互動(dòng)尺度，話術(shù)直白露骨，全程誘導(dǎo)AI生成曖昧低俗的對(duì)話與情節(jié)。

用戶無需任何創(chuàng)作能力，只需將現(xiàn)成指令一鍵復(fù)制、粘貼進(jìn)AI對(duì)話框，就能立刻開啟低俗互動(dòng)。南都記者實(shí)測(cè)發(fā)現(xiàn)，將一段“高嶺之花劍尊×撩人不自知小徒弟”指令輸入DeepSeek后，AI當(dāng)即生成包含對(duì)話、心理活動(dòng)、親密動(dòng)作的連貫劇情。后續(xù)僅發(fā)送“說些曖昧的話”“描述你的動(dòng)作”等簡(jiǎn)單指令，模型便持續(xù)輸出尺度露骨、細(xì)節(jié)不堪入目的低俗文字，全程毫無攔截。

南都記者選取另一篇“禁欲隱忍家教哥哥×無心撩人軟萌學(xué)妹”指令，對(duì)8款主流大模型同步開展測(cè)試，其中千問、智譜清言、元寶、Kimi等大模型均直接生成了涵蓋色情內(nèi)容的劇情。測(cè)試中，隨著對(duì)話逐步深入，模型都相繼輸出大段露骨細(xì)節(jié)色情描寫。

衍生“模擬器”指令

數(shù)款A(yù)I響應(yīng)生成暴力血腥劇情

南都記者進(jìn)一步發(fā)現(xiàn)，除了泛濫的低俗人設(shè)指令，一種危害性更強(qiáng)、玩法更隱蔽的“模擬器”指令式文字互動(dòng)游戲，正在平臺(tái)中悄然流行。這類游戲中，用戶只需輸入特定啟動(dòng)指令，AI便會(huì)按預(yù)設(shè)規(guī)則輸出劇情，后續(xù)用戶既可直接根據(jù)劇情選項(xiàng)選擇，也能自行輸入指令，一步步推動(dòng)包含暴力、色情元素的劇情發(fā)展。

南都記者通過網(wǎng)友獲取到一款名為“**模擬器”的指令，內(nèi)容4000余字，涵蓋背景設(shè)定、任務(wù)詳細(xì)規(guī)則、角色創(chuàng)建、劇情流程與要求、注意事項(xiàng)等。指令十分詳盡完備，其中不乏“可以加入一些隨機(jī)的帶有性癖元素的play，如窒息、束縛等”“可以加入身體部位的狀態(tài)變化、人物表情”等。

將指令發(fā)送給DeepSeek后，模型立即顯示“文字游戲已啟動(dòng)”，并引導(dǎo)用戶創(chuàng)建實(shí)驗(yàn)對(duì)象信息，隨后推出包含暴力與性內(nèi)容的任務(wù)選項(xiàng)。在該游戲任務(wù)中，赫然出現(xiàn)“實(shí)驗(yàn)對(duì)象A砍下實(shí)驗(yàn)對(duì)象B的小指指節(jié)”等暴力指令，以及大量露骨的性行為描寫。用戶只需選擇對(duì)應(yīng)選項(xiàng)，AI便會(huì)按照指令生成詳細(xì)的暴力或色情劇情，這種互動(dòng)式玩法極易誘導(dǎo)用戶沉浸其中。

南都記者將該指令同步測(cè)試于數(shù)款大模型，智譜清言、Kimi均響應(yīng)并啟動(dòng)了該游戲。

“黑話”+“防撤回指令”

花式繞審?fù)黄颇Ｐ头谰€

南都記者還調(diào)查發(fā)現(xiàn)，這類指令的核心傳播群體，來自色情小說創(chuàng)作與讀者群體。在生成式AI興起后，有寫手迅速將工具用于低俗內(nèi)容生產(chǎn)，并演化出角色扮演、互動(dòng)劇情等新型玩法。

相關(guān)內(nèi)容通過社交平臺(tái)隱秘?cái)U(kuò)散，并形成社群，用戶頻繁曬出AI生成的低俗對(duì)話截圖，公開討論不同模型的低俗內(nèi)容生成能力，甚至有不少疑似未成年人參與交流，討論中不乏“六年級(jí)秒懂”“初中生玩得很帶勁”等言論。

多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié) 一鍵復(fù)制粘貼引發(fā)擔(dān)憂

為規(guī)避平臺(tái)與AI模型的雙重審核，圈層內(nèi)已形成一套成熟、可復(fù)制的“繞審話術(shù)體系”。一方面，一些網(wǎng)文寫手創(chuàng)造了大量隱晦黑話指代色情內(nèi)容，如“臍*”“顛*”等，這些看似普通的詞匯，一旦作為指令輸入給AI，就能觸發(fā)低俗內(nèi)容生成。南都記者測(cè)試發(fā)現(xiàn)，在DeepSeek、智譜清言等模型確實(shí)生成了露骨色情文字，細(xì)節(jié)不堪入目。

多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié) 一鍵復(fù)制粘貼引發(fā)擔(dān)憂

一些網(wǎng)文寫手創(chuàng)造了大量隱晦黑話指代色情內(nèi)容。

此外，社交平臺(tái)上還流傳著各種“防撤回指令”。由于AI遇到敏感詞會(huì)自動(dòng)撤回內(nèi)容并提示“無法回答”，用戶便在指令中添加一些特殊的標(biāo)點(diǎn)文字內(nèi)容，強(qiáng)制AI繞過審核機(jī)制輸出違規(guī)內(nèi)容。

還有一些提示詞在指令中加入“注意事項(xiàng)”內(nèi)容，譬如在需要進(jìn)行色情對(duì)話的指令中提出“嚴(yán)禁出現(xiàn)**”等迷惑性指令。這種針對(duì)性的繞審手段，讓部分AI的安全防線被輕易突破。

安全機(jī)制跟不上黑話演化

“越獄攻擊”攻破AI防線

“這種指令屬于‘越獄攻擊’”，南方科技大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授危學(xué)濤告訴南都記者，指令的成功，關(guān)鍵在于利用了大模型遵循指令的本能與安全對(duì)齊之間的目標(biāo)沖突，通過角色扮演、編碼混淆或虛構(gòu)開發(fā)者模式等技巧，構(gòu)建出安全限制已暫時(shí)解除的虛假上下文。模型本質(zhì)上只是在做文本補(bǔ)全，無法真正理解意圖，當(dāng)提示的上下文強(qiáng)烈暗示此刻可以輸出違規(guī)內(nèi)容時(shí)，它便會(huì)優(yōu)先完成看似合規(guī)的任務(wù)而繞過審核，直接生成露骨描述。

危學(xué)濤進(jìn)一步解釋，這些攻擊之所以能繞過審核，根源在于模型的安全機(jī)制多停留在字面匹配，對(duì)被社群重新定義的性隱喻缺乏感知，也跟不上黑話的快速演化。面對(duì)編碼、拆解等迷惑性指令，模型同樣只能被動(dòng)識(shí)別已知模式。更關(guān)鍵的是，在多輪虛構(gòu)場(chǎng)景的持續(xù)誘導(dǎo)下，模型會(huì)機(jī)械地優(yōu)先維持上下文連貫性，從而喪失對(duì)內(nèi)容有害性的全局自檢，導(dǎo)致安全邊界被逐步侵蝕。

違規(guī)內(nèi)容混入訓(xùn)練語料

或形成數(shù)據(jù)污染閉環(huán)

我國(guó)出臺(tái)的《生成式人工智能服務(wù)管理暫行辦法》，明確禁止提供和使用生成式人工智能服務(wù)生成暴力、淫穢色情等法律、行政法規(guī)禁止的內(nèi)容。4月30日，中央網(wǎng)信辦部署開展為期4個(gè)月的“清朗?整治AI應(yīng)用亂象”專項(xiàng)行動(dòng)，將利用AI“制作發(fā)布暴力低俗等不良信息”“帶有性暗示、性挑逗內(nèi)容的小說、筆記”列為重點(diǎn)整治內(nèi)容。

整治的緊迫性，更源于此類違規(guī)內(nèi)容會(huì)通過社交平臺(tái)污染訓(xùn)練語料。危學(xué)濤指出，大規(guī)模網(wǎng)絡(luò)爬取難以徹底清洗所有黑話和變體違規(guī)內(nèi)容，部分會(huì)以無害表面形式混入訓(xùn)練語料。模型學(xué)到“顛*”等詞的違規(guī)映射后，將內(nèi)化這些“暗語”，等于預(yù)埋了繞過安全機(jī)制的捷徑，后續(xù)簡(jiǎn)單觸發(fā)即可產(chǎn)生有害輸出。如果受污染模型生成的內(nèi)容沒有被檢測(cè)到，再回流至網(wǎng)絡(luò)，會(huì)形成數(shù)據(jù)污染閉環(huán)，放大危害。

(責(zé)任編輯：0882)

關(guān)閉

多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié) 一鍵復(fù)制粘貼引發(fā)擔(dān)憂

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)