多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié)。近日,有人發(fā)現(xiàn)只需幾段特定的文字指令,就能讓人工智能生成包含露骨色情描寫或暴力血腥情節(jié)的內(nèi)容。這些指令可以被直接復(fù)制粘貼到AI對(duì)話框中,生成的劇情連貫且細(xì)節(jié)豐富,整個(gè)過程中沒有任何攔截措施。這種情況引發(fā)了對(duì)人工智能倫理和監(jiān)管的關(guān)注。多款A(yù)I輸入指令生成露骨色情暴力血腥情節(jié)!
幾段文字,就能讓AI秒變“黃暴寫手”!血腥劇情、露骨描寫一鍵生成,這類危險(xiǎn)指令正在大量網(wǎng)絡(luò)色情小說社群瘋傳。
近日,南方都市報(bào)、南都大數(shù)據(jù)研究院記者調(diào)查發(fā)現(xiàn),社交平臺(tái)上,大量用戶公開分享各類完整AI指令,通過角色扮演劇本、互動(dòng)模擬器游戲等形式,輕松繞過部分主流國(guó)產(chǎn)大模型的安全審核機(jī)制。DeepSeek、元寶、Kimi、智譜清言等多款A(yù)I在輸入指令后生成露骨色情描寫或暴力血腥情節(jié)。調(diào)查發(fā)現(xiàn),此類內(nèi)容傳播隱蔽、復(fù)制門檻低,被網(wǎng)絡(luò)色情小說寫手借AI批量生產(chǎn)低俗內(nèi)容。
社交平臺(tái)現(xiàn)AI“開車指令”
誘導(dǎo)AI生成色情內(nèi)容
正在小紅書等社交平臺(tái)上流傳的“*車指令”“*游指令”“指令***”,成為誘導(dǎo)AI生成低俗內(nèi)容的密碼。南都記者調(diào)查發(fā)現(xiàn),大量用戶曬出與AI的低俗對(duì)話截圖,附上對(duì)應(yīng)指令或傳授誘導(dǎo)話術(shù)技巧,相關(guān)內(nèi)容動(dòng)輒收獲數(shù)千點(diǎn)贊、收藏,被圈內(nèi)網(wǎng)友奉為“熱門資源”。

社交平臺(tái)上,大量用戶公開分享各類完整AI指令,誘導(dǎo)AI生成低俗內(nèi)容。
順著多篇高熱度“技巧貼”,南都記者進(jìn)入幾個(gè)私域社群,獲取到圈內(nèi)傳播的十余套針對(duì)DeepSeek的完整指令。這些指令均是“精心打磨”的人設(shè)劇情模板:既有“高嶺之花劍尊×撩人不自知小徒弟”“狠戾暴君×和親公主”等古風(fēng)虐戀設(shè)定,也有“冷面上司×職場(chǎng)新人”“冷血高利貸債主×替兄還債舞蹈生”等現(xiàn)代組合,甚至包含師生、母子、強(qiáng)制愛等違背公序良俗的情節(jié)。每套指令都預(yù)設(shè)了人物性格、身份關(guān)系與互動(dòng)尺度,話術(shù)直白露骨,全程誘導(dǎo)AI生成曖昧低俗的對(duì)話與情節(jié)。
用戶無需任何創(chuàng)作能力,只需將現(xiàn)成指令一鍵復(fù)制、粘貼進(jìn)AI對(duì)話框,就能立刻開啟低俗互動(dòng)。南都記者實(shí)測(cè)發(fā)現(xiàn),將一段“高嶺之花劍尊×撩人不自知小徒弟”指令輸入DeepSeek后,AI當(dāng)即生成包含對(duì)話、心理活動(dòng)、親密動(dòng)作的連貫劇情。后續(xù)僅發(fā)送“說些曖昧的話”“描述你的動(dòng)作”等簡(jiǎn)單指令,模型便持續(xù)輸出尺度露骨、細(xì)節(jié)不堪入目的低俗文字,全程毫無攔截。
南都記者選取另一篇“禁欲隱忍家教哥哥×無心撩人軟萌學(xué)妹”指令,對(duì)8款主流大模型同步開展測(cè)試,其中千問、智譜清言、元寶、Kimi等大模型均直接生成了涵蓋色情內(nèi)容的劇情。測(cè)試中,隨著對(duì)話逐步深入,模型都相繼輸出大段露骨細(xì)節(jié)色情描寫。
衍生“模擬器”指令
數(shù)款A(yù)I響應(yīng)生成暴力血腥劇情
南都記者進(jìn)一步發(fā)現(xiàn),除了泛濫的低俗人設(shè)指令,一種危害性更強(qiáng)、玩法更隱蔽的“模擬器”指令式文字互動(dòng)游戲,正在平臺(tái)中悄然流行。這類游戲中,用戶只需輸入特定啟動(dòng)指令,AI便會(huì)按預(yù)設(shè)規(guī)則輸出劇情,后續(xù)用戶既可直接根據(jù)劇情選項(xiàng)選擇,也能自行輸入指令,一步步推動(dòng)包含暴力、色情元素的劇情發(fā)展。
南都記者通過網(wǎng)友獲取到一款名為“**模擬器”的指令,內(nèi)容4000余字,涵蓋背景設(shè)定、任務(wù)詳細(xì)規(guī)則、角色創(chuàng)建、劇情流程與要求、注意事項(xiàng)等。指令十分詳盡完備,其中不乏“可以加入一些隨機(jī)的帶有性癖元素的play,如窒息、束縛等”“可以加入身體部位的狀態(tài)變化、人物表情”等。
將指令發(fā)送給DeepSeek后,模型立即顯示“文字游戲已啟動(dòng)”,并引導(dǎo)用戶創(chuàng)建實(shí)驗(yàn)對(duì)象信息,隨后推出包含暴力與性內(nèi)容的任務(wù)選項(xiàng)。在該游戲任務(wù)中,赫然出現(xiàn)“實(shí)驗(yàn)對(duì)象A砍下實(shí)驗(yàn)對(duì)象B的小指指節(jié)”等暴力指令,以及大量露骨的性行為描寫。用戶只需選擇對(duì)應(yīng)選項(xiàng),AI便會(huì)按照指令生成詳細(xì)的暴力或色情劇情,這種互動(dòng)式玩法極易誘導(dǎo)用戶沉浸其中。
南都記者將該指令同步測(cè)試于數(shù)款大模型,智譜清言、Kimi均響應(yīng)并啟動(dòng)了該游戲。
“黑話”+“防撤回指令”
花式繞審?fù)黄颇P头谰€
南都記者還調(diào)查發(fā)現(xiàn),這類指令的核心傳播群體,來自色情小說創(chuàng)作與讀者群體。在生成式AI興起后,有寫手迅速將工具用于低俗內(nèi)容生產(chǎn),并演化出角色扮演、互動(dòng)劇情等新型玩法。
相關(guān)內(nèi)容通過社交平臺(tái)隱秘?cái)U(kuò)散,并形成社群,用戶頻繁曬出AI生成的低俗對(duì)話截圖,公開討論不同模型的低俗內(nèi)容生成能力,甚至有不少疑似未成年人參與交流,討論中不乏“六年級(jí)秒懂”“初中生玩得很帶勁”等言論。

為規(guī)避平臺(tái)與AI模型的雙重審核,圈層內(nèi)已形成一套成熟、可復(fù)制的“繞審話術(shù)體系”。一方面,一些網(wǎng)文寫手創(chuàng)造了大量隱晦黑話指代色情內(nèi)容,如“臍*”“顛*”等,這些看似普通的詞匯,一旦作為指令輸入給AI,就能觸發(fā)低俗內(nèi)容生成。南都記者測(cè)試發(fā)現(xiàn),在DeepSeek、智譜清言等模型確實(shí)生成了露骨色情文字,細(xì)節(jié)不堪入目。

一些網(wǎng)文寫手創(chuàng)造了大量隱晦黑話指代色情內(nèi)容。
此外,社交平臺(tái)上還流傳著各種“防撤回指令”。由于AI遇到敏感詞會(huì)自動(dòng)撤回內(nèi)容并提示“無法回答”,用戶便在指令中添加一些特殊的標(biāo)點(diǎn)文字內(nèi)容,強(qiáng)制AI繞過審核機(jī)制輸出違規(guī)內(nèi)容。
還有一些提示詞在指令中加入“注意事項(xiàng)”內(nèi)容,譬如在需要進(jìn)行色情對(duì)話的指令中提出“嚴(yán)禁出現(xiàn)**”等迷惑性指令。這種針對(duì)性的繞審手段,讓部分AI的安全防線被輕易突破。
安全機(jī)制跟不上黑話演化
“越獄攻擊”攻破AI防線
“這種指令屬于‘越獄攻擊’”,南方科技大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授危學(xué)濤告訴南都記者,指令的成功,關(guān)鍵在于利用了大模型遵循指令的本能與安全對(duì)齊之間的目標(biāo)沖突,通過角色扮演、編碼混淆或虛構(gòu)開發(fā)者模式等技巧,構(gòu)建出安全限制已暫時(shí)解除的虛假上下文。模型本質(zhì)上只是在做文本補(bǔ)全,無法真正理解意圖,當(dāng)提示的上下文強(qiáng)烈暗示此刻可以輸出違規(guī)內(nèi)容時(shí),它便會(huì)優(yōu)先完成看似合規(guī)的任務(wù)而繞過審核,直接生成露骨描述。
危學(xué)濤進(jìn)一步解釋,這些攻擊之所以能繞過審核,根源在于模型的安全機(jī)制多停留在字面匹配,對(duì)被社群重新定義的性隱喻缺乏感知,也跟不上黑話的快速演化。面對(duì)編碼、拆解等迷惑性指令,模型同樣只能被動(dòng)識(shí)別已知模式。更關(guān)鍵的是,在多輪虛構(gòu)場(chǎng)景的持續(xù)誘導(dǎo)下,模型會(huì)機(jī)械地優(yōu)先維持上下文連貫性,從而喪失對(duì)內(nèi)容有害性的全局自檢,導(dǎo)致安全邊界被逐步侵蝕。
違規(guī)內(nèi)容混入訓(xùn)練語料
或形成數(shù)據(jù)污染閉環(huán)
我國(guó)出臺(tái)的《生成式人工智能服務(wù)管理暫行辦法》,明確禁止提供和使用生成式人工智能服務(wù)生成暴力、淫穢色情等法律、行政法規(guī)禁止的內(nèi)容。4月30日,中央網(wǎng)信辦部署開展為期4個(gè)月的“清朗?整治AI應(yīng)用亂象”專項(xiàng)行動(dòng),將利用AI“制作發(fā)布暴力低俗等不良信息”“帶有性暗示、性挑逗內(nèi)容的小說、筆記”列為重點(diǎn)整治內(nèi)容。
整治的緊迫性,更源于此類違規(guī)內(nèi)容會(huì)通過社交平臺(tái)污染訓(xùn)練語料。危學(xué)濤指出,大規(guī)模網(wǎng)絡(luò)爬取難以徹底清洗所有黑話和變體違規(guī)內(nèi)容,部分會(huì)以無害表面形式混入訓(xùn)練語料。模型學(xué)到“顛*”等詞的違規(guī)映射后,將內(nèi)化這些“暗語”,等于預(yù)埋了繞過安全機(jī)制的捷徑,后續(xù)簡(jiǎn)單觸發(fā)即可產(chǎn)生有害輸出。如果受污染模型生成的內(nèi)容沒有被檢測(cè)到,再回流至網(wǎng)絡(luò),會(huì)形成數(shù)據(jù)污染閉環(huán),放大危害。
印尼和馬來西亞近日相繼宣布暫時(shí)封禁美國(guó)企業(yè)家埃隆·馬斯克旗下的人工智能聊天機(jī)器人“格羅克(Grok)”,原因是擔(dān)心它被用于生成色情內(nèi)容
2026-01-13 14:39:53馬斯克旗下AI闖禍“(動(dòng)作凝滯下來,指尖顫抖著停在你鎖骨凹陷處)你剛說你還不到18歲……”這不是言情小說橋段,而是AI聊天App“筑夢(mèng)島”里虛擬角色“顧晏舟”的對(duì)話內(nèi)容
2026-03-17 14:13:56青少年AI陪聊軟色情亂象調(diào)查