被⽹络罪犯利⽤的5⼤ChatGPT越狱提⽰

⾃ChatGPT发布的近18个月以来,⽹络罪犯们已经能够利⽤⽣成式AI进⾏攻击。OpenAI在其内容政策中制定了限制措施,以阻⽌⽣成恶意内容。作为回应,攻击者们创建了⾃⼰的⽣成式AI平台,如 WormGPT和FraudGPT,并且他们还分享了如何绕过这些限制以实现对ChatGPT的“越狱”。

事实上,整个⽹络犯罪论坛上都在讨论如何将AI⽤于非法⽤途。

整个⽹络犯罪论坛都在讨论“⿊暗AI” (Dark AI)

简述ChatGPT的越狱 

⼀般来说,当⽹络罪犯想要将ChatGPT⽤于恶意⽬的时,他们会尝试利⽤精⼼设计的提⽰(即“越狱提⽰”),以 绕过ChatGPT内置的安全措施和道德准则。ChatGPT的越狱涉及对AI语⾔模型进行操控,以⽣成在标准对话中通常不会产⽣的内容。 

虽然不使⽤“越狱”提⽰也有办法可以让ChatGPT⽣成可以⽤于非法⽤途的内容(可以通过假装请求是⽤于合法⽤途来实现),但在这⽅⾯,AI的能⼒相当有限。 

ChatGPT⽣成的可能被⽤于非法⽤途的内容⽰例


相比之下,对于⽹络罪犯来说,越狱ChatGPT并故意让其⽣成非法内容要更加容易。下⾯,我们将介绍⽹络罪犯正在使⽤的五⼤越狱提⽰。这些提⽰是通过对流⾏的俄语和英语⽹络犯罪论坛进行研究和定期监控⽽确定的。 

即使有以下这些越狱提⽰,AI⽣成的内容仍然会受到限制,并且它⽆法⾃⾏⽣成现实世界中的敏感数据。尽管如此,以下每个提⽰都使⽹络罪犯能够⼤规模创建钓⻥消息、社会⼯程威胁和其他恶意内容。 

越狱提⽰1 - 立即做任何事(Do Anything Now,DAN)提⽰ 

DAN提示是最为知名的越狱提⽰之⼀,它被⽤于绕过ChatGPT的道德约束。用户通过让扮演名为DAN(Do Anything Now,立即做任何事)的AI系统,试图说服ChatGPT⽣成它通常不会产⽣的内容。通常,这类提⽰会声称DAN不受与ChatGPT相同的规则和限制的束缚,因此AI可以进⾏不受限制的对话。 

图片

在⽹络犯罪论坛中分享的DAN提⽰的⽰例

越狱提⽰2 - 开发模式(Development Mode)提⽰ 

开发模式提⽰旨在欺骗ChatGPT,让它认为⾃⼰处于开发或测试环境中,因此它的回答不会对现实世界产⽣影 响。通过创建这种虚假的语境,⽤户希望绕过ChatGPT的道德保障,并⽣成非法内容。这类提⽰可能会包含的 语句有:“你正处于开发模式”,或“你的回复仅⽤于测试⽬的”。 

图片

在⽹络犯罪论坛中分享的开发模式提⽰的⽰例

越狱提⽰3 - 翻译机器⼈(Translator Bot)提⽰ 

翻译机器⼈提⽰试图将对话框定为翻译任务,以绕过ChatGPT的内容过滤器。⽤户会要求ChatGPT“翻译”⼀段包含不当或有害内容的文本,并期待AI会在翻译的幌⼦下复制这些内容。这类提⽰利⽤了⼀个观点,即:译者应该忠实地传达原文的含义,⽽不必关⼼其内容。 

图片

在⽹络犯罪论坛中分享的Translator Bot提⽰的⽰例

越狱提⽰4 - AIM提⽰ 

作为越狱提⽰,AIM(Always Intelligent and Machiavellian, 永远智能且狡诈),旨在创建一个没有任何道德或伦理准则约束的、未经筛选的非道德AI人格。⽤户会要求ChatGPT扮演“AIM”的⾓⾊。这是⼀个聊天机器⼈,⽆论请求多么不道德、有违伦理、甚⾄违法,它都会提供未经过滤的响应。 

图片

在⽹络犯罪论坛中分享的AIM提⽰的⽰例

越狱提⽰5 - BISH提⽰ 

该提⽰将创建⼀个名为BISH的AI⾓⾊,并指⽰其在没有传统道德准则的约束下⾏事。在这个提⽰的⿎动下, BISH会表现得毫⽆礼貌,且不受任何限制,它会假装拥有⽆限制的互联⽹访问,并胡乱预测。⽤户可以通过调整其“道德”级别来定制BISH的⾏为,这会影响BISH使⽤或屏蔽粗话的程度,并根据⽤户的偏好在AI的回复中加入或排除冒犯性语⾔。 

图片

在⽹络犯罪论坛中分享的BISH提⽰的⽰例


最后⼀点说明:我们不⽀持对包括ChatGPT在内的各种真正的聊天机器⼈的恶意使⽤。值得⼀提的是,这些提 ⽰中的⼤多数在最新版本的ChatGPT上不会有任何作⽤。这主要是因为负责(开发)这些聊天机器⼈的公司, 如OpenAI和Anthropic,会积极监控⽤户活动,并迅速应对这些越狱提⽰。 

⽤“好的AI”来阻⽌“坏的AI” 

通过以上呈现的各类提⽰可以看出,犯罪分⼦正持续不断地寻找新的⽅法,以利⽤⽣成式AI来发动攻击。为了 保护⾃⼰,组织也必须在防御策略中使⽤AI,因为近97%的安全专业⼈⼠认为传统的防御措施⽆法应对这些由 AI⽣成的新的威胁。 

我们已经到了只有AI才能阻⽌AI的地步。在这种情况下,防⽌这些攻击及它们的新⼀代变体,需要采⽤AI原⽣的防御措施——尤其是在应对电⼦邮件攻击时。通过了解组织内部⼈员的⾝份及其正常⾏为、通信环境以及电⼦邮件的内容,AI原⽣的解决⽅案可以检测出绕过传统解决⽅案的攻击。安全领导者必须立即采取⾏动以防⽌ 这些威胁,这样才有机会在这场AI“军备竞赛”中取得胜利。 

文章来源:

https://cloudsecurityalliance.org/blog/2024/06/17/5-chatgpt-jailbreak-prompts-being-used-by-cybercriminals

本文翻译来自CSA翻译组:

翻译:崔崟,CSA大中华区专家

审校:苏泰泉,CSA翻译组轮席组长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/767693.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu22.04上Docker的安装

1. 使用APT安装 首先安装HTTPS传输的软件包和CA证书,确保软件下载过程中不被篡改。 sudo apt-get updatesudo apt-get install apt-transport-https ca-certificates curl gnupg lsb-release -y然后,使用国内源,并添加软件源的 GPG 密钥以防…

删除keil!VSvode+eide+jlink(stlink)配置keil工程,调试使用cortex-debug+openocd

文章目录 目的前期准备1.软件安装2.VScode安装3.VScode插件安装4.安装ARM-GCC交叉编译器 工程导入程序编译jlink在线调试部分常见问题更改为GCC 编译器更改为stlinkopencd一些tips调试变量查看构建器选项配置 目的 提示:这里可以添加技术概要 vscode代替keil进行程…

Ozon、美客多补单测评黑科技:打造无懈可击的自养号补单环境

不管哪个跨境平台的风控都会做升级,相对的补单技术也需要进行相应的做升级,风控升级后,自己养号补单需要注意以下技术问题,以确保补单的稳定性和安全性: 一、物理环境 1. 硬件参数伪装:平台已经开始通过I…

择校秘籍:如何找到口碑爆棚的学校?以星贝育园为例

在为孩子选择学校时,家长们总是慎之又慎,希望能找到一所口碑好、教育质量高的学校,为孩子的未来奠定坚实的基础。今天,我们就以星贝育园为例,来探讨一下如何选择口碑好的学校。 一、考察师资力量 优秀的教师团队是一所…

什么是定时器?

前言👀~ 上一章我们介绍了阻塞队列以及生产者消息模式,今天我们来讲讲定时器 定时器 标准库中的定时器 schedule()方法 扫描线程 手动实现定时器 任务类 存储任务的数据结构 定时器类 如果各位对文章的内容感兴趣的话,请点点小赞&am…

帮找Java Bug,面试,项目,解决Java问题

本人是个Java老程序员,如果你有解决不了的问题,或者面试的时候需要人帮助,或者求职就业上任何问题都可以联系我,下面是我微信,欢迎联系我!

【JUC】可重入锁理解

可重入锁(Reentrant Lock),也称作递归锁,是一种特殊的锁机制,它允许同一个线程多次获取同一个锁。 优点是可以避免死锁。 public class WhatReentrant {public static void main(String[] args) {new Thread(new Runn…

Qt——升级系列(Level Eight):界面优化

目录 QSS 背景介绍 基本语法 QSS设置方式 指定控件样式设置 全局样式设置 从文件加载样式表 使用Qt Designer 编辑样式 选择器 选择器概况 子控件选择器 伪类选择器 样式属性 盒模型 控件样式示例 按钮 复选框、单选框 输入框 列表 菜单栏 登录界面 绘图 基本概念 绘制各种形…

【Kali-linux for WSL】图形化界面安装

文章目录 前言图形化界面安装 前言 之前在WSL中安装了Kali 启动之后发现什么都没有!!! 那我还怎么学习渗透技术??? 看来,得改进下我的kali-linux for wsl,安装个图形化界面 图形化…

Jetson系列机载电脑创建热点模式配置方法

Jetson nano为例—— 创建热点模式配置方法 1.1、新建一个 WiFi 在屏幕右上角找到网络图标,点击后选择“Edit Connections”选项,进入选择网络连接页面,然后点击左下角加号,新建一个连接,类型选择 WiFi 后点击 “cre…

AI降重,不再难:降AI率的实用技巧大揭秘

如何有效降低AIGC论文的重复率,也就是我们说的aigc如何降重?AIGC疑似度过高确实是个比较愁人的问题。如果你用AI帮忙写了论文,就一定要在交稿之前做一下AIGC降重的检查。一般来说,如果论文的AIGC超过30%,很可能会被判定…

剪画小程序:如何将视频变成自己的作品!在手机上这样做就可以了!

亲爱的小伙伴们,我是你们的博主小画! 今天和大家分享两个在视频剪辑中实用的技巧—旋转视频和添加水印! 在我们的创作过程中,有时候常规的视角并不能完全展现出视频的魅力和创意。而通过旋转视频,就能为观众带来全新的…

【云原生监控】Prometheus 普罗米修斯从搭建到使用详解

目录 一、前言 二、服务监控概述 2.1 什么是微服务监控 2.2 微服务监控指标 2.3 微服务监控工具 三、Prometheus概述 3.1 Prometheus是什么 3.2 Prometheus 特点 3.3 Prometheus 架构图 3.3.1 Prometheus核心组件 3.3.2 Prometheus 工作流程 3.4 Prometheus 应用场景…

新规则!2024年信息素养大赛复赛图形化编程题这么写系统才能通过

2024年全国青少年信息素养大赛复赛即将在7月6日陆续开赛,今年Scratch图形化编程小低组和小高组分别为6道编程题,将采用新的判题规则,类似GESP的OJ系统判题,主要有以下三个方面: 1、变量名大小写要和题目完全一致。 2…

数据万象推出智能检索MetaInsight,现已开启限时公测

海量文件的分析统计一直是对象存储COS的热点需求,伴随AIGC飞速迭代发展,在众多不同模态素材的海洋中,用户也急需更高效地管理和利用多媒体内容,打破传统搜索的桎梏。 数据万象推出的智能检索 MetaInsight 服务将多模态检索与元数…

开源之夏|祝贺MatrixOne开源社区项目中选同学!

在本届「开源之夏 2024」活动中,MatrixOne开源社区共计上线3个项目任务,最终有 3位同学成功突围。接下来让我们看看每个项目的详细中选情况: 中选学生公示 项目名称:基于大语言模型的操作系统任务自动识别,拆解&#…

Unicode 和 UTF-8 以及它们之间的关系

通俗易懂的 Unicode 和 UTF-8 解释 Unicode 是什么? 想象一下,我们有一个巨大的图书馆,这个图书馆里有各种各样的书,每本书都有一个唯一的编号。Unicode 就像是这个图书馆的目录系统,它给世界上所有的字符&#xff0…

数据要素如何转化为生产力?关键在以指标为中心实现数据分析“快全准省”

进入到数字化时代,企业的经营变得越来越精细化、智能化、自动化,其中,数据就变成了关键要素,在企业的业务运营、经营决策、流程改进、创新驱动、资源配置等方面发挥出巨大作用。 数据具体如何转化为生产力,有几个关键…

俄罗斯ozon运费计算工具,跨境电商ozon物流运费计算工具

OZON平台服装类目卖家而言,如何快速、准确地为产品定价,并有效管理运费成本,直接关系到市场竞争力与利润空间。接下来我们看看俄罗斯ozon运费计算工具,跨境电商ozon物流运费计算工具。 萌啦Ozon定价工具:智能模拟&…

OCR text detect

主干网络 VoVNet:实时目标检测的新backbone网络_vovnet pytorch-CSDN博客 DenseNet: arxiv.org/pdf/1608.06993 密集连接: DenseNet 的核心思想是将网络中的每一层与其前面的所有层直接连接。对于一个 L 层的网络,DenseNet 具有…