BDS国家工程中心:目前大型语言模型普遍面临提示注入攻击安全风险


(相关资料图)

7月6日消息,大数据协同安全技术国家工程研究中心(BDS国家工程中心)官网发布国内首份《大语言模型提示注入攻击安全风险分析报告》。报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。

关键词:

为您推荐

BDS国家工程中心:目前大型语言模型普遍面临提示注入攻击安全风险

App7月6日消息,大数据协同安全技术国家工程研究中心(BDS国家工程中心

来源:钛媒体2023-07-06

天龙股份: 关于持股5%以上股东减持超过1%的提示性公告

天龙股份:关于持股5%以上股东减持超过1%的提示性公告

来源:证券之星2023-07-06

可容纳1800名学生!三亚海罗小学改扩建项目预计明年6月交付使用

商报全媒体讯(椰网 海拔新闻记者熊文颖)今年的三亚市政府工作报告提

来源:海拔新闻2023-07-06

上海人注意:家里隐藏的“炸弹”没时间拆?可以这样预约!下半年还有这些大计划→

“我在网上看到,政府正在为管道天然气用户免费更换灶具连接软管,我想

来源:新民晚报2023-07-06

5GW!粤水电2023-2024年度光伏组件集采项目发布

5GW!粤水电2023-2024年度光伏组件集采项目发布7月6日,粤水电2023-202

来源:北极星太阳能光伏网2023-07-06

第二十九届中国兰州投资贸易洽谈会开幕

当日,第二十九届中国兰州投资贸易洽谈会在甘肃国际会展中心开幕,国内

来源:新华社新闻2023-07-06

补充医疗保险单位和个人缴费比例是多少

补充医疗保险单位和个人缴费比例是多少答案如下接下来随社保网小编一起

来源:律法网2023-07-06

黑龙江省尚志市发布冰雹橙色预警

尚志市气象台7月6日15时15分发布冰雹橙色预警信号:预计未来3小时,我

来源:北京青年报官网2023-07-06