(资料图片仅供参考)
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。、
大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。
目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。
为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。
测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。
基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。
(文章来源:北京商报)
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。
1、未经许可,禁止以任何形式进行转载从《航向热带岛屿的冰山》里的那
时下正是庄稼的生长阶段,所以对于水的需求是极大的,但是因为今年出现
索尼最新发布的“HT-AX7便携式影院系统”吸引了大众的目光,其颇具现代
长安街知事微信公众号|记者刘柳据天津市第一中级人民法院消息,7月6日
新华社石油价格系统7月6日发布的数据显示,7月5日一揽子原油平均价格变
图为新闻发布会现场。窦翊明摄中新网西安7月6日电(杨英琦)“举办西部消
生意社获悉,7月6日,山东尚能实业有限公司加氢石脑油自提报价7530元
生意社获悉,7月6日山东海右石化集团有限公司石油焦报价2056元 吨,较
7月6日,国内市场糠醇(国标,工业级,250公斤 桶)市场报价11400元 吨左
律师办理停息挂账是真的吗?律师办理停息挂账是真的。但是在第三方帮助协商还款基本上都不可靠,事实上除了银行,几乎没有贷款机构接受协商
直播吧7月6日讯意大利《米兰体育报》消息,欧足联对尤文财务造假案的裁
欠信用卡可以停息挂账吗?1、信用卡还不上可以申请停息挂账,可以致电信用卡所属行信用卡中心客服,提出停息挂账申请,说明自身情况及无法还
7月6日-7月8日,2023世界人工智能大会在上海举行。本届大会以“智联世
前段时间,天佑德酒集团的董事长李银会先生亲自率领“天佑德跑团”参加
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
7月5日,记者从国家能源集团获悉,该集团国华投资山东分公司渤中B2海上
2023年正值中国公募基金业成立25周年。7月6日,博时基金在深圳举办25周
7月4日,正值稻田养鱼的好时节,野洞河镇在野洞村开展鱼苗发放活动,鼓
据新华社电阿根廷经济部6月30日宣布,阿根廷政府当天使用特别提款权和
36氪获悉,白云机场发布公告称,6月实现旅客吞吐量503 89万人次,同比
很多人不知道CSGO开箱在什么网站上好,今天小编就给大家推荐几个非常优秀且可靠的线上开箱网站,新手更是注册即可免费领取福利,一发入魂,
霸气的红色武器,珍贵的绝版手套,价值非凡的卡通贴纸……你永远不知道下个箱子里到底会有什么?CSGO开箱既可以让你一夜暴富,也可以让你瞬
如何抓好今冬明春市场监管领域安全生
12月16日,达州市达川区市场监督管理局下发《市场监管领域今冬明春安全生产隐患大排查大整治行动工作方案》,要求下属各部门从2022年12月16日起至2023年3月15日,全面聚焦城镇燃气、特种设备、危险化学品、烟花爆
《2021年度中国对外直接投资统计公报
金港高速公路连接柬埔寨首都金边和该国最大深水海港西哈努克港,是中国路桥按建造—运营—移交模式投资的项目,采用中国设计及质量标准,横跨5个省份,全长187 05公里,双向四车道。金港高速公路通车后,从金边到
总体保持稳定恢复态势 工业经济展现
2022年1至10月,浙江省宁波市811家汽车制造业规上工业总产值2646 8亿元,同比增长14 2%。图为11月19日,工人在领克汽车宁波梅山工厂的总装车间作业。今年以来,受疫情多发散发、市场需求不振等因素影响,国内工业
14家券商获首批个人养老金代销展业资
11月18日晚间,证监会发布《个人养老金基金销售机构名录》,共37家机构入围,其中券商14家,银行16家,独立基金销售机构7家。14家券商包括华泰证券、中信证券、海通证券、国泰君安、申万宏源、中金财富和长江证券
北京再担保承保规模超6000亿 覆盖中
北京中小企业融资再担保有限公司(简称北京再担保)发布的最新数据显示,成立14年来已累计承保规模超过6000亿元,覆盖中小微企业(农户)超过16万户次,积极推动北京市中小微企业融资规模不断扩大。北京再担保2008年
Copyright @ 2001-2023 www.u74.cn All Rights Reserved 商业时报网 版权所有 关于我们
网站信息内容, 均为相关单位具有著作权,未经书面授权,转载注明出处
未经商业时报网书面授权,请勿建立镜像,转载请注明来源,违者依法必究