首页 > 生活分享 > 免费教学 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12来源: 15210273549

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

免费教学更多>>

突发!谷歌 Python 团队全体被裁,Flutter 团队 不再兼容,鸿蒙5.0要彻底脱离安卓,背后深层原因 华为Pocket 2/Mate 60系列等11款机型开放鸿蒙 电脑连不上网怎么回事 电脑连不上网的原因及解决方法 AI 2.0时代挑战机遇并存 联想异构智算强势破局 新能源汽车完善产业生态链“出海” 凭借技术优势加快“走出去” 4月主要新能源车企“成绩单”出炉:比亚迪同比增长49%强势领跑! 北京车展|核心目标是“6655”,岚图汽车发布出海计划 岚图汽车4月交付4003辆同比增长20%,1-4月20348辆同比增长20% 全系车型降2万,荣威这场“荣卷风”刮进了谁的心里? 上汽集团申请能量回收专利,提升驾驶员的驾驶体验 一直被模仿,从来没有被超越,理想L6全新上市,售价24.98万起 广汽集团获融资买入0.77亿元,近三日累计买入1.78亿元 马斯克,想要中国第二次救特斯拉?这次能成么? 国内油价再下调,五一出行加油便宜了,5月1日95、92汽油今日价格 做生意三十年,赚了三百万后,突然顿悟:1、要成功,要学会“藏” 汇聚全球各种超越想象的机场,中国有几个? 中通称比顺丰更挣钱,“以价换量”能否夺魁? 大逆转!华为摘冠小米惨败,国内手机市场迎来开挂时刻! 海信信号机屡获用户认可的背后:不搞“花架子”,只做“实干派” 闪极随行Mini应急胶囊移动电源新推极光粉配色:149元 抖音电商近一月的新鲜事 马云的商业帝国,以阿里巴巴集团为核心 万字解析Al+ Web3:新型生产关系赋能人工智能时代 北斗!北斗!一千万年才误差1秒!服务200多个国家和地区 2024年手机值得入手的排行榜 这就是iPhone 16系列? 五一后新机扎堆发布 vivoOPPO真我魅族你最期待谁? 荣耀的几款性价比手机!喜欢荣耀的朋友别错过了哟! 从小米11ultra换到小米14ultra,先说结论: 提升巨大!#小米