专栏名称: 人工智能学派

人工智能学派专注于分享：GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业！

目录

相关文章推荐

女神汇 · 无意间发现男朋友给我的备注太奇怪？网友却说他 ... · 3 天前

女神汇 · 老公和女同事的聊天记录，正常吗？ · 2 天前

女神汇 · 我妈在餐厅当服务员，男朋友觉得丢人？我该生气吗？ · 3 天前

女神汇 · 男朋友主动问我要什么礼物我说了他就生气了 · 4 天前

女神汇 · 分手想送北京大平层给前男友,最后给他200万 ... · 4 天前

51好读 › 专栏 › 人工智能学派

大模型专题：百度大模型原生安全构建之路

人工智能学派 · 公众号 · · 2024-10-28 17:11

正文

如何下载资料？

微信扫下方二维码加入星球平台

【老会员续费特惠】

今天分享的是：大模型专题：百度大模型原生安全构建之路

报告共计：36页

《大模型专题：百度大模型原生安全构建之路》由冯景辉在全球人工智能开发与应用大会上的演讲内容整理而成。报告指出大模型面临安全挑战，包括全生命周期的训练、部署和业务运营阶段。训练阶段需平衡数据准确性与多样性，评估质量，清洗不符价值观等内容；部署阶段要防止数据和模型被窃取、泄漏及恶意攻击；业务运营阶段需保障接口、提问和输出内容安全，应对提示注入等攻击。

大模型安全技术历经演进，安全对齐、内容审核等技术存在局限。百度提出原生安全之路，包含数据清洗、安全围栏、安全对齐和持续评估四要素。数据清洗要符合标准，脱敏隐私信息；安全围栏有对抗性防御架构，包括输出过滤、多轮改写、必答知识库和模型防火墙等；安全对齐采用有监督精调等方法；持续评估要全面检测风险。此外，要关注智能体安全，包括场景安全、Prompt泄露、RAG投毒等问题，需明确应用与基础模型责任边界，构建纵深防御架构，遵循安全原则，如禁止角色扮演等。通过内生安全与外层防护配合，实现大模型安全。

以下为报告节选内容

请到「今天看啥」查看全文

推荐文章

女神汇 · 无意间发现男朋友给我的备注太奇怪？网友却说他肯定不止我一个女朋友？

3 天前

女神汇 · 老公和女同事的聊天记录，正常吗？

2 天前

女神汇 · 我妈在餐厅当服务员，男朋友觉得丢人？我该生气吗？

3 天前

女神汇 · 男朋友主动问我要什么礼物我说了他就生气了

4 天前

女神汇 · 分手想送北京大平层给前男友,最后给他200万分手费?网友夺笋：谈恋爱穷也有好处！

4 天前

立德融金集团 · 西天取经路上其实只有一个妖怪

8 年前

儿童摄影引导技巧 · 儿童摄影丨五步教你定格宝贝童真！

8 年前

中国政府网 · 文件丨国务院印发《“十三五”现代综合交通运输体系发展规划》

8 年前

寻找中国创客 · 创客福利 | 原汁原味的硅谷创业经验先到先得

7 年前

站长那点事 · 微信时代如何劫持百万流量

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!