专栏名称: 人工智能学派
人工智能学派专注于分享:GPT、AIGC、AI大模型、AI算力、机器人、虚拟人、元宇宙等AI+160个细分行业!
51好读  ›  专栏  ›  人工智能学派

大模型专题:百度大模型原生安全构建之路

人工智能学派  · 公众号  ·  · 2024-10-28 17:11

正文

如何下载资料?

微信扫下方二维码加入星球平台

【老会员续费特惠】

今天分享的是:大模型专题:百度大模型原生安全构建之路

报告共计:36页

《大模型专题:百度大模型原生安全构建之路》由冯景辉在全球人工智能开发与应用大会上的演讲内容整理而成。报告指出大模型面临安全挑战,包括全生命周期的训练、部署和业务运营阶段。训练阶段需平衡数据准确性与多样性,评估质量,清洗不符价值观等内容;部署阶段要防止数据和模型被窃取、泄漏及恶意攻击;业务运营阶段需保障接口、提问和输出内容安全,应对提示注入等攻击。

大模型安全技术历经演进,安全对齐、内容审核等技术存在局限。百度提出原生安全之路,包含数据清洗、安全围栏、安全对齐和持续评估四要素。数据清洗要符合标准,脱敏隐私信息;安全围栏有对抗性防御架构,包括输出过滤、多轮改写、必答知识库和模型防火墙等;安全对齐采用有监督精调等方法;持续评估要全面检测风险。此外,要关注智能体安全,包括场景安全、Prompt泄露、RAG投毒等问题,需明确应用与基础模型责任边界,构建纵深防御架构,遵循安全原则,如禁止角色扮演等。通过内生安全与外层防护配合,实现大模型安全。

以下为报告节选内容







请到「今天看啥」查看全文