代理模型(担心自己的AI模型被盗)

 2025-09-04 21:06:01  阅读 935  评论 0

摘要:萧箫 发自 凹非寺量子位 报道 | 公众号 QbitAI作为一种数字资产,AI模型面临着被窃取的风险。随着大量AI模型被广泛部署在云端,我们究竟该如何保护AI模型不受“偷窃”?这两天,腾讯朱雀实验室在全球知名信息安全峰会POC 2021上,进行了题为《AI模型的安全保护》(Towards AI

萧箫 发自 凹非寺

量子位 报道 | 公众号 QbitAI

作为一种数字资产,AI模型面临着被窃取的风险。

随着大量AI模型被广泛部署在云端,我们究竟该如何保护AI模型不受“偷窃”?

这两天,腾讯朱雀实验室在全球知名信息安全峰会POC 2021上,进行了题为《AI模型的安全保护》(Towards AI Model Security Protection)的分享。

其中,腾讯朱雀实验室的高级研究员Mengyun Tang和研究员Tony,展示了AI模型攻防实例,并提出了一种新的模型水印生成方法。

这项技术可以防御多种模型窃取方式,并且对原模型的输出几乎不产生影响,为AI模型版权提供有效的保护。

AI模型维权者,往往难以“自证”

AI模型作为技术的核心载体,一旦被窃取,将可能让拥有该技术的企业或组织暴露在风险中。

例如,一家公司的AI模型被黑客恶意盗取后,黑客就可以复制该公司的业务,来抢占市场,获取间接经济利益;或是将模型出售给第三方、甚至勒索该公司,以获取直接经济利益。

在模型窃取方式中,代理模型攻击是一种典型的手段,它通过训练与原模型功能相似的代理模型,来蒸馏原模型的知识:

将原模型的输入作为其输入,原模型的输出作为其训练标签,并进行参数优化,不断拟合原模型的输出,最终达到窃取原模型知识的目的。

担心自己的AI模型被盗?试试给它打个“胎记”丨腾讯朱雀实验室

△模型窃取流程

在面对模型窃取攻击时,模型的原作者往往容易处于被动。

由于攻击者并不直接接触原模型,原作者无法提供直接证据来证明被窃取的模型中含有自己的知识产权,因此往往会陷入维权困难的境地。

一旦这种模型窃取攻击泛滥,AI的发展也会面临更多挑战。

给AI模型打个“胎记”

针对上述问题,腾讯朱雀实验室结合最新的深度学习技术,推出了一套为AI模型提供保护的方法,针对疑似窃取模型进行“取证”,来证明该模型为“盗版”模型。

在预先防护阶段,这套方法会生成肉眼不可见的水印,并将之添加到原模型的输出上,为原模型的输出“烙上”版权信息。

然后,通过经训练的提取器,可以从代理模型的输出中精准地检测到水印的存在,并将预先嵌入的模型版权信息进行高质量的还原,从而为模型原作者提供有力的技术证据,来对抗侵权行为。

担心自己的AI模型被盗?试试给它打个“胎记”丨腾讯朱雀实验室

△朱雀实验室提出的模型水印生成方法及其保护流程

值得注意的是,这套方法对原模型的输出几乎不产生影响。

当AI模型被攻击时,其附带的水印也会被代理模型学习,进而使得代理模型的输出中也含有该水印。

换而言之,这项技术为AI模型提供了一道“胎记”。

它不仅能够有效地帮助AI模型作者维护自己的知识产权,还能打击“盗版”AI模型,一定程度地遏制模型窃取行为的发生,促进AI行业的生态持续健康发展。

作者介绍

腾讯朱雀实验室,属于腾讯安全平台部,致力于实战级APT攻击和AI安全研究。

朱雀实验室建设有AI安全威胁风险矩阵,专门针对人工智能行业中的潜在风险提供研究和预案,为AI业务提供安全保障。

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

版权声明:我们致力于保护作者版权,注重分享,被刊用文章【代理模型(担心自己的AI模型被盗)】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!;

原文链接:https://www.yxiso.com/zhishi/2129346.html

标签:代理模型

发表评论:

关于我们
院校搜的目标不仅是为用户提供数据和信息,更是成为每一位学子梦想实现的桥梁。我们相信,通过准确的信息与专业的指导,每一位学子都能找到属于自己的教育之路,迈向成功的未来。助力每一个梦想,实现更美好的未来!
联系方式
电话:
地址:广东省中山市
Email:beimuxi@protonmail.com

Copyright © 2022 院校搜 Inc. 保留所有权利。 Powered by BEIMUCMS 3.0.3

页面耗时0.0340秒, 内存占用1.91 MB, 访问数据库24次

陕ICP备14005772号-15