1/0
圆桌|生成式AI时代,大模型数据安全如何保障?
澎湃新闻2024-04-26 23:41:00

在生成式AI(人工智能)时代,数据安全的出路可能会是“用魔法打败魔法”,知识产权保护也可能要提前到token(字符串)层面。

4月26日,在2024中关村论坛上,人工智能企业与学者就AI大模型的数据安全问题进行了讨论。

中关村论坛数据安全治理与发展论坛现场                                     澎湃新闻记者 秦盛 摄

“在生成式人工智能时代,我们在数据安全层面,面临的是不断组合和创造新的数据安全风险的问题,彻底解决这种风险需要算法和工具的支撑,而不是靠人,或者靠静态的方法去做相对固定的检测。”清华大学计算机科学与技术系教授、人工智能研究院基础模型研究中心副主任黄民烈如是说道。

他认为,生成式人工智能可以通过训练去组合,去生成新的内容,这些内容可能在过去的语料里根本没出现过,但它依然是有害的。所以,即便把训练数据处理得很干净,在生成式人工智能时代依然会面临有害内容产生的情况。

要解决这些问题,需要进行算法研究,比如针对性对抗攻击、自动红队,然后再加上安全和对齐手段,能够把问题在线下时就自动进行修复。

奇安信集团副总裁刘前伟表示:“做行业大模型的厂商都很担心语料会不会被窃取、有没有漏洞导致这些很核心的数据资产会泄露。这是通用大模型里过去没有特别关注的一点。”

刘前伟指出,在进行微调时,防篡改要求非常高,更需要安全,一旦标注错误,就会导致安全大模型判断错误。

而对于通用模型的使用,几乎所有人都会面临一个问题,就是当我们去问大模型问题时,会不会造成商业机密、个人信息的泄露。“不管是使用者还是开发者,都要解决隐私安全、商业机密、甚至是国家安全的问题。现在只能用AI对抗AI的方式才能解决内容安全的问题,用过去传统的流量过滤的方式是无法解决的,所以‘用魔法打败魔法’可能是一个很大的出路。”刘前伟表示。

IBM数据与转型咨询主管合伙人张玉明表示,IBM Global的一份调查报告调研了全球100多个国家和地区的高管对人工智能的看法,94%的企业高管都认为在部署AI解决方案前要确保模型的安全,但只有24%的企业打算在未来6个月内去引入一些网络安全组件,这就说明大家的认知和实际行动之间还存在延迟。

刘前伟指出,当下面临的另一个挑战,是跨境数据流动问题。如果全球的数据都汇聚在一起,不管是行业还是通用模型,训练效果一定会有很大改善。但是,数据跨境面临很多挑战,需要在多边协议等方面做更多的事,更多去拥抱国际组织,让国际的数据能够双向流通。

香港科技大学助理教授、香港生成式人工智能研发中心资深商业拓展经理韩斯睿认为,现有的知识产权保护制度,其实在智力产品的生成物层面就已截断,在生成式人工智能训练的token级别如何确权、如何保护,并没有共识。所以在数据脱离原本形态进入token新形态时如何进行确权保护,是法律和政策方面的一个症结,如果这个症结打通了,相信会极大地促进知识共享和流通发展。

知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781