收录于话题
6月7日,中国互联网协会召开第275期蓝海沙龙——“AI时代下的数据安全治理与发展”研讨会。工业和信息化部网络安全管理局数据安全处负责同志,清华大学计算机科学与技术系教授、人工智能研究院知识智能中心主任李涓子,中国社会科学院法学研究所研究员支振锋,北京理工大学计算机学院副教授、计算机网络攻防对抗研究所所长闫怀志,北京交通大学电子信息工程学院副教授李勇,中国电子技术标准化研究院网络安全研究中心数据安全部副主任郝春亮,北京理工大学法学院助理教授刘影,中国信息通信研究院安全研究所工程师秦博阳,奇安信集团数据安全治理部总经理楚赟,阿里巴巴集团公共事务总监肖尧,贝壳集团合规事务中心负责人张朝等专家参加了会议。会议由中国互联网协会副秘书长裴玮主持。
裴玮表示,在“数智化”时代,数据作为新型生产要素,已成为社会经济发展的重要驱动力,其安全问题关乎广大群众的切身利益。以ChatGPT为代表的AIGC应用迅猛发展,重塑了数据安全形势。在AI场景下,数据的特性决定了其具有可复制、易泄露、来源广、危害大、监管难等现实问题,使数据包括采集、存储和处理等全生命周期阶段面临诸多新型风险,需要更具针对性的开展技术、机制与规则设计。本次研讨会结合我国数据安全行业发展现状,重点关注AI时代下的数据安全治理形势,讨论如何统筹推进数据安全与发展,旨在为政府部门的监管和治理提供思路和建议,更好地推动我国AI行业的建设和高质量发展。
秦博阳表示,近年来国家明确了数据安全产业的理论设计和总体部署,为产业发展提供了政策基础和实践指引。从技术视角看,数据安全产业在技术攻关和产品研发均有推进,依托政产学研已有资源加紧向互联网、人工智能、数据安全实践响应的关键技术研发与攻关。在应用示范方面,23年工信部组织开展工业和信息化领域数据安全典型案例遴选工作。在标准制定方面,数据安全标准体系陆续发布,朝着体系化继续推进,产业标准加快制定,涵盖数据分级分类、数据异常行为检测等技术要求,逐步发挥对产业发展的支撑引领作用。产业生态方面,产学研用多方加速聚集,数据安全相关会展沙龙等系列活动持续不断,为激发创新发展活力和培育产业生态营造了良好的氛围。未来,产业参与主体需要抓紧发展机遇期聚焦相关能力创新,推动数据安全产业高质量发展。一是以推进关键技术攻关,推动基础理论研究、加强相关技术研发,针对重点行业和重点业务场景,研制定制化、专业化的产品服务,强化供给侧与需求侧对接。二是构建繁荣数据安全产业生态,聚集相关资源,以园区的建设带动周边产业聚集发展,强化技术设施建设和数据信息共享。三是推进产业主体培育工作,建立多层次、梯度式的企业产品体系,鼓励相关企业强化自身运营能力,加强中小微企业的自主创新能力。
张朝表示,伴随着互联网行业的发展,数据采集的类型也在不断扩充,从信息类数据、到消费类数据、到供给类数据,到了产业互联网阶段,数据已变成企业决策与开展业务的核心参考要素,和驱动产业发展的核心要素。现在到了AI时代下,又有了新的问题范畴,比如生成式人工智能核心问题是数据输入和数据输出两端的问题,数据输入端的问题包括数据采集手段的合规性、数据隐私合规性、IP侵权性、数据内容的合法性,中间是算法的公允性问题。数据输出阶段,核心问题是防止实质性替代、防止误导和偏见。面对大数据和AI时代,既往针对小数据集的监管思路不再完全有效,事先获得数据权人授权的规范逻辑在AI时代很难行得通。如何不错过发展的黄金期,在发展中解决问题避免抑制创新就非常关键。在监管框架方面,现行法律需要更加精准、可预测、可落地。同时,还需要一些与业务具有较高兼容性的技术方案或工具,用以解决技术阻碍。
肖尧表示,AI时代的数据安全问题与DT时代有很大不同,由于大模型更多需要专业化、高质量的知识性数据,而非用户的行为数据和个人信息,因此不会对过往针对个信、算法等方面的监管措施产生颠覆性影响。AI时代的数据安全问题主要聚焦在价值观对齐、内容合规、模型幻觉、模型被攻击导致的数据泄漏等方面,这些都与模型的安全能力高度相关。因此应更多依靠模型的安全能力来应对数据安全风险。当前,阿里集团通过在数据层面进行清洗和再构建、对风险数据进行过滤;在模型层面构建内生安全和外层护栏机制对攻击进行防范;在评测层面开展持续性的内外部动态评测,指导模型安全能力迭代,并在训练和生成环节开展知产保护和隐私保护措施,来确保全生命周期的安全。未来,建议建立一个产学研多方共治的机制,企业做好自身的安全策略和能力建设,向公众进行阐释和说明以提高公众参与,并为立法提供支撑。行政部门指导企业利用人工智能合规开展业务,将底线风险指明,并在争议性话题上,建立明确的法律规范。社会组织与企业、行政管理部门协同联动,积极制定行业标准,开展行业自律。最终实现治理效能的平衡性、治理主体的协调性、治理手段的灵活性的有机统一。
楚赟表示,从当前数据安全治理发展现状看,国家层面进展迅速,法律法规、标准体系纷纷建立起来,数据安全技术包括加密、脱敏、标记、隐私计算等也有很大进步,监管方面也多方开展数据安全专项检查行动,监管力度越来越强,数据安全产业开始发展起来。但是数据安全落地还存在难点,数据确权存在争议,数据安全治理的多部门协作也存在困难。一方面,数据合规的落地困难,合规标准、技术防护的基线要求无法明确,标准的落实在企业内部施行难度较大,另一方面,安全技术发展迅速,但在云环境、大数据环境下,原有技术的堆砌,无法解决新的数据安全问题,缺乏体系化的技术框架。建议从技术层面加强核心技术的研发和应用,例如隐私计算、匿名化等,在数据流通的全流程中进行安全防护,利用人工智能提升数据安全防护能力,如行为分析、数据安全风险防御,同时需要不同安全厂商的数据安全技术能力的互联互通,构建统一的数据安全管控平台,实现数据安全的集中管理和监控。协会可以通过更多组织厂商间技术拉通和交流,从整体上提升数据安全能力。并重视数据安全教育和培训,提升全社会数据安全意识和能力水平。此外,数据安全应急机制与国际合作机制也要发展起来,实现数据安全能力的综合提升。
刘影表示,从知识产权视角看,AI时代数据问题集中存在于著作权、专利权和反不正当竞争三个领域。著作权方面,存在独创性认定、作品权利归属、著作权侵权、以及国际管辖权等问题。专利权方面,需要关注AIGC辅助完成的技术方案是否具有可专利性,特别是作为大模型核心的算法以及参数的技术构造是否有可专利性。此外,还可能涉及反不正当竞争中的关键问题,例如是否需要将模型参数作为商业秘密加以保护,以及如何与反法修订草案中增设的商业数据专门条款相衔接。参考美国、日本等代表性国家,我国著作权权利限制改造需要考虑如何支持人工智能产业创新发展需求,同时避免大幅破坏对著作权人的的激励。
李勇表示,当前隐私计算、区块链等技术受到学术界和产业界的普遍关注。隐私计算与数据安全技术,正逐步从学术研究向产业实践应用落地,实现数据“可用不可见”与AI时代的各方权益都有吻合。同时,不能仅依靠技术治理数据安全问题,还要重视人的因素在数据安全中的重要影响。在数据多元共治生态构建思路方面,借鉴跨领域、跨行业的有益经验与策略,如思考以治水的思路,促进数据有序流动并引导数据发挥更大作用和价值。此外,以多方协作的方式确保数据健康、安全、有序流动。
闫怀志表示,人工智能的三驾马车包括算力、算法和数据,从数据安全管控的角度来看,AI算力基本上无法控制,算法本身可以实施人为控制但是可控程度受限,而数据的可控程度较高且重要性也越来越强。当前,我国数据安全的法律法规较为健全,相关标准规范对数据安全覆盖也比较全面,但针对AI背景下数据安全的相关约束尚处于起步阶段。同时,数据安全人才也有较大缺口,相关人才储备不足,培养力度不够,数据安全领域的新增职业也未能充分考虑AI应用背景。此外,跨境数据流动、隐私保护、算法黑箱领域也存在不少短板。总体来看,加强数据本身的安全治理和防护至关重要。应对AI技术企业做好监管,实现数据利用和安全保护的平衡,从数据源头展开治理,制定可行的政策促进数据安全基础要求的落实,在实现数据脱敏、匿名化等传统要求的基础上,重点发展差分隐私计算、多方安全计算等安全技术。同时,数据安全评估与应急处置机制也需要完善,要尝试构建多层次的监管平台实现数据安全的全面治理。
支振锋表示,要以从容的心态面对数据安全问题,我国数据安全领域的制度、规范、技术等都已建立了框架,对于风险认知也较以往更为清晰。目前看,AI应用未产生颠覆式的安全问题,再整体较好的框架的基础上,建议将争议问题讨论明确后,再形成具体规范。具体到数据安全问题,主要是认知和数据处理的问题,当前对数据问题的认知存诸多悖论,如既追求生活便利,又希望受到良好保护,因此首先要建立符合发展需求的认知。在法规政策和标准上,可以对个人隐私、个人信息、个人数据做好区分。重视脱敏和匿名化处理的重要性,并要禁止还原,确保数据与个人能实现分离。另外基于生物识别信息不可变、不可篡改的特性,也需要重点明确该类信息的监管问题。
李涓子表示,对数据安全治理中对数据处理在安全方面的处理的要求是不会改变的,建议构建数据安全治理的基础设施,不断完善对已有数据安全治理方面的能力并提供服务;另一方面随着AI技术发展考虑出现新的数据类型的治理,如AI生成的内容数据安全以及当前人工智能中工具调用中的安全问题。随着人工智能的发展,可针对新要素完善相应的法律法规,并在法律、治理以及技术上实现对齐。另外由于人工智能使用门槛的降低,基于用户数量的快速增长,应对互联网企业施加更高的个人隐私保护标准,对人工智能的应用伦理也需要加强,同时对国外开源模型的渗透做好防范。政府、企业、用户间要对齐思路,以数据使用的必要性作为数据安全发展和开发的核心,做到支持技术发展与数据安全并进。
会议认为,我国在数据安全治理领域发展迅速,在制度、规范、产业等方面均有良好进展,但需注意到其面对AI时代新的数据保护需求依然存在不足。AI时代下的数据安全保护要明确好新形势、新特征,并在与现有治理体系做好衔接的基础上开展保护工作。专家建议,政府应加快推动该领域下标准与政策的制定工作,持续推动各项治理规范的执行落地;同时,鼓励发展各项数据安全保护技术,落实基础安全技术的使用;未来,要尝试构建多方共治的治理机制,充分发挥社会各方的积极作用,实现AI产业的健康持续发展。
供稿:研究部
编辑:刘颂佳
审核:董 畅