GenAI正导致敏感数据大规模泄露

文章来源:信息化建设与管理中心发布时间:2025-10-15浏览次数:10

敏感数据无处不在,且增长迅速。Concentric AI发布的一份新报告强调了非结构化数据、重复文件以及高风险的共享行为如何给安全团队带来严重问题。研究结果显示,微软Copilot等GenAI工具增加了复杂性,而过度共享和数据管理不善等老问题仍持续造成数据泄露风险。

GenAI引发新担忧

2025年上半年,平均每个企业中Copilot访问的敏感数据记录接近300万条。研究人员还发现,每个企业中用户与Copilot的交互超过3000次,这意味着敏感数据在缺乏适当管控的情况下被修改或共享的可能性更大。

报告警告称,员工依赖未经授权工具的“影子GenAI”使用行为会带来进一步风险,因为企业甚至可能不知道其数据流向何处。

权限过多,泄露风险加剧

报告显示,过度共享仍是核心问题。数据经常被共享给无需访问权限的人员和系统。

在参与研究的所有企业中,平均每个企业外部共享的敏感数据记录达300万条,占所有共享文件的半数以上。金融服务公司外部共享敏感数据的比例最高,达73%。

其中,“任意人链接”带来的风险尤为突出,这种链接允许无需登录即可无限制访问。在医疗行业,通过此类链接共享的文件中有很大一部分包含敏感数据。在各行业中,以这种方式共享的许多文件也包含敏感信息。

内部共享同样存在风险。在许多企业中,公司内部广泛共享的文件中有相当一部分包含敏感数据。在零售和金融服务行业,与个人账户共享的大多数文件都包含敏感信息。

数据泛滥导致效率低下和风险增加

随着数据量的增长,数据杂乱问题也日益严重。研究人员发现,各企业平均拥有1000万条重复数据记录,政府和教育机构的重复率超过30%。

陈旧数据也是一个问题。在各行业中,企业平均拥有700万条陈旧数据记录,制造业的陈旧数据占比最高,约占总数据的四分之一。保留旧数据不仅会增加成本,还会加大风险管理难度。