|
面向可信AI的高质量数据要素底座44次阅读 2025-12-08
现状:
企业内外部数据源分散,格式不一,缺乏统一的标准与治理体系,数据整合与清洗成本极高。 需解决问题: 如何自动识别并修复数据中的脏数据、标注噪声和分布偏差,并建立量化的质量评估指标体系。如何在保障数据隐私的前提下进行高效的数据利用,解决包括联邦学习、差分隐私、数据脱敏在内的隐私计算技术与数据平台的深度融合。 达到的指标: 支持主流隐私计算技术(如联邦学习、同态加密),在隐私保护条件下,模型效能损失不超过5%。内置不少于5种数据偏见自动检测算法,覆盖常见的敏感属性。
企业信息
|