您现在的位置是:亿华云 > 应用开发
五分钟技术趣谈 | 隐私安全计算之联邦学习
亿华云2025-10-04 00:36:44【应用开发】8人已围观
简介Labs 导读人工智能时代兴起,数据资源成为维持相关产业的基础原料,是否能够获取相关海量数据能力成为制约产业发展重要因素。然而,由于数据安全问题、竞争关系等因素,数据在各个行业甚至公司的内部以“数据孤
Labs 导读
人工智能时代兴起,分钟数据资源成为维持相关产业的技术计算基础原料,是趣谈否能够获取相关海量数据能力成为制约产业发展重要因素。然而,隐私由于数据安全问题、安全竞争关系等因素,邦学数据在各个行业甚至公司的分钟内部以“数据孤岛”的形式存在,随着数据隐私安全问题突出,技术计算国家管控越来越严格,趣谈先后发布《网络安全法》等法律法规,隐私在社会层面上,安全用户对个人隐私数据越发重视。邦学以往科技巨头它们通过提供基于云的分钟AI解决方案以及API,获取大量高质量的技术计算业务和个人数据模式,在未来发展中可能受到极大的趣谈限制。为此,研究如何在保护隐私和安全的前提下,解决数据孤岛问题实现数据共享需求越来越突出,隐私计算受到极大重视,联邦学习应运而生。
作者:聂文静,单位:中国移动研究院业务研究所
近年来
「数据隐私」成为网络热词
在大数据时代,
数据的流通和共享
为社会发展创造了巨大价值
但被泄露的个人隐私不在少数,
人们对企业的亿华云信任日益走低
......
那么有没有一种技术,
在安全合规、保障用户隐私的前提下,
让企业“看不见”数据,
也能利用数据创造价值、提供高效服务呢?
鱼和熊掌能否兼得?
隐私计算或许是一个答案
本期Labs和大家聊聊
隐私计算中联邦学习的那些事儿~
Part 01隐私计算技术概念
隐私计算涉及多方技术主要包括机器学习,分布式机器学习,密码学(同态加密,差分隐私等),安全多方计算,以及联邦学习等多种不同的技术。
机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
分布式机器学习是一个由参数服务器将数据存储在分布式工作节点上,通过中央调度节点分配数据和计算资源的机器学习框架,云南idc服务商较集中式机器学习框架运算效率提高,更加适合大批数据建模。
多方安全计算是一个满足没有信任第三方情况下,互不信任参与方在保护各自隐私信息前提下协同建模的机器学习框架。这个框架能够同时确保输入的隐私性安全性和计算的正确性。
同态加密是一类具有特殊属性的加密方法,与一般加密算法相比,同态加密除了能实现基本的加密操作之外,还能实现密文间的多种计算功能,即先计算后解密可等价于先解密后计算。
差分隐私是密码学中的一种手段,简单地说,就是通过添加噪音在保留统计学特征的前提下去除个体特征以保护用户隐私。
联邦学习,又名联邦机器学习,联合学习,联盟学习,由谷歌公司于2016 年最先提出,最初是用于解决安卓手机终端用户在本地更新输入法中的频繁词模型的服务器托管问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习.主要解决的问题就是,数据拥有方不出本地前提下,构建共有模型。联邦学习可以从技术上解决数据孤岛问题,让每一个参与方隐私数据在不用交换原始数据情况下,仅仅交换加密的模型参数,完成模型的建立的一种框架。联邦学习可使用的机器学习算法包括逻辑回归、神经网络、随机森林等,有望成为下一代人工智能协同算法和协作网络的基础。
隐私计算相关技术之间的关系可参见如下示意图:
Part 02 联邦学习技术特征与分类
- 技术特征
各方数据都保留在本地,不泄露隐私也不违反法规; 在联邦学习的体系下,各个参与者的身份和地位相同; 联邦学习的建模效果和将整个数据集放在一处建模的效果相同,或相差不大; 各个参与者联合数据建立虚拟的共有模型,并且共同获益的体系。- 技术分类
1. 横向联邦各方业务场景相似,用户重合度低,特征重合度高
各方特征重合度较低,用户重合度较高
各方特征重合度较低,用户重合度较低
Part 03联邦学习技术应用场景
根据联邦学习的应用领域及面向服务的受众对象,可将联邦学习的典型应用场景分为:面向个人用户(2C)、面向行业用户(2B)。
面向个人用户主要是基于个人终端隐私数据保护情况下的数据共享和协同的应用场景,比如Google输入法所采用的分布式建模应用。
面向行业用户主要是围绕企业内部以及跨公司跨行业的数据联合建模应用场景。
【本文为专栏作者“移动Labs”原创稿件,转载请联系原作者】
戳这里,看该作者更多好文
很赞哦!(5)
相关文章
- 前面这两个步骤都是在本机完成的。到这里还没有涉及真正的域名解析服务器,如果在本机中仍然无法完成域名的解析,就会真正请求域名服务器来解析这个域名了。
- Java实现四种微信抢红包算法,拿走不谢
- 类静态初始化块即将纳入ES2022,我们先一睹为快
- 2021 Google 开发者大会丨构建高效机器学习生态
- 四、长串数字域名
- 域名所有人在哪查询?小聚教你快速联系域名所有人
- MySQL 8.0不讲武德,给我挖坑!
- 被数据库读写分离坑了,数据不一致怎么解(含5种解法)
- 为了避免将来给我们的个人站长带来的麻烦,在选择域名后缀时,我们的站长最好省略不稳定的后缀域名,比如n,因为我们不知道策略什么时候会改变,更不用说我们将来是否还能控制这个域名了。因此,如果站长不是企业,或者有选择的话,如果不能选择域名的cn类,最好不要选择它。
- Sentry 监控 - Snuba 数据中台架构(编写和测试 Snuba 查询)