第5章
纵向联邦线性回归算法

线性回归是机器学习中最基本的模型之一,它是很多问题的重要分析工具,在诸多场景中都有广泛的应用。例如,在金融风控场景下,线性回归常被用来预测贷款用户的信用程度;在互联网广告业务中,常常被用来预测广告点击率;在医疗场景中,则常常被用来预测疾病。在联邦学习中,线性回归同样占有重要的地位,因此我们有必要对联邦线性回归模型加以探讨。

在Qiang Yang等人的论文中,作者将联邦学习模型按照数据重叠形式分成了三类,分别是横向联邦学习、纵向联邦学习和联邦迁移学习。横向联邦学习模型针对特征一致但ID不一致的数据;纵向联邦学习模型针对ID一致但特征不一致的数据;联邦迁移学习模型则针对特征和ID都不一致的数据。在本章的讨论中,我们沿用了这一分类方式。得益于线性模型的可加性,横向线性回归较为简单,我们不重点讨论,主要关注纵向联邦的情况,并介绍由Qiang Yang等人提出的一种联邦线性回归算法。

基于实际情况和纵向联邦线性回归算法,我们提出了全新的纵向联邦多视角线性回归算法。通过从多个视角对对象进行建模,并联合优化所有函数,这种方法往往能够更准确地挖掘不同子空间中数据间的相关性,提高模型效果。由于本章涉及较多符号,因此在此统一列出了本章所用到的符号,见表5-1。

表5-1 符号表