(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210879263.9
(22)申请日 2022.07.25
(71)申请人 中国科学院信息 工程研究所
地址 100093 北京市海淀区闵庄路甲89号
(72)发明人 吴广君 艾正阳 亓子森 王勇
(74)专利代理 机构 北京君尚知识产权代理有限
公司 11200
专利代理师 司立彬
(51)Int.Cl.
G06N 20/20(2019.01)
G06F 16/9535(2019.01)
G06F 16/958(2019.01)
(54)发明名称
一种基于模型无关元学习的联邦推荐方法
及系统
(57)摘要
本发明公开了一种基于模型无关元学习的
联邦推荐方法及系统。 本方法为: 1)服务器选取
多个客户端, 并将所选推荐模型发送至每一客户
端; 2)各客户端将本地数据划分为支持集和查询
集; 3)各客户端基于本地支持集训练并更新收到
的推荐模型; 4)各客户端将更新后的推荐模型在
查询集上验证并计算模型梯度; 5)服务器收集各
客户端计算的梯度, 基于平均梯度更新推荐模型
并将其发送给各客户端进行下一轮次的训练; 6)
重复步骤3)~5)直到设定 条件, 各客户端得到一
公共的推荐模型; 7)每一客户端利用本地数据训
练该公共的推荐模型, 得到各自的个性化推荐模
型; 8)客户端m将目标应用场景中的交互数据输
入个性化推荐模型, 获取个性 化推荐结果。
权利要求书3页 说明书8页 附图2页
CN 115409203 A
2022.11.29
CN 115409203 A
1.一种基于模型 无关元学习的联邦推荐方法, 其 步骤包括:
1)服务器选取多个客户端, 并将所选推荐模型发送至每一所述 客户端;
2)各所述客户端将用于训练所述推荐模型的本地数据划分为支持集和查询集;
3)各所述客户端基于本地的支持集采用模型无关元学习方法训练并更新接收到的所
述推荐模型;
4)各所述客户端将更新后的推荐模型在查询集上进行验证并计算所述推荐模型的梯
度;
5)服务器收集各所述客户端计算的梯度并进行平均, 基于平均梯度 更新所述推荐模型
并将更新后的所述推荐模型发送给 各所述客户端进行下一轮次的训练;
6)重复步骤3)~5)直到设定条件, 各 所述客户端得到一公共的推荐模型;
7)每一所述客户端利用本地数据训练该公共的推荐模型, 得到各所述客户端的个性化
推荐模型;
8)客户端m将本地目标应用场景中的交互数据输入所述客户端m对应的所述个性化推
荐模型, 获取对应的个性化推荐结果; 所述客户端m为所述服务器选取的用户m对应的客户
端。
2.根据权利要求1所述的方法, 其特征在于, 步骤1)中, 所述服务器选择用户客户端集
合
的一个子集
然后将所述推荐 模型的模型参数
发送至子集
中的每一个客户端;
其中, 客户端m的本地模型参数
3.根据权利要求2所述的方法, 其特征在于, 客户端m将本地数据划分为支持集和查询
集的方法为:
21)将用户m的本地交互序列数据
划分为k个交互会话, 即
其
中, 对于第k个会话
代表用户m在时间步
所交
互的项目,
代表该会话的长度;
22)将该k个交互会话切分为互不相交的两部分, 得到支持集
以及查
询集
其中, (xi,yi)代表支持集中的第i个样本, xi表示一个交互会话a
中除最后一个项目的项目序列, yi表示该交互会话a中的最后一个项目; (x ′i,y′i)查询集中
的第i个样本, x ′i表示一个交互会话b中除最后一个项目的项目序列, y ′i表示该交互会话b
中的最后一个项目,
为支持集
中的样本总数,
为查询集
中的样本总数。
4.根据权利要求3所述的方法, 其特征在于, 采用模型无关元学习方法训练并更新接收
到的所述推荐模型的方法为:
31)所述推荐模型包括嵌入层和注意力层, 其中, 注意力层包括一注意力机制及两层前
馈神经网络; 所述推荐模型的模型参数包括嵌入层的参数θe和注意力层的参数θa; 其中, θe
={MI,P}, θa={WQ,WK,WV,W(1),W(2),b(1),b(2)}; MI为项目嵌入矩阵, P为可学习的位置矩阵,
WQ、 WK、 WV分别为自注 意力机制中查询、 键、 值对应的权重矩阵, W(1)为第一层前馈神经网络的
权重矩阵, b(1)为第一层前馈神经网络的偏 置向量, W(2)为第二层前馈神经网络的权重矩阵,
b(2)为第二层前馈神经网络的偏置向量;权 利 要 求 书 1/3 页
2
CN 115409203 A
232)对于支持集
中第i个样本中的xi, 首先将其转化为固定长度的序列, 然后将序列
中每一项目转化为独热编码向量后与 所述项目嵌入矩阵MI相乘, 得到xi对应的输入嵌入矩
阵I; 将可 学习的位置矩阵P与输入嵌入矩阵I结合得到嵌入层的输出E= I+P;
33)将矩阵E 输入注意力层的注意力机制, 得到用户m的兴趣表示S;
34)将兴趣表示S输入串联的两层前馈神经网络并采用Relu作为激活函数, 得到输出
FFN(S)=ReLU(SW(1)+b(1))W(2)+b(2);
35)将步骤34)所得结果FFN(S)经层归一化单元、 残差连接单元和dropout单元依次进
行处理, 得到用户兴趣表示S ′;
36)根据所得S ′预测用户m对项目i的偏好分数
其中,
是所述序列中项目i
对应的嵌入向量;
37)基于用户m对各项目的偏好分数对项目进行排序; 选取偏好分数最高的K个项目得
到一推荐项目列表; 根据推荐项目列表与训练数据中实际的项目列表, 计算交叉熵损失
38)基于交叉熵损失
计算梯度并更新本地推荐 模型, 得到将更新后的推荐 模型
5.根 据 权 利 要 求 4 所 述 的 方 法 ,其 特 征 在 于 ,所 述 交 叉 熵 损 失 为
其中, l是损失函数,
是客户端m当前的本地推
荐模型, (x,y)是支持集中一例训练样本 。
6.根据权利要求4所述的方法, 其特征在于, 步骤4)中, 计算所述推荐模型的梯度方法
为:
41)客户端m将查询集中的训练样本输入更新后的推荐模型
并计算得到交叉熵损失
42)基于交叉熵损失
计算梯度
7.一种基于模型无关元学习的联邦推荐系统, 其特征在于, 包括多个客户端和一服务
器; 其中,
所述客户端, 用于将训练推荐模型的本地数据划分为支持集和查询集, 然后基于本地
的支持集采用模型无关元学习方法训练并更新接收到的所述推荐模型; 将更新后的推荐模
型在查询集上进行验证并计算所述推荐模型的梯度;
所述服务器, 用于将所选推荐模型发送至每一所述客户端; 以及 收集各所述客户端计
算的梯度并进 行平均, 基于平均梯度更新所述推荐模型并将更新后的所述推荐模型发送 给
各所述客户端进行下一轮次的训练; 当达到设定条件时停止训练, 各所述客户端得到一公
共的推荐模型;
所述客户端利用本地数据训练该公共的推荐模型, 得到所述客户端对应的个性化推荐
模型; 以及将本地 目标应用场景中的交互数据输入对应的个性化推荐模型, 获取 的个性化权 利 要 求 书 2/3 页
3
CN 115409203 A
3
专利 一种基于模型无关元学习的联邦推荐方法及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:33:13上传分享