专利一种基于模型无关元学习的联邦推荐方法及系统 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210879263.9 (22)申请日 2022.07.25 (71)申请人中国科学院信息工程研究所地址 100093 北京市海淀区闵庄路甲89号 (72)发明人吴广君　艾正阳　亓子森　王勇　 (74)专利代理机构北京君尚知识产权代理有限公司 11200 专利代理师司立彬 (51)Int.Cl. G06N 20/20(2019.01) G06F 16/9535(2019.01) G06F 16/958(2019.01) (54)发明名称一种基于模型无关元学习的联邦推荐方法及系统 (57)摘要本发明公开了一种基于模型无关元学习的联邦推荐方法及系统。本方法为： 1)服务器选取多个客户端，并将所选推荐模型发送至每一客户端； 2)各客户端将本地数据划分为支持集和查询集； 3)各客户端基于本地支持集训练并更新收到的推荐模型； 4)各客户端将更新后的推荐模型在查询集上验证并计算模型梯度； 5)服务器收集各客户端计算的梯度，基于平均梯度更新推荐模型并将其发送给各客户端进行下一轮次的训练； 6) 重复步骤3)～5)直到设定条件，各客户端得到一公共的推荐模型； 7)每一客户端利用本地数据训练该公共的推荐模型，得到各自的个性化推荐模型； 8)客户端m将目标应用场景中的交互数据输入个性化推荐模型，获取个性化推荐结果。权利要求书3页说明书8页附图2页 CN 115409203 A 2022.11.29 CN 115409203 A 1.一种基于模型无关元学习的联邦推荐方法，其步骤包括： 1)服务器选取多个客户端，并将所选推荐模型发送至每一所述客户端； 2)各所述客户端将用于训练所述推荐模型的本地数据划分为支持集和查询集； 3)各所述客户端基于本地的支持集采用模型无关元学习方法训练并更新接收到的所述推荐模型； 4)各所述客户端将更新后的推荐模型在查询集上进行验证并计算所述推荐模型的梯度； 5)服务器收集各所述客户端计算的梯度并进行平均，基于平均梯度更新所述推荐模型并将更新后的所述推荐模型发送给各所述客户端进行下一轮次的训练； 6)重复步骤3)～5)直到设定条件，各所述客户端得到一公共的推荐模型； 7)每一所述客户端利用本地数据训练该公共的推荐模型，得到各所述客户端的个性化推荐模型； 8)客户端m将本地目标应用场景中的交互数据输入所述客户端m对应的所述个性化推荐模型，获取对应的个性化推荐结果；所述客户端m为所述服务器选取的用户m对应的客户端。 2.根据权利要求1所述的方法，其特征在于，步骤1)中，所述服务器选择用户客户端集合的一个子集然后将所述推荐模型的模型参数发送至子集中的每一个客户端；其中，客户端m的本地模型参数 3.根据权利要求2所述的方法，其特征在于，客户端m将本地数据划分为支持集和查询集的方法为： 21)将用户m的本地交互序列数据划分为k个交互会话，即其中，对于第k个会话代表用户m在时间步所交互的项目，代表该会话的长度； 22)将该k个交互会话切分为互不相交的两部分，得到支持集以及查询集其中， (xi,yi)代表支持集中的第i个样本， xi表示一个交互会话a 中除最后一个项目的项目序列， yi表示该交互会话a中的最后一个项目； (x ′i,y′i)查询集中的第i个样本， x ′i表示一个交互会话b中除最后一个项目的项目序列， y ′i表示该交互会话b 中的最后一个项目，为支持集中的样本总数，为查询集中的样本总数。 4.根据权利要求3所述的方法，其特征在于，采用模型无关元学习方法训练并更新接收到的所述推荐模型的方法为： 31)所述推荐模型包括嵌入层和注意力层，其中，注意力层包括一注意力机制及两层前馈神经网络；所述推荐模型的模型参数包括嵌入层的参数θe和注意力层的参数θa；其中， θe ＝{MI,P}， θa＝{WQ,WK,WV,W(1),W(2),b(1),b(2)}； MI为项目嵌入矩阵， P为可学习的位置矩阵， WQ、 WK、 WV分别为自注意力机制中查询、键、值对应的权重矩阵， W(1)为第一层前馈神经网络的权重矩阵， b(1)为第一层前馈神经网络的偏置向量， W(2)为第二层前馈神经网络的权重矩阵， b(2)为第二层前馈神经网络的偏置向量；权　利　要　求　书 1/3 页 2 CN 115409203 A 232)对于支持集中第i个样本中的xi，首先将其转化为固定长度的序列，然后将序列中每一项目转化为独热编码向量后与所述项目嵌入矩阵MI相乘，得到xi对应的输入嵌入矩阵I；将可学习的位置矩阵P与输入嵌入矩阵I结合得到嵌入层的输出E＝ I+P； 33)将矩阵E 输入注意力层的注意力机制，得到用户m的兴趣表示S； 34)将兴趣表示S输入串联的两层前馈神经网络并采用Relu作为激活函数，得到输出 FFN(S)＝ReLU(SW(1)+b(1))W(2)+b(2)； 35)将步骤34)所得结果FFN(S)经层归一化单元、残差连接单元和dropout单元依次进行处理，得到用户兴趣表示S ′； 36)根据所得S ′预测用户m对项目i的偏好分数其中，是所述序列中项目i 对应的嵌入向量； 37)基于用户m对各项目的偏好分数对项目进行排序；选取偏好分数最高的K个项目得到一推荐项目列表；根据推荐项目列表与训练数据中实际的项目列表，计算交叉熵损失 38)基于交叉熵损失计算梯度并更新本地推荐模型，得到将更新后的推荐模型 5.根据权利要求 4 所述的方法，其特征在于，所述交叉熵损失为其中， l是损失函数，是客户端m当前的本地推荐模型， (x,y)是支持集中一例训练样本。 6.根据权利要求4所述的方法，其特征在于，步骤4)中，计算所述推荐模型的梯度方法为： 41)客户端m将查询集中的训练样本输入更新后的推荐模型并计算得到交叉熵损失 42)基于交叉熵损失计算梯度 7.一种基于模型无关元学习的联邦推荐系统，其特征在于，包括多个客户端和一服务器；其中，所述客户端，用于将训练推荐模型的本地数据划分为支持集和查询集，然后基于本地的支持集采用模型无关元学习方法训练并更新接收到的所述推荐模型；将更新后的推荐模型在查询集上进行验证并计算所述推荐模型的梯度；所述服务器，用于将所选推荐模型发送至每一所述客户端；以及收集各所述客户端计算的梯度并进行平均，基于平均梯度更新所述推荐模型并将更新后的所述推荐模型发送给各所述客户端进行下一轮次的训练；当达到设定条件时停止训练，各所述客户端得到一公共的推荐模型；所述客户端利用本地数据训练该公共的推荐模型，得到所述客户端对应的个性化推荐模型；以及将本地目标应用场景中的交互数据输入对应的个性化推荐模型，获取的个性化权　利　要　求　书 2/3 页 3 CN 115409203 A 3

专利 一种基于模型无关元学习的联邦推荐方法及系统

专利一种基于模型无关元学习的联邦推荐方法及系统