(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221040172 9.4 (22)申请日 2022.04.18 (71)申请人 广东工业大 学 地址 510000 广东省广州市越秀区东 风东 路729号 (72)发明人 陈梓浩 曾碧 林镇涛  (74)专利代理 机构 佛山市君创知识产权代理事 务所(普通 合伙) 44675 专利代理师 张燕玲 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/383(2019.01) G06F 16/332(2019.01) G06F 16/335(2019.01) G06F 40/289(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 面向多任务联邦学习的文本匹配方法 (57)摘要 本发明公开了一种面向多任务联邦学习的 文本匹配方法, 包括: 在服务器以及各客户端上 构建bm25+esim模型; bm25算法用于对样本信息 库进行处理, 从样本信息库中召回相似度最高的 k条样本信息; 样本信息包括用户特征信息以及 对应的推荐信息; 需要推荐的目标用户所输入的 文本信息与召回的k条样本信息构成样本信息 对; esim模型用于对样本信息对进行处理, 输出 目标用户的用户特征信息在k条样 本信息中的分 类, 就得到了文本匹配结果; 该方法采用横向联 邦学习, 服务器通过基于多头注 意力机制的图神 经网络节 点选择方案选择部分客户端。 各客户端 使用k折交叉验证切分数据集, 训练后向服务器 发送参数; 服务器根据收到的全部参数, 更新自 身参数, 并发送给客户端。 权利要求书3页 说明书9页 附图4页 CN 114860927 A 2022.08.05 CN 114860927 A 1.一种面向多任务联邦学习的文本匹配方法, 其特 征在于, 包括以下步骤: 在服务器以及各客户端上构建由bm25算法以及esim模型构成的bm25+esim模型; 所述 bm25算法用于对样本信息库进 行处理, 从样 本信息库中召回相似度最高的k条样本信息; 所 述样本信息包括用户特征信息以及 对应的推荐信息; 需要推荐的目标用户所输入的文本信 息与召回的k条样本信息构成样 本信息对; 所述esim模型用于对样本信息对进 行处理, 输出 目标用户的用户特 征信息在k条样本信息中的分类, 就得到 了文本匹配结果; 服务器通过节点选择方案选择部分客户端, 发送最新的bm25+esim模型参数w作 为所选 择的客户端本地 的bm25+esim模型参数wi; 被服务器选择出的各客户端根据接收到的模型 参数wi, 训练本地模型esim, 计算出梯度gi, 利用梯度gi更新模型参数wi, 并计算本地数据集 的平均数据误差度davg, i; 各被选择出的客户端向服务器发送训练后的本地模型参数 和 平均数据误差度davg, i; 服务器根据收到的所有 本地模型参数更新自身参 数w; 服务器将自身 参数w发送给 各客户端, 各客户端利用参数w对本地模型参数进行 更新。 2.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 所述服务 器通过节点选择 方案选择部分客户端, 包括: 1.1将服务器自身的bm25+esim模型参数和客户端本地bm25+esim模型参数分别作为 和 计算权重系数eij: 其中a为注意力机制计算函数, 采用相似度函数; W表示注意力机制, 表示为esim模型提 取特征的转置矩阵; 1.2采用softmax函数重新计算权 重系数, 更新后的系数为aij, 计算公式为: 其中Ni为由全部客户端组成的集合, eik为第k个客户端的权重系数, softmaxj表示将 softmax函数应用于第j个客户端; 1.3引入多头机制, 通过多次训练得到多个矩阵W并计算多个系数aij, 通过以下公式的 计算得到的结果aij′, 即为客户端在多头注意力机制下的权 重系数: 其中K为使用注意力机制的数量, 为第j个客户端在第K个注意力机制中的权 重系数; 1.4设定一个权重系数阈值ThresholdMin, 仅当权重系数aij′不小于阈值ThresholdMin 时, 认为aij′对应的客户端具有参考价值, 则将该客户端作为服务器 通过节点选择方案选择 出的客户端。 3.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 所述客户 端上设置数据输入接口, 用于获取需要推荐的目标用户的文本信息; 本地数据集中的一条 样本信息包含A、 B两部 分, 其中: A是目标用户的输入的文本信息, 也就是目标用户的用户特权 利 要 求 书 1/3 页 2 CN 114860927 A 2征信息; B是用户特征信息经过esim模型的文本匹配, 找到匹配度最高的样本信息, 如果该 样本信息对应的推荐信息不被用户采纳或者匹配度达不到阈值, 则收集用户重新选择的信 息, 记录该用户重新选择的信息作为 新的推荐信息, 与A组成一条样本信息 。 4.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 所述计算 本地数据集的平均数据误差度davg, i, 包括: 客户端在被目标用户使用的过程中, 用户输入的文本信息与esim模型匹配出的目标不 符或达不到最小置信度时, 记录当前esim模型输出的置信度ConfidenceCurrent与预设的最 小置信度Co nfidenceMin的差值, 即数据误差度d: d=ConfidenceMin‑ConfidenceCurrent 在客户端每次收集到新的用户输入的文本信 息时, 统计当前已有本地数据的数据误差 度d, 得到第i个客户端的本地数据集的平均数据误差度davg: 其中, dj表示第j次的数据误差度, n表示 客户端上计算数据误差度的总次数。 5.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 客户端的 esim模型训练前, 将原始数据集与本地数据集构成样本信息库, 并对样本信息库进行预处 理操作; 原始数据集中的样本信息为经过生产厂家调研得出, 由样本用户的用户特征信息 与对应的推荐信息组成; 对样本信息库的样本信息进行混乱, 将混乱后的样本信息使用k折交叉验证划分为训 练集和测试集, 结合接收到的模型参数wi对客户端的esim模型进行训练, 并计算梯度gi; 当 模型未收敛时, 用梯度gi继续训练; 如已收敛, 得到训练后的模型参数 6.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 所述预处 理操作包括分词、 去掉停用词、 过 滤无效符号; 所述样本信息进行混乱采用random方法。 7.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 所述各被 选择出的客户端向服务器发送训练后的本地模型参数 和平均数据误差度davg, i; 服务器 根据收到的所有本地模型参数 更新自身参数w, 包括: 3.1计算第i个客户端对应的最终权 重系数pi, 计算公式为: 其中, n为服务器经过选择方案选择的客户端的数量; 3.2服务器利用客户端向服务器上传的参数 和平均数据误差度davg, i, 更新自身参数 w, 所采用的计算公式为: 其中, n为服务器经过选择方案选择的客户端的数量。 8.根据权利要求1所述的面向多任务联邦学习的文本匹配方法, 其特征在于, 样本信 息 对传入esim模型中以后, 通过Embedding层获得目标用户的用户特征信息的向量化表 示, 然 后使用BiLSTM获得用户特征信息的语义特征, 并保存此时隐藏状态的值; 利用权 利 要 求 书 2/3 页 3 CN 114860927 A 3

.PDF文档 专利 面向多任务联邦学习的文本匹配方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向多任务联邦学习的文本匹配方法 第 1 页 专利 面向多任务联邦学习的文本匹配方法 第 2 页 专利 面向多任务联邦学习的文本匹配方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:52:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。