国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210295617.5 (22)申请日 2022.03.23 (71)申请人 网易 (杭州) 网络有限公司 地址 310056 浙江省杭州市滨江区长河街 道网商路59 9号4幢7层 (72)发明人 王冠颖 张林箭 张聪 范长杰 胡志鹏 (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 李弘 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/35(2020.01) G06K 9/62(2022.01) (54)发明名称 话题引导方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供一种话题引导方法、 装置、 电子 设备及存储介质。 该方法包括: 构建语义相关性 模型; 获取话题语料池和对话向量; 利用语义相 关性模型对话题 语料池编码以确定语料向量; 从 语料向量中确定与对话向量相似度最高的目标 语料向量; 确定对话向量和目标语料向量的相关 度是否大于或等于预设相关度阈值; 响应于对话 向量和目标语料向量的相关度大于或等于预设 相关度阈值, 根据目标语料向量生成引导回复语 料对话题进行引导。 避免了依赖话题图谱的构建 以及依赖实体词识别的问题, 降低了人工成本, 并且构建的语义相关性模型相比于基于词频进 行相关度的确定, 进一步提升了相关度确定的准 确性。 能够使得在正确理解用户话题语义的前提 下对用户话题进行引导。 权利要求书2页 说明书14页 附图6页 CN 114997173 A 2022.09.02 CN 114997173 A 1.一种话题引导方法, 其特 征在于, 包括: 构建语义相关性模型; 获取话题语料池和对话向量; 利用所述语义相关性模型对所述 话题语料池编码以确定语料向量; 从所述语料向量中确定与所述对话向量相似度最高的目标语料向量; 确定所述对话向量和所述目标语料向量的相关度是否大于或等于预设相关度阈值; 响应于所述对话向量和所述目标语料向量的相关度 大于或等于所述预设相关度阈值, 根据所述目标语料向量 生成引导回复语料对话题进行引导。 2.根据权利要求1所述的方法, 其特 征在于, 所述构建语义相关性模型, 包括: 构建话题和语料的信息对; 根据所述信息对构建语义相关性模型。 3.根据权利要求2所述的方法, 其特 征在于, 所述构建话题和语料的信息对, 包括: 获取问答文本数据; 其中, 所述问答文本数据包括: 问题文本、 答案文本和用于佐证所 述问题文本与所述 答案文本之间的匹配度的证据文本; 根据预设划分规则将所述问答文本数据划分为多个文本段落; 利用开源搜索框架在所述多个文本段落中确定与所述证据文本的相关度最高且满足 预设数量的目标文本段落; 根据所述问答文本数据和所述目标文本段落构建所述信息对。 4.根据权利要求3所述的方法, 其特征在于, 所述根据预设划分规则将所述问答文本数 据划分为多个文本段落, 包括: 以预设字符数为单位对所述问答文本进行划分, 得到多个文本段落。 5.根据权利要求4所述的方法, 其特征在于, 所述以预设字节数为单位对所述问答文本 进行划分, 得到多个文本段落, 包括: 以预设字符数为单位从所述问答文本的首个字符开始进行划分, 若划分得到的初始文 本段落的最后一个字符不是结尾字符, 则获取下一个字符, 并将获取 的字符加入所述初始 文本段落, 直到获取到结尾字符, 并将所述结尾字符加入所述初始文本段落, 得到文本段 落。 6.根据权利要求3所述的方法, 其特 征在于, 所述语料包括: 正样本语料和负 样本语料; 所述根据所述问答文本数据和所述目标文本段落构建所述信息对, 包括: 根据所述问题文本确定所述 话题; 根据所述目标文本段落中包 含所述答案文本的目标文本段落确定所述 正样本语料; 根据所述目标文本段落中不包 含所述答案文本的目标文本段落确定所述负 样本语料; 将所述话题和所述 正样本语料与所述负 样本语料分别配对以确定所述信息对。 7.根据权利要求2所述的方法, 其特征在于, 所述根据所述信息对构建语义相关性模 型, 包括: 获取基础模型, 所述话题的第一词向量和第一位置向量, 以及所述语料的第二词向量 和第二位置向量; 利用所述基础模型对所述第一词向量和第一 位置向量进行编码以确定话题段落向量; 利用所述基础模型对所述第二词向量和第二 位置向量进行编码以确定语料 段落向量;权 利 要 求 书 1/2 页 2 CN 114997173 A 2根据所述话题段落向量和所述预料段落向量的内积确定所述话题与所述语料的相似 度; 响应于所述相似度满足 目标值, 则基于双塔模型根据所述信 息对构建所述语义相关性 模型。 8.根据权利要求1所述的方法, 其特 征在于, 获取 所述对话向量, 包括: 响应于接收到用户话题, 获取用户的历史对话记录; 利用所述语义相关性模型对所述用户话题和所述历史对话记录编码以确定所述对话 向量。 9.根据权利要求1所述的方法, 其特征在于, 所述从所述语料向量中确定与 所述对话向 量相似度最高的目标语料向量, 还 包括: 将所述语料向量存 储于检索工具以建立在线索引; 将所述对话向量输入所述检索工具执行所述在线索引, 以确定与所述对话向量相似度 最高的所述目标语料向量。 10.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值, 确定不 对所述话题进行引导。 11.根据权利要求1所述的方法, 所述方法还 包括: 响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值, 根据 预 设引导回复语料对所述 话题进行引导。 12.一种话题引导装置, 其特 征在于, 包括: 构建模块, 被 配置为构建语义相关性模型; 获取模块, 被 配置为获取话题语料池和对话向量; 编码模块, 被配置为利用所述语义相关性模型对所述话题语料池编码以确定语料向 量; 第一确定模块, 被配置为从所述语料向量中确定与所述对话向量相似度最高的目标语 料向量; 第二确定模块, 被配置为确定所述对话向量和所述目标语料向量的相关度是否大于或 等于预设相关度阈值; 引导模块, 被配置为响应于所述对话向量和所述目标语料向量的相关度 大于或等于所 述预设相关度阈值, 根据所述目标语料向量 生成引导回复语料对话题进行引导。 13.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1至11任意一项 所述的方 法。 14.一种非暂态计算机可读存储介质, 所述非暂态计算机可读存储介质存储计算机指 令, 其特征在于, 所述计算机指令用于使所述计算机实现权利要求1至11任一项所述的方 法。权 利 要 求 书 2/2 页 3 CN 114997173 A 3
专利 话题引导方法、装置、电子设备及存储介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:52:26
上传分享
举报
下载
原文档
(937.3 KB)
分享
友情链接
GB-T 34095-2017 信息安全技术 用于电子支付的基于近距离无线通信的移动终端安全技术要求.pdf
DB12-T 1083-2021 公务用车平台运行管理规范 天津市.pdf
GB-T 14199-2010 电声学 助听器通用规范.pdf
2021年数据安全法律手册-完整版.pdf
数据供应链管理办法.pdf
ISO 17825-2016.pdf
GB-T 33092-2016 皮带运输机清扫器聚氨酯刮刀.pdf
GB-T 20004.2-2018 团体标准化 第2部分:良好行为评价指南.pdf
DB12-T 724.35-2021 安全生产等级评定技术规范 第35部分:医药制造企业 天津市.pdf
GB-T 20319-2017 风力发电机组 验收规范.pdf
DB51-T 2829-2021 暴雨洪涝灾害风险评估技术规范 四川省.pdf
MZ-T 120-2018 自立式辅助起床架.pdf
SN-T 4030-2014 香薰类化妆品急性吸入毒性试验.pdf
LLMs解决进攻性安全挑战的实证评估-2402.11814.pdf
DB61-T 1505-2021 数字化转型 企业新型能力识别技术规范 陕西省.pdf
DB12-T 564-2015 低温食品储运温控技术 天津市.pdf
T-GDTL 002—2018 建筑地坪涂装工程施工及验收规程.pdf
GB-T 7256.1-2022 民用机场助航灯具 第1部分:一般要求.pdf
DB31-T 1309-2021 数据中心节能改造技术规范 上海市.pdf
GB-T 41895-2022 细胞中DNA病毒测定 MNP标记法.pdf
1
/
3
23
评价文档
赞助2.5元 点击下载(937.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。