国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210196121.2 (22)申请日 2022.03.01 (71)申请人 阿里巴巴 (中国) 有限公司 地址 310051 浙江省杭州市滨江区长河街 道网商路69 9号4号楼5楼5 08室 (72)发明人 蒋勇 张月 李辰 王涛 黄忠强 谢朋峻 (74)专利代理 机构 北京合智同创知识产权代理 有限公司 1 1545 专利代理师 李杰 张美洁 (51)Int.Cl. G06F 16/903(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 调整方法、 搜索方法、 电子设备、 存储介质及 程序产品 (57)摘要 本申请实施例提供了一种调整 方法、 搜索方 法、 电子设备、 存储介质及程序产品, 语言模型的 调整方法, 包括: 获得多个样本数据, 样本 数据包 括多个样 本字符串、 每个样本字符串对应的多个 样本命名实体、 每个样本命名实体对应的匹配标 记, 匹配标记用于标识样本搜索字符串与命名实 体的匹配结果; 通过预训练的语言模型, 将若干 个样本命名实体与对应的样本字符串进行语义 匹配, 得到若干个样本命名实体分别 与样本字 符 串的预测语义匹配结果; 根据多个样本命名实体 各自的预测语义匹配结果 以及匹配标记表征的 匹配结果之间的差异, 调整预训练的语言模型。 权利要求书2页 说明书10页 附图5页 CN 114595364 A 2022.06.07 CN 114595364 A 1.一种语言模型的调整方法, 包括: 获得多个样本数据, 所述样本数据包括多个样本字符串、 每个所述样本字符串对应的 多个样本命名实体、 每个样本命名实体对应的匹配标记, 所述匹配标记用于标识所述样本 搜索字符串与所述命名实体的匹配结果; 通过预训练的语言模型, 将若干个样本命名实体与对应的所述样本字符串进行语义匹 配, 得到若干个所述样本命名实体分别与所述样本 字符串的预测语义匹配结果; 根据多个样本命名实体各自的预测语义匹配结果以及所述匹配标记表征的匹配结果 之间的差异, 调整 预训练的所述语言模 型, 其中, 所述语言模 型用于将若干个候选命名实体 与搜索字符串进 行语义匹配, 得到若干个所述候选命名实体分别与所述搜索字符串的语义 匹配结果, 以根据语义匹配结果得到所述搜索字符串对应的目标命名实体, 所述候选命名 实体通过对搜索字符串的历史搜索结果进行命名实体识别得到 。 2.根据权利要求1所述的方法, 其中, 所述通过预训练的语言模型, 将若干个样本命名 实体与对应的所述样本字符串进 行语义匹配, 得到若干个所述样本命名实体分别与所述样 本字符串的预测语义匹配结果, 包括: 将所述多个样本命名实体分别与 各自对应的样本搜索字符串进行拼接, 将拼接结果输 入至语言模型 的语言模型主体部分, 通过所述语言模型主体部分进行语义匹配, 输出对应 的预测匹配向量; 通过与所述语言模型的输出层部分, 根据 所述预测匹配向量确定多个样本命名实体各 自的预测匹配分数, 作为所述预测语义匹配结果。 3.一种搜索方法, 包括: 接收搜索字符串, 并将所述搜索字符串与搜索历史进行匹配, 获得与搜索字符串对应 的历史搜索结果; 对所述历史搜索结果进行命名实体识别, 获得若干个候选命名实体; 通过语言模型, 将所述若干个候选命名实体与所述搜索字符串进行语义匹配, 得到若 干个所述 候选命名实体分别与所述搜索字符串的语义匹配结果; 根据所述语义匹配结果, 从所述若干个候选命名实体中确定出与所述搜索字符串 匹配 的目标命名实体; 执行所述目标命名实体与所述搜索字符串对应的搜索操作。 4.根据权利要求3所述的方法, 其中, 所述将所述搜索字符串与搜索历史进行匹配, 获 得与搜索字符串对应的历史搜索结果, 包括: 获得所述搜索历史, 所述搜索历史中包括历史搜索字符串以及与历史搜索字符串对应 的历史搜索结果; 将所述搜索字符串与 所述历史搜索字符串 匹配, 将与 所述搜索字符串 匹配的历史搜索 字符串对应的历史搜索结果, 作为与所述搜索字符串匹配的历史搜索结果。 5.根据权利要求4所述的方法, 其中, 所述搜索字符串匹配的历史搜索结果为已被展示 给搜索用户的搜索结果。 6.根据权利要求3所述的方法, 其中, 与搜索字符串匹配的历史搜索结果包括多个, 则 所述对所述历史搜索结果进行命名实体识别, 获得若干个候选命名实体, 包括: 对多个所述历史搜索结果的标题分别进行命名实体识别, 获得多个所述历史搜索结果权 利 要 求 书 1/2 页 2 CN 114595364 A 2分别对应的命名实体; 将多个所述历史搜索结果对应的命名实体进行去重, 获得若干个候选命名实体。 7.根据权利要求1所述的方法, 其中, 所述语言模型包括语言模型主体部分以及输出层 部分, 所述通过语言模型, 将所述若干个候选命名实体与所述搜索字符串进行语义匹配, 得 到若干个所述 候选命名实体分别与所述搜索字符串的语义匹配结果, 包括: 将所述若干个候选命名实体分别与所述搜索字符串 进行拼接, 获得若干个输入数据; 将若干个所述输入数据分别 输入至所述语言模型主体部分, 通过所述语言模型主体部 分进行所述候选命名实体与所述搜索字符串的语义匹配, 输出对应的匹配向量; 通过所述输出层部分将所述匹配向量转换为匹配分数并进行输出, 以得到与 所述输入 数据对应的匹配分数。 8.一种电子设备, 包括: 处理器、 通信接口、 存储器、 以及通信总线, 其中: 处理器、 通信 接口、 以及存 储器通过通信总线完成相互间的通信; 处理器, 用于执行程序, 具体可以执行如权利要求1或2所述的语言模型的调整方法或 者3‑7中任一所述的搜索方法对应的操作。 9.一种计算机存储介质, 其上存储有计算机程序, 该程序被处理器执行时实现如权利 要求1或2所述的语言模型的调整方法或者3 ‑7中任一所述的搜索方法。 10.一种计算机程序产品, 包括计算机指令, 所述计算机指令指示计算设备执行如权利 要求1或2所述的语言模型的调整方法或者3 ‑7中任一所述的搜索方法对应的操作。权 利 要 求 书 2/2 页 3 CN 114595364 A 3
专利 调整方法、搜索方法、电子设备、存储介质及程序产品
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:52:37
上传分享
举报
下载
原文档
(705.9 KB)
分享
友情链接
DB23-T 3104—2022 油田含油污泥处置与利用污染控制要求 黑龙江省.pdf
DB32-T 3840-2020 水利风景区评价规范 江苏省.pdf
GB-T 33764-2017 独立光伏系统验收规范.pdf
T-ZWCHEMA 001—2023 水利水电工程全过程工程咨询服务规程.pdf
GB-T 24369.3-2017 金纳米棒表征 第3部分:表面电荷密度测量方法.pdf
电子认证服务密码管理办法.pdf
信通院 2023大模型落地应用案例集 --大模型测试验证与协同创新中心-2023.pdf
GB-T 20011-2005 信息安全技术 路由器安全评估准则.pdf
GB-T 34658-2017 电动汽车非车载传导式充电机与电池管理系统之间的通信协议一致性测试.pdf
GB-T 26471-2023 塔式起重机 安装、拆卸与爬升规则.pdf
GM-T 0033-2023 时间戳接口规范.pdf
T-CSZFC 1—2022 慈善组织食品捐赠规范.pdf
GB-T 38548.5-2020 内容资源数字化加工 第5部分:质量控制.pdf
GB T 17902.1-2023 信息技术 安全技术 带附录的数字签名 第1部分:概述.pdf
T-CAQI 157—2020 检验检测机构合规性评价指南.pdf
GB-T 43572-2023 区块链和分布式记账技术 术语.pdf
NY-T 395-2012 农田土壤环境质量监测技术规范.pdf
T-XLTDA 005—2021 地方特色乳制品 风味奶酪.pdf
GB 7000.204-2008 灯具 第2-4部分:特殊要求 可移式通用灯具.pdf
T-CSBT 002—2019 血液筛查反应性献血者归队指南.pdf
1
/
3
18
评价文档
赞助2.5元 点击下载(705.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。