国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210398108.5 (22)申请日 2022.04.13 (71)申请人 广州欢聚时代信息科技有限公司 地址 511442 广东省广州市番禺区南村镇 万达广场B-1栋24层 (72)发明人 黄丕帅 (74)专利代理 机构 广州利能知识产权代理事务 所(普通合伙) 44673 专利代理师 王增鑫 (51)Int.Cl. G06F 40/289(2020.01) G06F 40/237(2020.01) G06F 40/30(2020.01) G06Q 30/06(2012.01) G06F 16/33(2019.01) (54)发明名称 产品词处 理方法及其装置、 设备、 介质、 产品 (57)摘要 本申请公开一种产品词处理方法及其装置、 设备、 介质、 产品, 所述方法包括: 将商品标题进 行分词处理, 获得有序的多个分词, 构成分词序 列; 计算各个 分词的语义特征向量与所述商品标 题的语义特征向量之间的数据距离, 相应作为各 个分词的相似分值; 根据命中预设产品词典中的 词元的分词在所述分词序列中的排序信息, 量化 确定其排序分值; 将综合分值最高的分词输出为 所述商品标题的产品词, 所述 综合分值为其相应 的分词的相似分值与排序分值之和。 本申请能够 便捷、 高效、 准确地从给定的商品标题中确定其 相应的产品词, 为电商平台服务于其独立站点的 商品搜索、 商品广告投放、 商品归集等下游任务 提供基础服 务, 从而提升电商平台的服 务体验。 权利要求书2页 说明书15页 附图5页 CN 114662492 A 2022.06.24 CN 114662492 A 1.一种产品词处 理方法, 其特 征在于, 包括如下步骤: 将商品标题进行分词处 理, 获得有序的多个分词, 构成分词序列; 计算各个分词的语义特征向量与 所述商品标题的语义特征向量之间的数据距离, 相应 作为各个分词的相似分值; 根据命中预设产品词典中的词元的分词在所述分词序列中的排序信 息, 量化确定其排 序分值; 将综合分值最高的分词输出为所述商 品标题的产品词, 所述综合分值为其相应的分词 的相似分值与排序分值之和。 2.根据权利要求1所述的产品词处理方法, 其特征在于, 将商品标题进行分词处理, 获 得多个分词, 构成分词序列, 包括如下步骤: 获取用户提交的商品标题; 采用预设的分词算法对该商品标题进行分词, 获得多个分词; 按照所述多个分词在所述商品标题中的顺序, 将所述多个分词构造为分词序列, 通过 所述分词在所述分词序列中的排序值表征其 排序信息 。 3.根据权利要求1所述的产品词处理方法, 其特征在于, 计算各个分词的语义特征向量 与所述商品标题的语义特征向量之间的数据距离, 相 应作为各个分词的相似分值, 包括如 下步骤: 分别对所述各个分词及所述商 品标题进行词嵌入, 获得各个分词及所述商 品标题相应 的嵌入向量; 采用已训练至收敛状态的文本特征提取模型分别对所述各个分词及所述商品标题相 应的嵌入向量进行表示学习, 获得相应的语义特 征向量; 计算每个分词的语义特征向量与 所述商品标题的语义特征向量之间的数据距离, 将该 数据距离作为该分词的相似分值。 4.根据权利要求1所述的产品词处理方法, 其特征在于, 根据命中预设产品词典中的词 元的分词在所述分词序列中的排序信息, 量 化确定其 排序分值, 包括如下步骤: 根据所述商品标题的语义特 征向量确定该商品标题相对应的商品分类; 针对每个分词, 检测其是否包含对应该商品分类预设的产品词典中的至少一个词元, 当包含该词元时, 确定该分词为命中该产品词典中的词元的可选分词; 确定所述可选分词在所述分词序列中的排序值, 将该排序值关联预设权重设置为该可 选分词相对应的排序分值。 5.根据权利要求1所述的产品词处理方法, 其特征在于, 将综合分值最高的分词输出为 所述商品标题的产品词, 包括如下步骤: 计算每个命中所述产品词典的词元的分词的相似分值和排序分值的和值, 获得该分词 的综合分值; 根据所述综合分值对命中所述产品词典的各个分词进行倒 排序, 确定其中首个分词为 所述商品标题的产品词; 输出所述的产品词。 6.根据权利要求1至5中任意一项所述的产品词处理方法, 其特征在于, 根据命中预设 产品词典中的词元的分词在所述分词序列中的排序信息的步骤之前, 包括如下步骤:权 利 要 求 书 1/2 页 2 CN 114662492 A 2从对应各个商品分类预采集的产品词中抽取出多个词元, 将其存储构造相应的商品分 类的产品词典。 7.根据权利要求1至5中任意一项所述的产品词处理方法, 其特征在于, 将综合分值最 高的分词输出为所述商品标题的产品词的步骤之后, 还 包括如下步骤: 根据所述商 品标题的产品词, 从商品数据库中检索产品词与之相一致或语义相似的目 标商品; 将所述目标商品的商品信息推送至提交所述商品标题的终端设备。 8.一种产品词处 理装置, 其特 征在于, 包括: 分词处理模块, 用于将商品标题进行分词处 理, 获得有序的多个分词, 构成分词序列; 相似分值模块, 用于计算各个分词的语义特征向量与 所述商品标题的语义特征向量之 间的数据距离, 相应作为各个分词的相似分值; 排序分值模块, 用于根据命中预设产品词典中的词元的分词在所述分词序列中的排序 信息, 量化确定其 排序分值; 用词确定模块, 用于将综合分值最高的分词输出为所述商品标题的产品词, 所述综合 分值为其相应的分词的相似分值与排序分值之和。 9.一种计算机设备, 包括中央处理器和存储器, 其特征在于, 所述中央处理器用于调用 运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的 步骤。 10.一种计算机可读存储介质, 其特征在于, 其以计算机可读指令的形式存储有依据权 利要求1至7中任意一项 所述的方法所实现的计算机程序, 该计算机程序被计算机调用运行 时, 执行相应的方法所包括的步骤。权 利 要 求 书 2/2 页 3 CN 114662492 A 3
专利 产品词处理方法及其装置、设备、介质、产品
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:48:01
上传分享
举报
下载
原文档
(910.1 KB)
分享
友情链接
GB/T 31458-2015 医院安全技术防范系统要求.pdf
T-CSAE 259—2022 车载视觉信息汉字显示规范.pdf
易观分析 AIGC产业研究报告2023——语言生成篇pdf.pdf
T-ZZB 1495—2019 便利贴.pdf
华为AI盘古大模型研究框架.pdf
GB/T 5824-2021 建筑门窗洞口尺寸系列.pdf
WS 436-2013 医院二次供水运行管理.pdf
GB/T 40212-2021 工业机器人云服务平台分类及参考体系结构.pdf
GB-T 34653-2017 全断面隧道掘进机 单护盾岩石隧道掘进机.pdf
GB-T 42835-2023 半导体集成电路 片上系统 SoC.pdf
T-CFA 03110323—2022 铸件加工单元数字化技术要求.pdf
T-GXJNJP 002—2022 广西节能降碳技术创新奖 评选办法.pdf
GB-T 18781-2023 珍珠分级.pdf
GB-T 21294-2024 服装理化性能的检验方法.pdf
GB-T 15878-2015 半导体集成电路 小外形封装引线框架规范.pdf
GB-T 34709-2017 硅胶通用试验方法.pdf
GB-T 13797-2023 医用X射线管通用技术条件.pdf
GB-T 29246-2023 信息安全技术 信息安全管理体系 概述和词汇 ISO 27000-2018.pdf
DB11-T 2046.2-2022 智慧停车系统技术要求 第2部分:停车场(库)外场设备 北京市.pdf
alienvault 业内人士指南之应急响应 insiders guide incident response 英文版.pdf
1
/
3
23
评价文档
赞助2.5元 点击下载(910.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。