国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210251484.1 (22)申请日 2022.03.15 (71)申请人 浪潮软件科技有限公司 地址 250100 山东省济南市高新区浪潮路 1036号浪潮科技园 (72)发明人 王宗增 杨培强 程林 (74)专利代理 机构 济南信达专利事务所有限公 司 37100 专利代理师 姜丽洁 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/08(2006.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 一种商品名称分类的模型构建方法及装置 (57)摘要 本发明涉及网络模型领域, 具体提供了一种 商品名称分类的模型构建方法, 具有如下步骤: S1、 开源Wikipedia和Books Corpus语料收集, 税 务商品名称语料收集; S2、 对开源Wikipedia和 BooksCorpus语 料进行数据集操作; S3、 引入BERT 网络进行并进行模块化编程; S4、 组合各编程模 块, 构建完整End ‑to‑End的流水线; S5、 使用预处 理后的开源数据, 对调整后的网络进行预训练; S6、 对网络进行微调, 得到最终的税务领域商品 名称分类迁移学习的模型。 与现有技术相比, 本 发明的一种商品名称分类的模型构建方法, 能够 实现税务商品名称分类, 具有良好的推广价 值。 权利要求书2页 说明书5页 附图3页 CN 114580560 A 2022.06.03 CN 114580560 A 1.一种商品名称分类的模型构建方法, 其特 征在于, 具有如下步骤: S1、 开源W ikipedia和Bo oks Corpus语料收集, 税务商品名称语料收集; S2、 对开源W ikipedia和Bo oks Corpus语料进行 数据集操作; S3、 引入BERT网络进行并进行模块 化编程; S4、 组合各编程模块, 构建完整End ‑to‑End的流水线; S5、 使用预处 理后的开源数据, 对调整后的网络进行 预训练; S6、 对网络进行微调, 得到最终的税务领域商品名称分类迁移学习的模型。 2.根据权利要求1所述的一种商品名称分类的模型构建方法, 其特征在于, 在步骤S2 中, 依据预训练的单句预测、 句子对预测、 SQuAD、 Cloze、 结构化预测序列标注CWS共5类任 务, 对开源W ikipedia和Bo oks Corpus语料进行分词、 词嵌入和打标制定数据集操作; 依据Fine ‑tun商品名称分类Specific ‑task, 对税务商品名称数据进行信息抽取、 分 词、 词嵌入操作。 3.根据权利要求2所述的一种商品名称分类的模型构建方法, 其特征在于, 在步骤S3 中, 引入BERT作为主干网络, 针对网络设计3大类优化模块, 包括N ‑Gram结构显示和隐式的 粗细粒度知识引入、 Retrospective Feed Mechanism和Enhanced Recurrence Mechanism 算法的构建、 Mu lti‑headed和Scaledot ‑product Self‑attention的超参数改进, 并进行模 块化编程实现。 4.根据权利要求3所述的一种商品名称分类的模型构建方法, 其特征在于, 引入word粒 度和word pair粒度知识, 通过显式的n ‑gram掩蔽方法, 对BERT的MLM中被忽略的粗粒度语 义知识进行增强, 构成要素包括连续MLM、 显示n元语法掩码 语言建模、 综合的n元语法预测、 增强的n元语法关系建模和n元语法提取。 5.根据权利 要求4所述的一种商品名称分类的模型构 建方法, 其特征在于, 所述Multi ‑ headed attention中,BERT中引入8头注意力机制, 多头表征进行concatenate操作, 后进行 matrix product, IS ‑gram使用horovod并行技术, 使用12头注意力, 同时dot ‑product后进 行batch normalization处理, 增强模型的鲁棒 性。 6.根据权利 要求5所述的一种商品名称分类的模型构 建方法, 其特征在于, 所述Scaled dot‑product attention 中, IS‑gram模型self ‑attention 中, 对点积值softmax之前, 进行 处罚时, 不再指定除去QKV向量维度的开方, 设定为可 学习的变量。 7.根据权利要求6所述的一种商品名称分类的模型构建方法, 其特征在于, 在步骤S5 中, 使用预处理后的开源数据, 对调整后的网络进行预训练, 直到网络收敛生成Pre ‑train 的网络结构、 权 重、 属性和优化器 状态的序列化文件。 8.根据权利要求7所述的一种商品名称分类的模型构建方法, 其特征在于, 在步骤S6 中, 分别采取屏蔽文本表征模块和无模块屏蔽两种 策略, 使用预处理后的税务商品名称数 据, 对步骤S5生 成的网络进行迁移学习微调, 并生 成Fine‑tune的网络权重和优化器状态的 序列化文件, 得到最终的税务领域商品名称分类迁移学习的模型。 9.一种商品名称分类的模型构建装置, 其特征在于, 包括: 至少一个存储器和至少一个 处理器; 所述至少一个存 储器, 用于存 储机器可读程序; 所述至少一个处理器, 用于调用所述机器可读程序, 执行权利要求1至8中任一所述的权 利 要 求 书 1/2 页 2 CN 114580560 A 2方法。权 利 要 求 书 2/2 页 3 CN 114580560 A 3
专利 一种商品名称分类的模型构建方法及装置
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:44:36
上传分享
举报
下载
原文档
(647.7 KB)
分享
友情链接
商用密码应用安全性评估报告模板(2023版)—系统密评报告.docx
GB-T 8566-2022系统与软件工程 软件生存周期过程.pdf
NB-T 10229-2019 水电工程环境保护设施验收规程.pdf
GB-T 42332-2023 海岛及周边海域地形图测绘规范.pdf
GB-T 39256-2020 绿色制造 制造企业绿色供应链管理 信息化管理平台规范.pdf
GB-T 28801-2012 气枪.pdf
T-ISAS 004—2021 沙棘果油.pdf
GB-T 43439-2023 信息技术服务 数字化转型 成熟度模型与评估.pdf
GB-T 34336-2017 纳米孔气凝胶复合绝热制品.pdf
GB-T 36630.4-2018 信息安全技术 信息技术产品安全可控评价指标 第4部分:办公套件.pdf
GB-T 33490-2017 展览展示工程服务基本要求.pdf
GB-T 14227-2006 城市轨道交通车站站台声学要求和测量方法.pdf
T-GIAEC 001—2023 工业锅炉定期节能检查技术规范.pdf
SY-T 5820-2020 天然源电磁法采集技术规程.pdf
GM-T 0039-2015 密码模块安全检测要求.pdf
GM-T 0028-2014 密码模块安全技术要求.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
滨州市河道管理办法.pdf
GBT 33132-2016 信息安全技术 信息安全风险处理实施指南.pdf
GB-T 31364-2015 能量色散X射线荧光光谱仪主要性能测试方法.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(647.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。