(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221020278 8.9 (22)申请日 2022.03.02 (71)申请人 赵宗耀 地址 401329 重庆市九龙坡区走马镇走马 街114号 (72)发明人 赵宗耀 陶雄 刘骐瑞  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 王娇娇 (51)Int.Cl. G06F 16/35(2019.01) G16H 50/70(2018.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 16/95(2019.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种中医症状文本的分类方法及装置 (57)摘要 本申请提供一种中医症状文本的分类方法 及装置, 首先 获取待处理中医症状文本并进行预 处理, 得到切片特征语义信息和一般语义信息; 然后利用所述切片特征语义信息反向对所述待 处理中医症状文本进行重构, 得到重构症状文本 语义信息, 所述重构症状文本语义信息用以表示 所述待处理中医症状文本的特殊分类信息; 最 后, 将所述重构症状文本语义信息和所述一般语 义信息进行拼接, 作为线性神经网络模型输入, 由预设线性神经网络模型输出所述待处理中医 症状文本的分类结果, 所述线性神经网络模型是 预先根据标注的中医症状文本构建的。 通过本申 请可实现中 医症状的智能识别和分类 。 权利要求书2页 说明书10页 附图2页 CN 114579742 A 2022.06.03 CN 114579742 A 1.一种中 医症状文本的分类方法, 其特 征在于, 包括: 获取待处 理中医症状文本并进行 预处理, 得到切片特 征语义信息和一般语义信息; 利用所述切片特征语义信 息反向对所述待处理中医症状文本进行重构, 得到重构症状 文本语义信息, 所述重构症状文本语义信息用以表示所述待处理中医症状文本的特殊分类 信息; 将所述重构症状文本语义信 息和所述一般语义信 息进行拼接, 作为线性神经网络模型 输入, 由预设线性神经网络模型输出所述待处理中医症状文本的分类结果, 所述线性神经 网络模型 是预先根据标注的中 医症状文本构建的。 2.根据权利要求1所述的方法, 其特征在于, 所述获取待处理中医症状文本并进行预处 理, 得到切片特 征语义信息, 包括: 获取所述待处理中医症状文本, 对所述待处理中医症状文本进行切片操作, 得到中医 症状文本集合, 所述中医症状文本集合中包含所述待处理中医症状文本不同长度的不同内 容的切片 片段; 根据所述中医症状文本集合构建数据表, 所述数据表的行数为所述待处理中医症状文 本的个数, 列数为所述中 医症状文本集 合中切片 片段的个数; 利用LFText算法分析所述中医症状文本集合构成的数据表, 得到不同片段对应的特殊 语义信息; 将所述不同片段对应的特殊语义信 息按照第 一预设规则进行拼接, 得到所述切片特征 语义信息 。 3.根据权利要求1所述的方法, 其特征在于, 所述获取待处理中医症状文本并进行预处 理, 得到一般语义信息, 包括: 获取所述待处理中医症状文本, 对所述待处理中医症状文本进行切片操作, 得到中医 症状文本集合, 所述中医症状文本集合中包含所述待处理中医症状文本不同长度的不同内 容的切片 片段; 分析所述中医症状文本集 合中的所有切片 片段, 得到所有切片 片段的字典集 合; 基于BERT模型, 加载基于维基百科的bert中文预训练词向量, 将所述字典集合中的每 个字转化成768维的词向量, 构成词向量集合, 所述词向量集合为中医症状文本的向量表 示; 利用TextCN N从所述词向量 集合中提取 出不同词向量的一般语义信息; 将所述不同词对应的一般语义信 息按照第 二预设规则进行拼接, 得到所述一般语义信 息。 4.一种中 医症状文本的分类装置, 其特 征在于, 包括: 第一处理单元, 用于获取待处理中医症状文本并进行预处理, 得到切片特征语义信息 和一般语义信息; 第二处理单元, 用于利用所述切片特征语义信 息反向对所述待处理中医症状文本进行 重构, 得到重构症状文本语义信息, 所述重构症状文本语义信息用以表示所述待处理中医 症状文本的特殊分类信息; 第三处理单元, 用于将所述重构症状文本语义信息和所述一般语义信息进行拼接, 作 为线性神经网络模型输入, 由预设线性神经网络模型输出所述待处理中医症状文本的分类权 利 要 求 书 1/2 页 2 CN 114579742 A 2结果, 所述线性神经网络模型 是预先根据标注的中 医症状文本构建的。 5.根据权利要求 4所述的装置, 其特 征在于, 所述第一处 理单元用于: 获取所述待处理中医症状文本, 对所述待处理中医症状文本进行切片操作, 得到中医 症状文本集合, 所述中医症状文本集合中包含所述待处理中医症状文本不同长度的不同内 容的切片 片段; 根据所述中医症状文本集合构建数据表, 所述数据表的行数为所述待处理中医症状文 本的个数, 列数为所述中 医症状文本集 合中切片 片段的个数; 利用LFText算法分析所述中医症状文本集合构成的数据表, 得到不同片段对应的特殊 语义信息; 将所述不同片段对应的特殊语义信 息按照第 一预设规则进行拼接, 得到所述切片特征 语义信息 。 6.根据权利要求 4所述的装置, 其特 征在于, 所述第一处 理单元用于: 获取所述待处理中医症状文本, 对所述待处理中医症状文本进行切片操作, 得到中医 症状文本集合, 所述中医症状文本集合中包含所述待处理中医症状文本不同长度的不同内 容的切片 片段; 分析所述中医症状文本集 合中的所有切片 片段, 得到所有切片 片段的字典集 合; 基于BERT模型, 加载基于维基百科的bert中文预训练词向量, 将所述字典集合中的每 个字转化成768维的词向量, 构成词向量集合, 所述词向量集合为中医症状文本的向量表 示; 利用TextCN N从所述词向量 集合中提取 出不同词向量的一般语义信息; 将所述不同词对应的一般语义信 息按照第 二预设规则进行拼接, 得到所述一般语义信 息。 7.一种存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 在所述程序运行 时控制所述存储介质所在的设备执行如权利要求1至3中任一项所述的中医症状文本的分 类方法。 8.一种电子设备, 其特征在于, 所述电子设备包括至少一个处理器、 以及与 所述处理器 连接的至少一个存储器、 总线; 其中, 所述处理器、 所述存储器通过所述总线完成相互间的 通信; 所述处理器用于调用所述存储器中的程序指令, 以执行如权利要求1至3中任一项所 述的中医症状文本的分类方法。权 利 要 求 书 2/2 页 3 CN 114579742 A 3

.PDF文档 专利 一种中医症状文本的分类方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种中医症状文本的分类方法及装置 第 1 页 专利 一种中医症状文本的分类方法及装置 第 2 页 专利 一种中医症状文本的分类方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。