(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210304836.5 (22)申请日 2022.03.22 (71)申请人 北京探境科技有限公司 地址 100094 北京市朝阳区望京宏泰西街 博泰大厦5层 (72)发明人 罗思明  (74)专利代理 机构 北京三聚阳光知识产权代理 有限公司 1 1250 专利代理师 刘贺秋 (51)Int.Cl. G06F 40/194(2020.01) G06F 40/186(2020.01) G06F 40/126(2020.01) G06F 40/211(2020.01) G06F 40/30(2020.01)G06K 9/62(2022.01) (54)发明名称 一种相似命令文本的生成方法、 装置、 设备 及存储介质 (57)摘要 本发明公开了一种相似命令文本的生成方 法、 装置、 设备及存储介质, 该方法包括: 获取命 令数据集, 对所述命令数据集进行语料处理, 生 成句法模板与相似句对; 基于所述句法模板与所 述相似句对对 预设文本生 成模型进行训练, 生成 相似文本生成模 型; 将所述命令数据集与所述句 法模板输入 上述所述文本生 成模型, 生成相似命 令文本。 本方法实现了相似命令文本自动生成, 对命令数据集进行了有效增广, 充分覆盖了设备 命令的各类 语法表达形式。 权利要求书2页 说明书12页 附图6页 CN 114936548 A 2022.08.23 CN 114936548 A 1.一种相似 命令文本的生成方法, 其特 征在于, 包括如下步骤: 获取命令数据集, 对所述命令数据集进行语料处 理, 生成句法模板与相似句对; 基于所述句法模板与 所述相似句对对预设文本生成模型进行训练, 生成相似文本生成 模型; 将所述命令数据集与所述句法模板 输入上述所述文本生成模型, 生成相似 命令文本 。 2.根据权利要求1所述的一种相似命令文本的生成方法, 其特征在于, 所述获取命令数 据集, 对所述命令数据集进行语料处 理, 生成句法模板与相似句对, 包括: 提取所述命令数据集中的命令句, 利用词法分析器对所述命令句进行词法分析, 生成 词性特征; 对所述词性特 征进行排序, 生成所述句法模板; 提取所述命令数据集中的命令句, 将命令类型相同的所述命令句两两组对, 生成所述 相似句对。 3.根据权利要求2所述的一种相似命令文本的生成方法, 其特征在于, 所述将所述命令 数据集与所述句法模板 输入上述所述文本生成模型, 生成相似 命令文本, 包括: 基于所述命令数据集获取源句, 对所述源句进行语义编码, 生成源句语义隐向量; 获取所述句法模板, 对所述句法模板进行句法编码, 生成句法隐向量; 将所述语义隐向量与所述句法隐向量进行拼接, 生成拼接向量; 将所述拼接向量进行解码, 生成所述相似 命令文本 。 4.根据权利要求3所述的一种相似命令文本的生成方法, 其特征在于, 所述获取所述句 法模板, 对所述句法模板进行句法编码, 生成句法隐向量, 包括: 将所述句法模板对应的所述词性特 征进行编码, 生成词性特 征向量; 对所述词性特 征向量进行位置编码, 生成所述句法隐向量。 5.根据权利要求3所述的一种相似命令文本的生成方法, 其特征在于, 所述获取所述句 法模板, 对所述句法模板进行句法编码, 生成句法隐向量, 还 包括: 遍历所述命令数据集对应的的所述句法模板, 依次对所述句法模板进行句法编码, 生 成所述句法隐向量。 6.一种相似 命令文本的生成装置, 其特 征在于, 包括: 处理模块, 用于获取命令数据集, 对所述命令数据集进行语料处理, 生成句法模板与相 似句对; 训练模块, 用于基于所述句法模板与所述相似句对对预设文本生成模型进行训练, 生 成相似文本生成模型; 生成模块, 用于将所述命令数据集与所述句法模板输入上述所述文本生成模型, 生成 相似命令文本 。 7.根据权利要求6所述的一种相似命令文本的生成装置, 其特征在于, 所述处理模块, 包括: 分析子模块, 用于提取所述命令数据集中的命令句, 利用词法分析器对所述命令句进 行词法分析, 生成词性特 征; 排序子模块, 用于对所述词性特 征进行排序, 生成所述句法模板; 组对子模块, 用于提取所述命令数据集中的命令句, 将命令类型相同的所述命令句两权 利 要 求 书 1/2 页 2 CN 114936548 A 2两组对, 生成所述相似句对。 8.根据权利要求7所述的一种相似命令文本的生成装置, 其特征在于, 所述生成模块, 包括: 第一编码子模块, 用于基于所述命令数据集获取源句, 对所述源句进行语义编码, 生成 源句语义隐向量; 第二编码子模块, 用于获取所述句法模板, 对所述句法模板进行句法编码, 生成句法隐 向量; 拼接子模块, 用于将所述语义隐向量与所述句法隐向量进行拼接, 生成拼接向量; 解码子模块, 用于将所述 拼接向量进行解码, 生成所述相似 命令文本 。 9.一种计算机设备, 其特征在于, 包括处理器和存储器, 其中, 所述存储器用于存储计 算机程序, 所述处理器被配置用于调用所述计算机程序, 执行如权利要求 1‑5中任一项 所述 方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机指令, 其特征在于, 所述计算机指令 被处理器执行时实现如权利要求1 ‑5中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114936548 A 3

.PDF文档 专利 一种相似命令文本的生成方法、装置、设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种相似命令文本的生成方法、装置、设备及存储介质 第 1 页 专利 一种相似命令文本的生成方法、装置、设备及存储介质 第 2 页 专利 一种相似命令文本的生成方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:47:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。