(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210229937.0 (22)申请日 2022.03.09 (71)申请人 大连理工大 学 地址 116024 辽宁省大连市甘井 子区凌工 路2 号 (72)发明人 张晓彤 刘晗 相玖红  (74)专利代理 机构 辽宁鸿文知识产权代理有限 公司 21102 专利代理师 隋秀文 (51)Int.Cl. G06F 40/263(2020.01) G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种针对 小语种的小样本意图识别方法 (57)摘要 本发明属于对话系统意图识别应用领域, 提 出了一种针对小语种的小样 本意图识别方法。 该 方法通过数据预处理、 方法设计、 模型训练和模 型测试和四个阶段, 基于小样本学习意图识别, 旨在针对小语种对话语句进行意图识别, 从人类 对话中理解其真实意图。 本发明中的小样本学习 可以在每类只有少量甚至个位数标记数据的情 况下实现类别预测, 因此能有效突破小语种语料 不足的障碍。 同时发现了用户意图表达多样化对 意图识别的干扰, 从多语义的角度对对话语句进 行特征建模和关系建模, 确保了语句语义特征更 接近真实意图特征, 提高了小语种意图识别的准 确性。 权利要求书4页 说明书18页 附图3页 CN 114692615 A 2022.07.01 CN 114692615 A 1.一种针对小语种的小样本意图识别方法, 其特 征在于, 包括如下步骤, (一)、 数据预处 理; S1: 选取小语种, 进行小语种语料的收集; 收集的小语种对话语句附加小语种意图标签 的最终格式为 “小语种意图#小语种对话语句 ”; S2: 利用分词器对小语种对话语句分词, 分离词性 不同的相连 单词; S3: 收集无意图标签标记的小语种语料, 预训练B ert模型, 采用B ert模型通过双向循环 神经网络模型建立学习单词嵌入表示矩阵; 给定一具有T个单词的语句x={w1,w2,…,wT}, 其中, 代表第t 个单词的词向量, 词向量由Bert预训练模型得到; 每个单词的词向量使用一个双向循环神 经网络模型进一 步编码; 其中, LSTMfw和LSTMbw分别对应前向和后向LSTM, 和 分别对应单词 wt从LSTMfw和LSTMbw学习到的隐藏状态; 是单词wt‑1从LSTMfw学习到的隐藏状态, 是单词wt‑1从LSTMbw学习到的隐藏状态; 单词wt对应的总向量是 该语句的隐 藏状态矩阵即单词嵌入表示矩阵是 S4: 对步骤S1收集的 由小语种意图标签标记的数据进行小样本任务划分; 采用C‑way K‑shot任务划分方式对收集的对话语句进行小样本任务划分; 在每个小样 本任务中, 数据由C类构成, 每 个类包含K个数据; (二)、 方法设计; S5: 通过自注意力机制和非线性激活函数构建单词重要性学习模型, 输出 单词重要性; 通过自注意力机制和softmax非线性激活函数, 从单词嵌入表示矩阵获取语句中单词 的重要性权 重: A=softmax(F2ReLu(F1H)), 其中, 和 是分别自注意力机制的模型参数, 是权重分配矩阵; ReLu是线性整流函数; R代表语句包含的语义个数; 当R=1时, 单词重要性 权重A由一个向量构成, 表示单词在语句中的权重; 当R>1时, 会获得R个单词重要性权重向 量, 即把一个语句分解 为R个语义表示, 每 个语义表示都对应一个单词重要性权 重向量; S6: 提出层次化的多语义特 征提取模型, 进行多语义学习; 给定一个包含T个单词 的句子, 通过步骤S5获得其单词与语义间的权重分配矩阵A, A (r,i)代表第i个单词对于第r个语义的重要程度; 根据单词与语义的权重分配矩阵获得句 子的对话层面的多语义特 征表示: M=HAT, 权 利 要 求 书 1/4 页 2 CN 114692615 A 2从对话层面的多语义特 征表示中进一 步抽取Z个意图层面的多语义特 征表示; 针对对话层面的多语义特征表示运用映射矩阵, 获得映射后的对话层面的多语义特征 表示; 其中, 为第z个意图语义空间的映射矩阵; 第z个意图层面的多语义特征表示通过对R个映射后的对话层面的多语义特征表示进 行加权求和: lz=Mz( αz)T, 其中, lz为第z个意图层面的多语义特征表示; 代表R个对话层面语义与第z 个意图层面语义之间的权 重向量; 通过单头注意力机制自动计算第z个意图层面语义对应的权 重向量; αz=softmax(aztanh(GzM)), 其中, 是单头注意力机制的模型参数, tanh是非线性激活函数; 重复Z次单头注意力机制, 获取Z个意图层面的多语义特 征表示; S7: 构造语句和原型之间的关联网络, 实现对测试语句的意图识别; 每个小样本任务分为支持集和查询集; 支持集指示类别的特有信息, 查询集用于指导 关联网络模型的意图预测; 每个测试语句通过步骤S6获取多语义特征, 每个小样本任务的支持集由多语义特征表 示, 支持集数据为每个类学习一个多语义原型, 每类有K个由小语种意图标签标记的样本; 根据支持集中语句的多语义特征表示 获取每个类原型; 构建学习测试语句与类原型间相关 程度的关系网络; 相关程度最大的类原型对应的类别为该测试语句的预测意图; Ⅰ.多语义原型 学习 代表第c个类的支持集, 分别代表第k个数据及其意图标 签; 代表 的意图层面语义特征表示, 第c个类的支持集中K个数据的第z个意图层面的 语义特征表示为 其中, 代表 的第z个意图层面的语义特 征表示; 支持集有C个类原型 每个类原型Pc由Z个意图层面语义特征构成, 第c个类的第z个意图层面的语义特 征表示 构成原型 其中, 为原型计算的模型参数, 为K个数据计算原型 的权重 向量;权 利 要 求 书 2/4 页 3 CN 114692615 A 3

.PDF文档 专利 一种针对小语种的小样本意图识别方法

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种针对小语种的小样本意图识别方法 第 1 页 专利 一种针对小语种的小样本意图识别方法 第 2 页 专利 一种针对小语种的小样本意图识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:47:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。