(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210982416.2
(22)申请日 2022.08.16
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 周炜 谢奕 陈珺仪 陈佳颖
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 杨俊辉 黄健
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9538(2019.01)
(54)发明名称
基于人工智能的意图挖掘方法、 装置、 设备
及存储介质
(57)摘要
本公开提供的基于人工智能的意图挖掘方
法、 装置、 设备及存储介质, 涉及人工智能领域,
尤其涉及大数据、 知 识图谱、 智能搜索、 数据挖掘
技术领域, 可应用在智慧城市、 城市治理、 应用管
理场景下。 具体实现方案为: 获取待处理的用户
行为数据集, 该用户行为数据集中的用户行为数
据携带用户的标识和时间戳信息, 基于用户的标
识和时间戳信息对用户行为数据集进行划分得
到用户在目标时间周期内的第一行为数据集, 根
据第一知识库确定出第一行为数据集中存在的
目标意图数据集; 其中, 第一知识库包括目标意
图的至少两类 关键词, 目标意图数据集中的意图
关键词涵盖至少两类关键词。 该技术方案能够及
时、 准确的挖掘出用户的意图, 提高了意图挖掘
的效率。
权利要求书3页 说明书14页 附图4页
CN 115329195 A
2022.11.11
CN 115329195 A
1.一种基于人工智能的意图挖掘方法, 包括:
获取待处理的用户行为数据集, 所述用户行为数据集中的用户行为数据携带用户的标
识和时间戳信息;
基于所述用户的标识和所述时间戳信息, 对所述用户行为数据集进行划分, 得到所述
用户在目标时间周期内的第一行为数据集;
根据第一知识库, 确定出 所述第一行为数据集中存在的目标意图数据集;
其中, 所述第一知识库包括目标意图的至少两类关键词, 所述目标意图数据集中的意
图关键词涵盖所述至少两类关键词。
2.根据权利要求1所述的方法, 其中, 所述根据第一知识库, 确定出所述第一行为数据
集中存在的目标意图数据集, 包括:
基于所述第 一知识库包括的关键词, 在所述第 一行为数据集中确定出候选数据集以及
所述候选数据集涵盖的关键词类别;
响应于所述第 一知识库包括的关键词类别和所述候选数据集涵盖的关键词类别一致,
确定所述 候选数据集 为所述第一行为数据集中的目标意图数据集。
3.根据权利要求2所述的方法, 其中, 所述基于所述第一知识库包括的关键词, 在所述
第一行为数据集中确定出候选数据集以及所述 候选数据集涵盖的关键词类别, 包括:
对所述第一行为数据集中的行为数据进行词组拆分, 得到意图词组集合, 所述意图词
组集合包括意图关键词;
在所述第一知识库中查找所述 意图关键词;
响应于查找到所述意图关键词, 确定所述意图关键词所属行为数据组成的行为数据集
为所述候选数据集、 所述意图关键词所属的关键词类别为所述候选数据集涵盖的关键词类
别。
4.根据权利要求2或3所述的方法, 在所述第一知识库中, 所述至少两类关键词包括的
各关键词具有权 重系数;
在所述确定所述候选数据集为所述第 一行为数据集中的目标意图数据集之前, 所述方
法还包括:
根据所述候选数据集涵盖的关键词类别, 对所述候选数据集中的行为数据进行排列组
合, 得到候选数据子集, 所述 候选数据子集中的意图关键词涵盖所述至少两类关键词;
根据所述 意图关键词的权 重系数, 计算所述 候选数据子集的意图加权值;
所述确定所述 候选数据集 为所述第一行为数据集中的目标意图数据集, 包括:
响应于所述意图加权值大于预置权值阈值, 确定所述候选数据集中的所述候选数据子
集为目标意图数据集。
5.根据权利要求1至4任一项所述的方法, 其中, 所述基于所述用户的标识和所述时间
戳信息, 对所述用户行为数据集进行划分, 得到所述用户在目标时间周期 内的第一行为数
据集, 包括:
基于所述时间戳信息, 以所述目标时间周期的时长为滑窗长度、 预设时间单位为滑动
步长, 对所述用户行为数据集进行划分, 得到所述目标时间周期内的用户行为数据子集;
根据所述用户的标识对所述用户行为数据子集进行划分, 得到所述用户在目标时间周
期内的第一行为数据集。权 利 要 求 书 1/3 页
2
CN 115329195 A
26.根据权利要求1至5任一项所述的方法, 在所述基于所述用户的标识和所述 时间戳信
息, 对所述用户行为数据集进行划分, 得到所述用户在目标时间周期内的第一行为数据集
之前, 所述方法还 包括:
基于第二知识库, 剔除所述用户行为数据集中具有第一类关键词的行为数据; 所述第
二知识库包括所述第一类关键词, 所述第一类关键词 与所述目标意图的相关度小于相关度
阈值。
7.根据权利要求1至5任一项所述的方法, 在所述根据第一知识库, 确定出所述第一行
为数据集中存在的目标意图数据集之前, 所述方法还 包括:
基于第二知识库, 剔除所述第一行为数据集中具有第一类关键词的行为数据; 第二知
识库包括所述第一类关键词, 所述第一类关键词与所述目标意图的相关度小于相关度阈
值。
8.根据权利要求1至5任一项所述的方法, 在所述根据第一知识库, 确定出所述第一行
为数据集中存在的目标意图数据集之后, 所述方法还 包括:
基于第二知识库, 剔除所述目标意图数据集中具有第一类关键词的行为数据, 得到目
标输出数据集; 第二知识库包括所述第一类关键词, 所述第一类关键词与所述目标意图的
相关度小于相关度阈值。
9.一种基于人工智能的意图挖掘装置, 包括:
获取单元, 用于获取待处理的用户行为数据集, 所述用户行为数据集中的用户行为数
据携带用户的标识和时间戳信息;
处理单元, 用于基于所述用户的标识和所述时间戳信息, 对所述用户行为数据集进行
划分, 得到所述用户在目标时间周期内的第一行为数据集;
确定单元, 用于根据第一知识库, 确定出所述第一行为数据集中存在的目标意图数据
集;
其中, 所述第一知识库包括目标意图的至少两类关键词, 所述目标意图数据集中的意
图关键词涵盖所述至少两类关键词。
10.根据权利要求9所述的装置, 其中, 所述确定单 元, 包括:
筛选模块, 用于基于所述第一知识库包括的关键词, 在所述第一行为数据集中确定出
候选数据集以及所述 候选数据集涵盖的关键词类别;
确定模块, 用于响应于所述第 一知识库包括的关键词类别和所述候选数据集涵盖的关
键词类别一 致, 确定所述 候选数据集 为所述第一行为数据集中的目标意图数据集。
11.根据权利要求10所述的装置, 其中, 所述筛 选模块, 包括:
拆分子模块, 用于对所述第一行为数据集中的行为数据进行词组拆分, 得到意图词组
集合, 所述意图词组集 合包括意图关键词;
查找子模块, 用于在所述第一知识库中查找所述 意图关键词;
筛选子模块, 用于响应于查找到所述意图关键词, 确定所述意图关键词所属行为数据
组成的行为数据集为所述候选数据集、 所述意图关键词所属的关键词类别为所述候选数据
集涵盖的关键词类别。
12.根据权利要求10或11所述的装置, 在所述第 一知识库中, 所述至少两类关键词包括
的各关键词具有权 重系数;权 利 要 求 书 2/3 页
3
CN 115329195 A
3
专利 基于人工智能的意图挖掘方法、装置、设备及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:35:33上传分享