专利一种推荐信息生成方法及装置 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210427146.9 (22)申请日 2022.04.21 (71)申请人北京三快在线科技有限公司地址 100080 北京市海淀区北四环西路9号 2106-030 (72)发明人陆源源　富饶　侯培旭　 (74)专利代理机构北京曼威知识产权代理有限公司 11709 专利代理师方志炜 (51)Int.Cl. G06F 16/9535(2019.01) G06F 16/958(2019.01) G06F 16/35(2019.01) G06F 16/335(2019.01) G06F 40/211(2020.01)G06F 40/279(2020.01) G06F 40/30(2020.01) (54)发明名称一种推荐信息生成方法及装置 (57)摘要本说明书公开了一种推荐信息生成方法及装置。对于每个目标，分别通过分类模型和对象识别模型确定该目标对应的各描述文本的子句的描述维度和描述的对象，并合并属于同一描述维度且对象相同的子句，得到各描述维度对应的若干聚合文本，通过预先训练的语句逻辑分析模型过滤掉不符合逻辑的聚合文本，最后基于过滤后得到的各聚合文本生成该目标对应的推荐信息。能够根据真实描述文本的子句聚合生成推荐信息，在聚合时不额外增加文本，保证了生成的推荐信息的真实性，简短且符合逻辑。权利要求书2页说明书16页附图4页 CN 114817719 A 2022.07.29 CN 114817719 A 1.一种推荐信息生成方法，其特征在于，包括：针对每个目标，将该目标对应的各描述文本划分为若干子句；根据各描述文本的子句，通过预先训练的分类模型，确定各子句的描述维度，并根据各描述文本的子句，通过预先训练的对象识别模型，确定各子句中描述的对象；针对确定出的每个描述维度，将属于该描述维度，且描述的对象相同的子句进行合并，得到该描述维度对应的若干聚合文本；根据各描述维度对应的聚合文本，通过预先训练的语句逻辑分析模型，过滤不符合语句逻辑的聚合文本；根据过滤后得到的各描述维度对应的聚合文本，生成该目标对应的推荐信息。 2.如权利要求1所述的方法，其特征在于，预先训练所述对象识别模型，具体包括：获取预设的样本模板以及文本库；根据所述样本模板以及所述文本库，构建包含对象以及属于预设词类的训练样本，作为一类训练样本，并将所述一类训练样本中各文字是否为对象对应的文字，作为所述一类训练样本的标签；根据所述样本模板以及所述文本库，构建不包含对象的训练样本，作为二类训练样本，并将所述二类训练样本中各文字为非对象对应的文字，作为所述二类训练样本的标签；根据所述样本模板以及所述文本库，构建对象处于指定位置的训练样本，作为三类训练样本，并将所述三类训练样本中各文字是否为对象对应的文字，作为所述三类训练样本的标签；根据所述样本模板以及所述文本库，构建包含预设数量的对象的训练样本，作为四类训练样本，并将所述四类训练样本中各文字是否为对象对应的文字，作为所述四类训练样本的标签；根据确定出的各训练样本，对所述对象识别模型进行训练。 3.如权利要求1所述的方法，其特征在于，预先训练所述语句逻辑分析模型，具体包括：获取预设的描述文本库，将所述描述文本库中的各描述文本作为各正样本，并将符合语句逻辑作为各正样本的标签；对属于不同描述文本的子句进行重新组合，构建不符合语句逻辑的各负样本，并将不符合语句逻辑作为各负样本的标签；根据各正样本以及各负样本，对所述语句逻辑分析模型进行训练。 4.如权利要求1所述的方法，其特征在于，针对确定出的每个描述维度，将属于该描述维度，且描述的对象相同的子句进行合并，得到该描述维度对应的若干聚合文本之前，所述方法还包括：针对确定出的每个描述维度，确定属于该描述维度的各组语义重复的子句；针对每组语义重复的子句，将该组语义重复的子句删除至剩余一个子句。 5.如权利要求4所述的方法，其特征在于，确定属于该描述维度的各组语义重复的子句，具体包括：针对属于该描述维度的每个子句，根据预设的近义词词库，判断属于该描述维度的其他子句中，是否存在与该子句包含近义词的其他子句；当存在与该子句包含近义词的其他子句时，则将确定出的其他子句与该子句作为一组权　利　要　求　书 1/2 页 2 CN 114817719 A 2语义重复的子句。 6.如权利要求4所述的方法，其特征在于，确定属于该描述维度的各组语义重复的子句，具体包括：针对属于该描述维度的每个子句，确定该子句对应的向量；根据确定出的向量，分别计算该描述维度中其他子句与该子句间的相似度；当所述相似度大于预设的阈值时，确定所述其他子句与该子句语义重复；将该子句以及属于该描述维度的与该子句语义重复的各子句，作为属于该描述维度的一组语义重复的子句。 7.如权利要求1所述的方法，其特征在于，针对确定出的每个描述维度，将属于该描述维度，且描述的对象相同的子句进行合并之前，所述方法还包括：判断该目标的各子句中是否存在不包含对象的子句；若是，则删除不包含对象的子句。 8.一种推荐信息生成装置，其特征在于，包括：子句划分模块，用于针对每个目标，将该目标对应的各描述文本划分为若干子句；输入模块，用于根据各描述文本的子句，通过预先训练的分类模型，确定各子句的描述维度，并根据各描述文本的子句，通过预先训练的对象识别模型，确定各子句中描述的对象；聚合模块，用于针对确定出的每个描述维度，将属于该描述维度，且描述的对象相同的子句进行合并，得到该描述维度对应的若干聚合文本；过滤模块，用于根据各描述维度对应的聚合文本，通过预先训练的语句逻辑分析模型，过滤不符合语句逻辑的聚合文本；信息生成模块，用于根据过滤后得到的各描述维度对应的聚合文本，生成该目标对应的推荐信息。 9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～7任一项所述的方法。 10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～7任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114817719 A 3

专利 一种推荐信息生成方法及装置

专利一种推荐信息生成方法及装置