(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210479221.6 (22)申请日 2022.05.05 (71)申请人 江苏省城市规划设计 研究院有限公 司 地址 210036 江苏省南京市 鼓楼区草场门 大街88#江苏建 设大厦 (72)发明人 姚秀利 韦胜  (74)专利代理 机构 南京经纬专利商标代理有限 公司 32200 专利代理师 朱桢荣 (51)Int.Cl. G06F 16/29(2019.01) G06F 16/33(2019.01) G06F 16/9535(2019.01) G06F 16/9536(2019.01)G06F 40/169(2020.01) G06F 40/30(2020.01) (54)发明名称 一种地理实体 推荐方法 (57)摘要 本发明公开了一种地理实体推荐 方法, 涉及 城市交通技术领域, 首先, 确定研究区内地理实 体语义网络模型构件所需要的评论数据源和地 理实体列表。 其次, 对评论数据开展共现关系、 评 论观点、 位置语义、 评论主题等方面分析, 计算获 得不同类型的地理实体语义网络。 再利用复杂网 络技术计算各类地理实体语义网络的节点指标 值, 实现地理实体的聚类和评价推荐分析。 最后, 根据常用推荐关键词的使用情况, 预生成相对应 的地理实体语义网络, 从而加速相关地理实体语 义网络的评价和推荐速度, 提升了地理实体语义 网络构建的科学性和实用性, 具有较强的基于文 本语言分析的地理实体 推荐能力。 权利要求书3页 说明书9页 附图9页 CN 114780662 A 2022.07.22 CN 114780662 A 1.一种地理实体 推荐方法, 其特 征在于, 包括以下步骤: 步骤1、 确定研究区内地理实体 语义网络构件所需要的评论数据和地理实体列表; 步骤2、 提取每条评论数据中核心关注词, 结合地理实体列表获得第 一地理实体语义网 络; 提取每条评论数据中评论观点, 结合 地理实体列表获得第二 地理实体 语义网络; 提取每条评论数据中地理实体之间位置语义关系的关键词, 结合地理实体列表获得第 三地理实体 语义网络; 提取每条评论数据中反映评论主题的主题词, 结合地理实体列表获得第四地理实体语 义网络; 步骤3、 将步骤2中形成的核心关注词、 评论观点、 位置语义关系的关键词、 主题词作为 地理实体的推荐关键词, 根据用户所选择 的推荐关键词, 匹配相对应类型 的地理实体语义 网络, 并进行地理实体语义网络的生成, 进而通过新生成地理实体语义网络来推送与用户 兴趣最相关的地理实体。 2.根据权利要求1所述的一种地理实体推荐方法, 其特征在于, 步骤1中地理实体列表 内每个地理实体都具有经纬度坐标值, 地理实体列表是通过如下 方式获得的: 步骤1.1、 研究区内每个地理实体具有唯一值的编号和名称, 并对每个地理实体进行评 论数据的抓取; 步骤1.2、 所抓取的每条评论数据对应到所属的地理实体, 并建立 起一一对应关系。 3.根据权利要求1所述的一种地理实体 推荐方法, 其特 征在于, 步骤2中获得第一 地理实体 语义网络的方法具体如下: 步骤2.1、 基于TF—TDF算法, 提取出每条评论数据中的关键词, 并对所有评论数据提取 出的关键词进行词频统计; 步骤2.2、 建立词频大于预设阈值的关键词在评论数据中的共现关系网络, 计算得到共 现关系络的核心关键词的强度值; 步骤2.3、 根据所有评论数据中关键词的词频数量大小和在共现关系网络中核心关键 词的强度值, 筛 选出核心关注词; 步骤2.4、 以地理实体为地理实体语义网络的网络节点, 若某个核心关注词在两个不同 地理实体的各自某条评论数据中都出现, 则认为这两个地理实体之 间存在一条复杂网络连 接边; 步骤2.5、 基于复杂 网络理论, 通过网络节点和复杂 网络连接边之间的关系, 构建第一 地理实体 语义网络; 步骤2中获得第二 地理实体 语义网络的方法具体如下: 步骤3.1、 基于百度自然语言处理的在线API, 提取出每条评论数据中的评论观点, 每条 评论观点由一个属性词和描述词组合而成; 步骤3.2、 按照评论观点的属性词和描述词组合特点, 进一步提炼和汇总出评论观点列 表; 步骤3.3、 基于复杂 网络理论, 以地理实体为地理实体语义网络的网络节点, 若评论观 点列表中某一评论观 点在两个不同地理实体的各自某条评论数据中都出现, 则认为这两个 地理实体之间存在一条复杂网络连接边;权 利 要 求 书 1/3 页 2 CN 114780662 A 2步骤3.4、 基于复杂 网络理论, 通过网络节点和复杂 网络连接边之间的关系, 构建第二 地理实体 语义网络; 步骤2中获得第三 地理实体 语义网络的方法具体如下: 步骤4.1、 提取 出每条评论数据中所有地理实体; 步骤4.2、 构建表示 位置语义关系的关键词及相对应的权 重值I; 其中, 权 重值I>1; 步骤4.3、 基于自然语言语义分析技术, 提取每条评论数据中所有两两地理实体之间的 位置语义连接关系, 即: 若一条评论数据中两个地理实体之间没有步骤4.2中所述的表示位置语义关系的关键 词, 则认为 这两个地理实体之间存在一条复杂网络连接边, 且边的权 重为1; 若一条评论数据中两个地理实体之间存在步骤4.2中所述的表示位置语义关系的关键 词, 则认为这两个地理实体之间存在一条复杂网络连接边, 且边的权重为步骤4.2中所述的 表示位置语义关系的关键词相对应的权重值; 其中, 若 出现多个步骤4.2中所述的表示位置 语义关系的关键词, 则以最大权 重值的关键词来确定网络边连接关系; 步骤4.4、 基于复杂 网络理论, 以地理实体为地理实体语义网络的网络节点, 再通过步 骤4.3中所确定的复杂网络连接边之间的关系, 构建第三 地理实体 语义网络; 步骤2中获得第四地理实体 语义网络的方法具体如下: 步骤5.1、 基于百度自然语言处 理的在线API, 提取 出每条评论数据的主题词; 步骤5.2、 根据主题词汇总出 所有评论数据的主题列表; 步骤5.3、 基于复杂 网络理论, 以地理实体为地理实体语义网络的网络节点, 若主题列 表中某一主题在两个不同地理实体的各自某条评论数据中都出现, 则认为这两个地理实体 之间存在一条复杂网络连接边; 步骤5.4、 基于复杂 网络理论, 通过网络节点和复杂 网络连接边之间的关系, 构建第四 地理实体 语义网络 。 4.根据权利要求3所述的一种地理实体推荐方法, 其特征在于, 生成第 一至第四地理实 体语义网络后, 分别对各个地理实体语义网络计算网络节点各类指标值; 基于该所得到的 网络节点各类指标值进行地理实体聚类分析, 并根据聚类结果对地理实体进 行空间可视化 展示。 5.根据权利要求3所述的一种地理实体推荐方法, 其特征在于, 步骤2.2中核心关键词 的强度值计算 步骤具体包括: 步骤2.2.1、 基于 复杂网络理论, 针对所有评论数据, 以核心关键词为网络节点, 若其中 两个核心关键词在一条评论中都出现, 则认为这两个核心关键词之 间存在一条复杂网络连 接边, 以此建立关键词复杂网络; 步骤2.2.2、 对步骤2.2.1中所建立的关键词复杂网络, 计算网络节点的度中心性、 加权 邻近中心性、 加权度中心性、 加权中介中心性和特 征向量中心性指标值; 步骤2.2.3、 基于熵值法, 对步骤2.2.2中所得全部指标计算得到网络节点的综合评价 值; 该综合评价 值即为核心关键词的强度值; 步骤3.2中提炼和汇总出评论观点列表计算 步骤具体包括: 步骤3.2.1、 将评论观点中相近语义的属性词进行合并; 步骤3.2.2、 将评论观点中相近语义的描述词进行合并;权 利 要 求 书 2/3 页 3 CN 114780662 A 3

.PDF文档 专利 一种地理实体推荐方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种地理实体推荐方法 第 1 页 专利 一种地理实体推荐方法 第 2 页 专利 一种地理实体推荐方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:44:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。