(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210275512.3 (22)申请日 2022.03.21 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 (72)发明人 刘维康 张华平 商建云  (74)专利代理 机构 北京正阳理工知识产权代理 事务所(普通 合伙) 11639 专利代理师 张利萍 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 16/215(2019.01) G06F 16/29(2019.01) G06F 16/9537(2019.01) (54)发明名称 一种基于开源时空数据的时空目标描述文 字生成方法 (57)摘要 本发明涉及一种基于开源时空数据的时空 目标描述文字生成方法, 属于时空数据分析与挖 掘技术领域。 本方法通过分析时空目标数据的特 点, 经过数据清洗、 行为描 述短语生成、 位置描 述 短语生成和目标描述生成, 提取时空目标活动轨 迹的语义信息, 生成目标活动状态文字描述, 可 用于时空数据语义理解等。 本方法能够对不含显 示语义信息的时空数据进行理解, 能够准确、 高 效地分析时空数据中各时空目标的行为模式, 并 能够准确识别时空数据在地图上所经过的地理 位置, 不依赖于在线网络, 可以实现面向海量时 空数据的快速语义感知, 为时空数据语义分析提 供技术支撑。 本发明拓展了时空数据的应用范 围, 具有良好的应用前 景。 权利要求书4页 说明书8页 附图4页 CN 114707511 A 2022.07.05 CN 114707511 A 1.一种基于开源时空数据的时空目标描述文字生成方法, 其特 征在于, 包括以下步骤: 步骤1: 对时空目标轨迹数据进行清洗, 在保证数据规模的情况下, 对原始的轨迹实现 归一化压缩; 步骤2: 生成目标行为描述短语; 即: 识别目标的活动意 图, 并与历史记录作比较, 生成 特定的文字描述; 步骤2.1: 计算目标轨 迹形状; 对时空目标的轨迹形状归类: {Dot:0,StraightLine:1,Circle:2,Ring:3,Mass: 4}, 其 中, Dot表示点型, StraightLine表示直线型, Circle表示类圆型, Ring表示 圆环型, M ass表 示混乱型; 其中, 轨迹形状归类方法如下: 步骤2.1.1: 对于一条轨迹序列Hi={p1,p2,...,pn}, 如果轨迹序列中所有点的坐标偏移 量小于阈值 δdot, 则将轨迹归类为Dot型; 否则转 步骤2.1.2; 其中, 地球上的两点X=<lat1,lon 1>和Y=<lat2,lon2> 空间距离DisXY, 采用Hav erSine 公式计算: DisXY=HaverSi n(vLat)+coslat1* coslat2*HaverSin(vLon) vLat=abs(lat1 ‑lat2) vLon=abs(lon1‑lon2) 其中, vlat代表点X的纬度和点Y 的纬度差的绝对值, vlon代表点X的经度和点Y 的经度 差的绝对值; HaverSin()表示半正矢公式; abs()代表取绝对值; cos表示余弦函数; lat、 lon均表示弧度, 通过将角度形式经纬度转换 得到, 转换公式为: 其中, radian代 表弧度, degre es代表角度, π表示圆周率; 步骤2.1.2: 连接点p1和点pn形成一条直线 计算p2~pn‑1所有点到线段 的 距离diH, 1<i<n; 如果diH的最大值不大于设定的阈值δd, 则将轨迹归 类为StraightLine型; 否 则转步骤2.1.3; 其中, 点pi到直线lineH的距离diH由下式计算: 其中, lon1、 lat1、 lon2、 lat2分别是直线lineH两端点的经纬度角度坐标, loni、 lati是 点pi角度坐标; 步骤2.1.3: 将所有点p1~pn连接起来, 形成一条空间线向量 获取该线向量 的重心 权 利 要 求 书 1/4 页 2 CN 114707511 A 2以 为圆心, 以 与点p1的空间距离为半径ri作圆Zi, 统计Hi中落 在该圆内的点的数量 如果 大于设定的阈值 δZ, 则转步骤2.1.5, 否则转 步骤2.1.4; 步骤2.1.4: 以ri的3/4为半径作小圆Zi2, 统计Hi中落在小圆Zi2中的点的数量 如果 小于设定的阈值 δC, 则将轨迹形状归类为Ri ng型, 否则归类为Circle 型; 步骤2.1.5: 如果 不满足以上任意形状的轨 迹, 则归类为Mas s型; 步骤2.1.6: 轨 迹增加Shape属性, 其 值为其轨迹形状id; 步骤2.2: 为轨迹数据中的各项属性设定优先级权重, 优先级排布为0、 1、 2 …, 数字越 小, 优先级越高, 得到属性 集列表, 并确定各属性的取值是 “范围”类还是“有限集”类; 步骤2.3: 建立任务与属性的决策链; 基于步骤2.2中设定的属性优先级, 构建基于规则式的分类模型clas s, 如下式所示: class=Model(at tr0,attr1,…,attrn) 其中, attri,i∈[0,n]是按属性优先级排列的时空目标属性, n为属性数量; Model表示 定义的分类模型基 类; 遍历每一种行为模式, 依据属性优先级, 构建出判别逻辑链, 判别链类似决策树的一条 路径; 步骤3: 生成目标位置描述短语; 即: 识别轨迹列表在地图上所经历的区域, 并转化为相 对简单的文字短语; 包括以下步骤: 步骤3.1: 收集geojson数据, 生成Level0,Level1,…Levelm的多级区划地图, 其中Level0 由若干个Level1组成, 以此类 推; 为各级区划建立一组多叉树Ts, Ti∈Ts, Ti的根节点rooti为第0级区划, 其代表最粗粒度 划分的地图, rooti的孩子结点为将rooti进一步细分所得的第1级区划, 以此类推, 叶子结点 为最细粒度的Levelm级区划, 并为树中 的每一个结点建立指向父亲结点的映射以及指向对 应区划地图的映射; 步骤3.2: 基于步骤2中生成的空间线向量以及步骤3.1中生成的多级区划数据, 基于 “分治”思想, 层级细化对轨 迹所经过的区域进行计算; 步骤3.2.1: 首先, 采用Level0级区划地图, 依次遍历Level0中所有图层, 每个图层是一 个面向量, 对轨迹线向量 和Level0i做相交判定, 统计Level0级区域, 转步骤 3.2.2; 步骤3.2.2: 步骤3.2.1中统计的Level0级区域, 分别调取对应的Level1粒度区划地图; 重复以上步骤, 直到获得最细粒度Levelm的经过区域列表 Areasm, 转步骤3.2.3; 步骤3.3: 基于步骤3.1中建立的多叉树, 对步骤3.2中获得的Areasm列表中在地图上相 邻的区域进行合并, 将指向同一个父 亲结点的区划合并成上级区划; 步骤3.4: 遍历步骤3.3中生成的合并列表Areamerge, 对于每一项 做如下处 理: 步骤3.4.1: 依次遍历轨 迹点列表p1~pn, 将每一个点pi与 做Intersect判断; 步骤3.4.2: 统计与 相交的轨 迹点的数量CAmi;权 利 要 求 书 2/4 页 3 CN 114707511 A 3

.PDF文档 专利 一种基于开源时空数据的时空目标描述文字生成方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于开源时空数据的时空目标描述文字生成方法 第 1 页 专利 一种基于开源时空数据的时空目标描述文字生成方法 第 2 页 专利 一种基于开源时空数据的时空目标描述文字生成方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:45:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。