(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210275512.3
(22)申请日 2022.03.21
(71)申请人 北京理工大 学
地址 100081 北京市海淀区中关村南大街5
号
(72)发明人 刘维康 张华平 商建云
(74)专利代理 机构 北京正阳理工知识产权代理
事务所(普通 合伙) 11639
专利代理师 张利萍
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06F 16/215(2019.01)
G06F 16/29(2019.01)
G06F 16/9537(2019.01)
(54)发明名称
一种基于开源时空数据的时空目标描述文
字生成方法
(57)摘要
本发明涉及一种基于开源时空数据的时空
目标描述文字生成方法, 属于时空数据分析与挖
掘技术领域。 本方法通过分析时空目标数据的特
点, 经过数据清洗、 行为描 述短语生成、 位置描 述
短语生成和目标描述生成, 提取时空目标活动轨
迹的语义信息, 生成目标活动状态文字描述, 可
用于时空数据语义理解等。 本方法能够对不含显
示语义信息的时空数据进行理解, 能够准确、 高
效地分析时空数据中各时空目标的行为模式, 并
能够准确识别时空数据在地图上所经过的地理
位置, 不依赖于在线网络, 可以实现面向海量时
空数据的快速语义感知, 为时空数据语义分析提
供技术支撑。 本发明拓展了时空数据的应用范
围, 具有良好的应用前 景。
权利要求书4页 说明书8页 附图4页
CN 114707511 A
2022.07.05
CN 114707511 A
1.一种基于开源时空数据的时空目标描述文字生成方法, 其特 征在于, 包括以下步骤:
步骤1: 对时空目标轨迹数据进行清洗, 在保证数据规模的情况下, 对原始的轨迹实现
归一化压缩;
步骤2: 生成目标行为描述短语; 即: 识别目标的活动意 图, 并与历史记录作比较, 生成
特定的文字描述;
步骤2.1: 计算目标轨 迹形状;
对时空目标的轨迹形状归类: {Dot:0,StraightLine:1,Circle:2,Ring:3,Mass: 4}, 其
中, Dot表示点型, StraightLine表示直线型, Circle表示类圆型, Ring表示 圆环型, M ass表
示混乱型;
其中, 轨迹形状归类方法如下:
步骤2.1.1: 对于一条轨迹序列Hi={p1,p2,...,pn}, 如果轨迹序列中所有点的坐标偏移
量小于阈值 δdot, 则将轨迹归类为Dot型; 否则转 步骤2.1.2;
其中, 地球上的两点X=<lat1,lon 1>和Y=<lat2,lon2> 空间距离DisXY, 采用Hav erSine
公式计算:
DisXY=HaverSi n(vLat)+coslat1* coslat2*HaverSin(vLon)
vLat=abs(lat1 ‑lat2)
vLon=abs(lon1‑lon2)
其中, vlat代表点X的纬度和点Y 的纬度差的绝对值, vlon代表点X的经度和点Y 的经度
差的绝对值; HaverSin()表示半正矢公式; abs()代表取绝对值; cos表示余弦函数; lat、
lon均表示弧度, 通过将角度形式经纬度转换 得到, 转换公式为:
其中, radian代 表弧度, degre es代表角度, π表示圆周率;
步骤2.1.2: 连接点p1和点pn形成一条直线
计算p2~pn‑1所有点到线段
的
距离diH, 1<i<n; 如果diH的最大值不大于设定的阈值δd, 则将轨迹归 类为StraightLine型; 否
则转步骤2.1.3;
其中, 点pi到直线lineH的距离diH由下式计算:
其中, lon1、 lat1、 lon2、 lat2分别是直线lineH两端点的经纬度角度坐标, loni、 lati是
点pi角度坐标;
步骤2.1.3: 将所有点p1~pn连接起来, 形成一条空间线向量
获取该线向量
的重心
权 利 要 求 书 1/4 页
2
CN 114707511 A
2以
为圆心, 以
与点p1的空间距离为半径ri作圆Zi, 统计Hi中落
在该圆内的点的数量
如果
大于设定的阈值 δZ, 则转步骤2.1.5, 否则转 步骤2.1.4;
步骤2.1.4: 以ri的3/4为半径作小圆Zi2, 统计Hi中落在小圆Zi2中的点的数量
如果
小于设定的阈值 δC, 则将轨迹形状归类为Ri ng型, 否则归类为Circle 型;
步骤2.1.5: 如果 不满足以上任意形状的轨 迹, 则归类为Mas s型;
步骤2.1.6: 轨 迹增加Shape属性, 其 值为其轨迹形状id;
步骤2.2: 为轨迹数据中的各项属性设定优先级权重, 优先级排布为0、 1、 2 …, 数字越
小, 优先级越高, 得到属性 集列表, 并确定各属性的取值是 “范围”类还是“有限集”类;
步骤2.3: 建立任务与属性的决策链;
基于步骤2.2中设定的属性优先级, 构建基于规则式的分类模型clas s, 如下式所示:
class=Model(at tr0,attr1,…,attrn)
其中, attri,i∈[0,n]是按属性优先级排列的时空目标属性, n为属性数量; Model表示
定义的分类模型基 类;
遍历每一种行为模式, 依据属性优先级, 构建出判别逻辑链, 判别链类似决策树的一条
路径;
步骤3: 生成目标位置描述短语; 即: 识别轨迹列表在地图上所经历的区域, 并转化为相
对简单的文字短语; 包括以下步骤:
步骤3.1: 收集geojson数据, 生成Level0,Level1,…Levelm的多级区划地图, 其中Level0
由若干个Level1组成, 以此类 推;
为各级区划建立一组多叉树Ts, Ti∈Ts, Ti的根节点rooti为第0级区划, 其代表最粗粒度
划分的地图, rooti的孩子结点为将rooti进一步细分所得的第1级区划, 以此类推, 叶子结点
为最细粒度的Levelm级区划, 并为树中 的每一个结点建立指向父亲结点的映射以及指向对
应区划地图的映射;
步骤3.2: 基于步骤2中生成的空间线向量以及步骤3.1中生成的多级区划数据, 基于
“分治”思想, 层级细化对轨 迹所经过的区域进行计算;
步骤3.2.1: 首先, 采用Level0级区划地图, 依次遍历Level0中所有图层, 每个图层是一
个面向量, 对轨迹线向量
和Level0i做相交判定, 统计Level0级区域, 转步骤
3.2.2;
步骤3.2.2: 步骤3.2.1中统计的Level0级区域, 分别调取对应的Level1粒度区划地图;
重复以上步骤, 直到获得最细粒度Levelm的经过区域列表 Areasm, 转步骤3.2.3;
步骤3.3: 基于步骤3.1中建立的多叉树, 对步骤3.2中获得的Areasm列表中在地图上相
邻的区域进行合并, 将指向同一个父 亲结点的区划合并成上级区划;
步骤3.4: 遍历步骤3.3中生成的合并列表Areamerge, 对于每一项
做如下处
理:
步骤3.4.1: 依次遍历轨 迹点列表p1~pn, 将每一个点pi与
做Intersect判断;
步骤3.4.2: 统计与
相交的轨 迹点的数量CAmi;权 利 要 求 书 2/4 页
3
CN 114707511 A
3
专利 一种基于开源时空数据的时空目标描述文字生成方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:45:22上传分享