专利一种基于开源时空数据的时空目标描述文字生成方法 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210275512.3 (22)申请日 2022.03.21 (71)申请人北京理工大学地址 100081 北京市海淀区中关村南大街5 号 (72)发明人刘维康　张华平　商建云　 (74)专利代理机构北京正阳理工知识产权代理事务所(普通合伙) 11639 专利代理师张利萍 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 16/215(2019.01) G06F 16/29(2019.01) G06F 16/9537(2019.01) (54)发明名称一种基于开源时空数据的时空目标描述文字生成方法 (57)摘要本发明涉及一种基于开源时空数据的时空目标描述文字生成方法，属于时空数据分析与挖掘技术领域。本方法通过分析时空目标数据的特点，经过数据清洗、行为描述短语生成、位置描述短语生成和目标描述生成，提取时空目标活动轨迹的语义信息，生成目标活动状态文字描述，可用于时空数据语义理解等。本方法能够对不含显示语义信息的时空数据进行理解，能够准确、高效地分析时空数据中各时空目标的行为模式，并能够准确识别时空数据在地图上所经过的地理位置，不依赖于在线网络，可以实现面向海量时空数据的快速语义感知，为时空数据语义分析提供技术支撑。本发明拓展了时空数据的应用范围，具有良好的应用前景。权利要求书4页说明书8页附图4页 CN 114707511 A 2022.07.05 CN 114707511 A 1.一种基于开源时空数据的时空目标描述文字生成方法，其特征在于，包括以下步骤：步骤1：对时空目标轨迹数据进行清洗，在保证数据规模的情况下，对原始的轨迹实现归一化压缩；步骤2：生成目标行为描述短语；即：识别目标的活动意图，并与历史记录作比较，生成特定的文字描述；步骤2.1：计算目标轨迹形状；对时空目标的轨迹形状归类： {Dot:0,StraightLine:1,Circle:2,Ring:3,Mass: 4}，其中， Dot表示点型， StraightLine表示直线型， Circle表示类圆型， Ring表示圆环型， M ass表示混乱型；其中，轨迹形状归类方法如下：步骤2.1.1：对于一条轨迹序列Hi＝{p1,p2,...,pn}，如果轨迹序列中所有点的坐标偏移量小于阈值 δdot，则将轨迹归类为Dot型；否则转步骤2.1.2；其中，地球上的两点X＝<lat1,lon 1>和Y＝<lat2,lon2> 空间距离DisXY，采用Hav erSine 公式计算： DisXY＝HaverSi n(vLat)+coslat1* coslat2*HaverSin(vLon) vLat＝abs(lat1 ‑lat2) vLon＝abs(lon1‑lon2) 其中， vlat代表点X的纬度和点Y 的纬度差的绝对值， vlon代表点X的经度和点Y 的经度差的绝对值； HaverSin()表示半正矢公式； abs()代表取绝对值； cos表示余弦函数； lat、 lon均表示弧度，通过将角度形式经纬度转换得到，转换公式为：其中， radian代表弧度， degre es代表角度， π表示圆周率；步骤2.1.2：连接点p1和点pn形成一条直线计算p2～pn‑1所有点到线段的距离diH， 1<i<n；如果diH的最大值不大于设定的阈值δd，则将轨迹归类为StraightLine型；否则转步骤2.1.3；其中，点pi到直线lineH的距离diH由下式计算：其中， lon1、 lat1、 lon2、 lat2分别是直线lineH两端点的经纬度角度坐标， loni、 lati是点pi角度坐标；步骤2.1.3：将所有点p1～pn连接起来，形成一条空间线向量获取该线向量的重心权　利　要　求　书 1/4 页 2 CN 114707511 A 2以为圆心，以与点p1的空间距离为半径ri作圆Zi，统计Hi中落在该圆内的点的数量如果大于设定的阈值 δZ，则转步骤2.1.5，否则转步骤2.1.4；步骤2.1.4：以ri的3/4为半径作小圆Zi2，统计Hi中落在小圆Zi2中的点的数量如果小于设定的阈值 δC，则将轨迹形状归类为Ri ng型，否则归类为Circle 型；步骤2.1.5：如果不满足以上任意形状的轨迹，则归类为Mas s型；步骤2.1.6：轨迹增加Shape属性，其值为其轨迹形状id；步骤2.2：为轨迹数据中的各项属性设定优先级权重，优先级排布为0、 1、 2 …，数字越小，优先级越高，得到属性集列表，并确定各属性的取值是 “范围”类还是“有限集”类；步骤2.3：建立任务与属性的决策链；基于步骤2.2中设定的属性优先级，构建基于规则式的分类模型clas s，如下式所示： class＝Model(at tr0,attr1,…,attrn) 其中， attri,i∈[0,n]是按属性优先级排列的时空目标属性， n为属性数量； Model表示定义的分类模型基类；遍历每一种行为模式，依据属性优先级，构建出判别逻辑链，判别链类似决策树的一条路径；步骤3：生成目标位置描述短语；即：识别轨迹列表在地图上所经历的区域，并转化为相对简单的文字短语；包括以下步骤：步骤3.1：收集geojson数据，生成Level0,Level1,…Levelm的多级区划地图，其中Level0 由若干个Level1组成，以此类推；为各级区划建立一组多叉树Ts， Ti∈Ts， Ti的根节点rooti为第0级区划，其代表最粗粒度划分的地图， rooti的孩子结点为将rooti进一步细分所得的第1级区划，以此类推，叶子结点为最细粒度的Levelm级区划，并为树中的每一个结点建立指向父亲结点的映射以及指向对应区划地图的映射；步骤3.2：基于步骤2中生成的空间线向量以及步骤3.1中生成的多级区划数据，基于 “分治”思想，层级细化对轨迹所经过的区域进行计算；步骤3.2.1：首先，采用Level0级区划地图，依次遍历Level0中所有图层，每个图层是一个面向量，对轨迹线向量和Level0i做相交判定，统计Level0级区域，转步骤 3.2.2；步骤3.2.2：步骤3.2.1中统计的Level0级区域，分别调取对应的Level1粒度区划地图；重复以上步骤，直到获得最细粒度Levelm的经过区域列表 Areasm，转步骤3.2.3；步骤3.3：基于步骤3.1中建立的多叉树，对步骤3.2中获得的Areasm列表中在地图上相邻的区域进行合并，将指向同一个父亲结点的区划合并成上级区划；步骤3.4：遍历步骤3.3中生成的合并列表Areamerge，对于每一项做如下处理：步骤3.4.1：依次遍历轨迹点列表p1～pn，将每一个点pi与做Intersect判断；步骤3.4.2：统计与相交的轨迹点的数量CAmi；权　利　要　求　书 2/4 页 3 CN 114707511 A 3

专利 一种基于开源时空数据的时空目标描述文字生成方法

专利一种基于开源时空数据的时空目标描述文字生成方法