(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210225813.5
(22)申请日 2022.03.07
(71)申请人 合肥工业大 学
地址 230009 安徽省合肥市包河区屯溪路
193号
(72)发明人 章倩 张强 王安宁 王婉莹
唐孝安 杨善林
(74)专利代理 机构 北京久诚知识产权代理事务
所(特殊普通 合伙) 11542
专利代理师 郭子辰
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06F 16/9537(2019.01)
G06F 40/30(2020.01)G06K 9/62(2022.01)
(54)发明名称
基于出行目的的驾驶人出行模式挖掘方法
和系统
(57)摘要
本发明提供了一种基于出行目的的驾驶人
出行模式挖掘方法和系统, 涉及数据挖掘技术领
域。 本发明通过利用LDA语义模型识别私家车驾
驶人的出行目的, 同时利用驾驶人的出行目的来
挖掘出行模式, 并考虑了移动语义和位置语义两
个方面的特征, 根据驾驶人出行的时空特征能够
识别出每一日期类型下驾驶人的出行目的, 并能
够得到每个驾驶人关于出行目的的概率分布; 基
于每个驾驶人关于出行目的的概率分布聚类驾
驶人, 得出每个日期类型下的驾驶人类群, 基于
出行目的能够得到驾驶人类群的出行模式, 可以
帮助企业了解这些需求, 采取相应的策略响应驾
驶人的需求, 或者针对不同的类群制定不同的宣
传策略。
权利要求书2页 说明书12页 附图3页
CN 114780670 A
2022.07.22
CN 114780670 A
1.一种基于出 行目的的驾驶人 出行模式挖掘方法, 其特 征在于, 该 方法包括:
获取不同驾驶人的出 行片段;
基于日期类型划分规则对驾驶人的出行片段进行分类, 并在每一个日期类型下对驾驶
人的出行片段提取其时空特征; 所述时空特征包括到达时间类型、 停留时长类型以及到达
点POI类型;
将每个日期类型下的每个驾驶人的所有出行时空特征作为一个文档, 利用LDA模型识
别每个日期类型下所有驾驶人的出行目的, 得到用于表达出行目的与时空特征关系的主
题‑词汇概率分布和用于表达驾驶人与出行目的关系的文档 ‑主题概率分布; 并基于主题 ‑
词汇概率分布获取 各个出行目的的描述;
基于文档 ‑主题概率分布对每个日期类型下的驾驶人进行聚类, 得到若干个驾驶人类
群, 每个类群表示具有某种相同出 行模式的驾驶人集 合;
结合出行目的的描述以及聚类结果对出 行模式进行挖掘。
2.如权利要求1所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 所
述获取不同驾驶人的出 行片段, 包括:
获取车辆的行程数据, 并进行 数据清洗;
基于发动机状态对行程数据进行划分, 得到出 行记录;
基于停车时间对出 行记录进行划分, 得到出 行片段。
3.如权利要求1所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 所
述基于日期 类型划分规则对驾驶人的出行片段进 行分类, 并在每一个日期 类型下对驾驶人
的出行片段提取其时空特 征, 包括:
日期类型划分为四个部分, H={h0,h1,h2,h3}, 其中h0表示周一至周四, 去除节假日; h1
是指周五以及节假日的前一天; h2是指周六去除节假日; h3是指周日以及节假日;
且到达时间类型包括:
at={slot‑1,slot‑2,slot‑3,slot‑4,slot‑5}
其中, slot ‑1代表的结束时间的小时时刻区间为[0,5], slot ‑2为[6,10], slot ‑3为
[11,14], sl ot‑4为[15,19], sl ot‑5为[20,23]
停留时长类型包括:
sd={shor t‑stay,mid ‑stay,long‑stay,long‑long‑stay}
其中, short ‑stay表示停留时长小于1小时; mid ‑stay表示停留时长大于等于1小时并
且小于3小时; long ‑stay表示停留时长大于等于3小时并且小于8小时; long ‑long‑stay表
示停留时长大于8小时;
达点POI类型包括:
POIall={POI1,POI2,POI3,POI4,POI5,POI6,POI7}
其中, POI1表示高德地图中的大类 ‘商务住宅 ’和‘住宿服务 ’; POI2表示大类“公司企业 ”
和“政府机构 ”; POI3表示大类“生活服务 ”、“汽车服务 ”、“汽车销售 ”、“汽车维修 ”、“医疗保
健”、“金融保险 ”和“交通设施 ”; POI4表示大类“科教文化 ”; POI5表示大类“餐饮服务 ”; POI6
表示大类“购物服务”、“体育休闲 ”和“风景名胜 ”; POI7表示高德地图中的其 他的大类。
4.如权利要求1所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 所
述将每个日期类型下的每个驾驶人的所有出行时空特征作为一个文档, 利用LDA模型识别权 利 要 求 书 1/2 页
2
CN 114780670 A
2每个日期类型下所有驾驶人 的出行目的, 得到用于表达出行目的与时空特征关系的主题 ‑
词汇概率分布和用于表达驾驶人与出 行目的关系的文档 ‑主题概率分布, 包括:
文档
为:
其中, n表示驾驶人u在日期类型hi下的出行片段总数; (at+sd+POI)表示出行片段对应
的时空特 征; at到达时间类型; sd停留时长类型; POI表示到 达点POI类型;
则日期类型hi下的所有 文档为:
其中m为驾驶人总数。
5.如权利要求4所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 在
训练LDA模型时包括:
依据经验值设置参数
β =0.01, 利用Gibbs采样迭代, k表示变化的主题数,
根据困惑度值越小效果越好的原则确定最终的主题数 K;
将得到的主题数K作为Gibbs采样的输入, 同样根据困惑度值越小效果越好的原则确定
最终的参数α 值;
将K、 α和β 作为 Gibbs采样的输入, 将日期类 型hi下所有文档作为LDA主题模型的输入, 利
用Gibbs采样方法训练LDA模型, 得到日期类型hi对应的主题 ‑词汇概率分布P{ST|Topic}i和
文档‑主题概率分布P{Topo ic|u}i。
6.如权利要求1所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 所
述基于文档 ‑主题概率分布对每个日期 类型下的驾驶人进行聚类, 得到若干个驾驶人类群,
每个类群表示具有某种相同出 行模式的驾驶人集 合, 包括:
采用k‑means算法进行聚类, 使用簇内误差平方和SSE评估聚类性能, 利用手肘法确定
最优类别数。
7.如权利要求1所述的一种基于出行目的的驾驶人出行模式挖掘方法, 其特征在于, 所
述结合出 行目的的描述以及聚类结果对出 行模式进行挖掘, 包括:
结合对各出行目的的描述以及聚类结果, 对各个类群中的驾驶人的出行模式进行分
析, 得到不同日期类型 下的每个类群的主要出行模式以及描述。
8.一种基于出行目的的驾驶人出行模式挖掘系统, 所述系统包括存储器、 处理器以及
存储在存储器上并可在处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计
算机程序时实现上述权利要求1 ‑7任一所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114780670 A
3
专利 基于出行目的的驾驶人出行模式挖掘方法和系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:48:54上传分享