国家标准网
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
首页
仅15元无限下载
联系我们
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210210394.8 (22)申请日 2022.03.03 (71)申请人 戎行技术有限公司 地址 300143 天津市河北区铁东路街道 志 成路130号(自创区河北分园科技招商 展示服务中心407-1室) (72)发明人 赵志庆 侯玉柱 王巍 董席峰 丁英莲 靳学庚 (74)专利代理 机构 济南千慧专利事务所(普通 合伙企业) 37232 专利代理师 傅静 (51)Int.Cl. G06F 16/9535(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01)G06N 20/00(2019.01) G06Q 30/02(2012.01) G06Q 50/00(2012.01) (54)发明名称 一种基于机器学习勾勒人物画 像的方法、 设 备、 存储介质 (57)摘要 本申请公开了一种基于机器学习勾勒人物 画像的方法、 设备、 存储介质, 该方法包括: 获取 用户兴趣爱好样本数据, 根据兴趣爱好数据训练 得到兴趣爱好模型; 获取用户 习惯样本数据, 根 据习惯样 本数据训练得到行为习惯模 型; 获取用 户作息习惯样本数据, 根据作息习惯样本数据训 练得到作息习惯模型; 获取用户行动轨迹样本数 据, 根据行动轨迹样本数据训练得到行动轨迹模 型; 采集目标人物的开源信息, 将开源信息存储 到搜索引擎Elasticsearch中; 根据兴趣爱好模 型、 行为习惯模型、 作息习惯模型、 行动轨迹模型 生成API接口; 通过调用对应的API接口, 按格式 传参, 通过各个模型分析开源信息得到目标人物 的画像。 权利要求书3页 说明书8页 附图2页 CN 114595387 A 2022.06.07 CN 114595387 A 1.一种基于 机器学习勾勒人物 画像的方法, 其特 征在于, 包括: 获取用户兴趣爱好样本数据, 根据所述兴趣爱好数据训练得到兴趣爱好模型; 获取用户习惯样本数据, 根据所述习惯样本数据训练得到行为习惯模型; 获取用户作息习惯样本数据, 根据所述作息习惯样本数据训练得到作息习惯模型; 获取用户行动轨 迹样本数据, 根据所述行动轨 迹样本数据训练得到行动轨 迹模型; 采集目标 人物的开源信息, 将所述 开源信息存 储到搜索引擎Elasticsearc h中; 根据所述兴趣爱好模型、 所述行为习惯模型、 所述作息习惯模型、 所述行动轨迹模型生 成API接口; 通过调用对应的API接口, 按格 式传参, 通过各个模型分析所述开源信息得到目标人物 的画像。 2.根据权利要求1所述的方法, 其特征在于, 所述获取用户兴趣爱好样本数据, 根据所 述兴趣爱好数据训练得到兴趣爱好模型, 具体包括: 获取社交平台上的基础数据, 作为训练样本集, 对所述基础数据中的文案进行语义分 析; 根据所述语义分析 结果标记对应的兴趣爱好标签; 将标记好兴趣爱好标签的训练样本集输入到所述兴趣爱好模型进行训练, 得到第 一代 兴趣爱好模型; 将检测数据集输入所述第一代兴趣爱好模型中, 输出兴趣爱好标签; 基于工作人员设置, 删除所述检测数据集中输出 结果不准确的数据; 将去除不准确的数据后的检测数据集作为训练样本集输入所述第一代兴趣爱好模型 进行训练, 得到第二代兴趣爱好模型; 多次将检测数据集转换为训练样本集后对兴趣爱好模型进行训练, 以使所述兴趣爱好 模型判断逐渐精确。 3.根据权利要求1所述的方法, 其特征在于, 所述获取用户习惯样本数据, 根据所述习 惯样本数据训练得到行为习惯模型, 具体包括: 获取社交平台上的基础数据, 作为训练样本集, 对所述基础数据中的文案进行语义分 析; 根据所述语义分析 结果标记对应的行为习惯标签; 将标记好行为习惯标签的训练样本集输入到所述行为习惯模型进行训练, 得到第 一代 行为习惯模型; 将检测数据集输入所述第 一代行为习惯模型中, 输出时间标签和对应所述 时间标签的 行为标签; 基于工作人员设置, 删除所述检测数据集中输出 结果不准确的数据; 将去除不准确的数据后的检测数据集作为训练样本集输入所述第一代行为习惯模型 进行训练, 得到第二代行为习惯模型; 多次将检测数据集转换为训练样本集后对行为习惯模型进行训练, 以使所述行为习惯 模型判断逐渐精确。 4.根据权利要求1所述的方法, 其特征在于, 所述获取用户作息习惯样本数据, 根据所 述作息习惯样本数据训练得到作息习惯模型, 具体包括:权 利 要 求 书 1/3 页 2 CN 114595387 A 2获取社交平台上的基础数据, 作为训练样本集, 对所述基础数据中的文案进行语义分 析; 根据所述语义分析 结果标记对应的作息习惯标签; 将标记好作息习惯标签的训练样本集输入到所述作息习惯模型进行训练, 得到第 一代 作息习惯模型; 将检测数据集输入所述第 一代作息习惯模型中, 输出时间标签和对应所述 时间标签的 作息习惯; 基于工作人员设置, 删除所述检测数据集中输出 结果不准确的数据; 将去除不准确的数据后的检测数据集作为训练样本集输入所述第一代作息习惯模型 进行训练, 得到第二代作息习惯模型; 多次将检测数据集转换为训练样本集后对作息习惯模型进行训练, 以使所述作息习惯 模型判断逐渐精确。 5.根据权利要求1所述的方法, 其特征在于, 所述获取用户行动轨迹样本数据, 根据所 述行动轨 迹样本数据训练得到行动轨 迹模型, 具体包括: 获取社交平台上的基础数据, 作为训练样本集, 对所述基础数据中的文案进行语义分 析; 根据所述语义分析 结果标记对应的行动轨 迹标签; 将标记好行动轨迹标签的训练样本集输入到所述行动轨迹模型进行训练, 得到第 一代 行动轨迹模型; 将检测数据集输入所述第 一代行动轨迹模型中, 输出时间标签和对应所述 时间标签的 行动轨迹标签; 基于工作人员设置, 删除所述检测数据集中输出 结果不准确的数据; 将去除不准确的数据后的检测数据集作为训练样本集输入所述第一代行动轨迹模型 进行训练, 得到第二代行动轨 迹模型; 多次将检测数据集转换为训练样本集后对行动轨迹模型进行训练, 以使所述行动轨迹 模型判断逐渐精确。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取用户在社交平台发布的动态中的图片信息; 对所述图片进行场景识别, 判断所述图片中的场景 是否为标志 物、 车票、 机票; 若为标志 物, 查询所述标志 物对应的标签, 根据所述标签确定所述用户的行动地 点; 若为车票, 识别所述车票中的起 点和终点, 确定所述用户的行动轨 迹。 7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取用户的发布动态的文案时间以及文案内容, 对所述文案内容进行语义分析; 确定语义和时间所占的权重, 根据 所述动态发布的时间和所述语义分析结果确定一条 动态的得分; 确定得分最高的动态对应的发布的时间作为作息时间。 8.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 在获得各个模型的样本数据后, 对所述样本数据进行 预处理, 包括: 通过筛选去掉只有唯一 值的特征, 去掉缺失值超过90%的特 征;权 利 要 求 书 2/3 页 3 CN 114595387 A 3
专利 一种基于机器学习勾勒人物画像的方法、设备、存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 17:45:34
上传分享
举报
下载
原文档
(470.9 KB)
分享
友情链接
邢台市工业企业大气污染防治条例.pdf
GB-T 22186-2016 信息安全技术 具有中央处理器的IC卡芯片安全技术要求.pdf
GB-T 23950-2009 无机化工产品中重金属测定通用方法.pdf
GB-T 33887-2017 无损检测仪器 工业光纤内窥镜检测仪.pdf
GB-T 33041-2016 中国陆地木材腐朽与白蚁危害等级区域划分.pdf
GB-T 38633-2020 信息技术 大数据 系统运维和管理功能要求.pdf
GB-T 28507-2012 互联网文本语音展现通用描述规范.pdf
XF 869-2010 消防员灭火防护头套.pdf
GA 1800.6-2021 电力系统治安反恐防范要求 第6部分:核能发电企业.pdf
T-GSWX 011—2023 住宅小区物业清洁服务标准.pdf
T-XMYXH 0001—2023 厦门市医疗机构“规范药房”管理指南.pdf
GB-T 2007.2-1987 散装矿产品取样、制样通则 手工制样方法.pdf
JFrog 中国解决方案架构师 企业级DevSecOps 开源治理方案演讲之路.pdf
德勤中国 数字化时代下的网络安全战略框架系列之三.pdf
GB-T 32923-2016 信息技术 安全技术 信息安全治理 .pdf
T-CSAE 190.4—2021 汽车用轮毂电动轮总成可靠性试验方法.pdf
GB-T 41621-2022 科学技术研究项目评价实施指南 开发研究项目.pdf
NY-T 4022-2021 玉米品种真实性鉴定 SNP标记法.pdf
GB-T 18513-2022 中国主要进口木材名称.pdf
GB-T 38395-2019 煤焦油 硫和氮含量的测定.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(470.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。