(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210776709.5 (22)申请日 2022.07.04 (65)同一申请的已公布的文献号 申请公布号 CN 114842365 A (43)申请公布日 2022.08.02 (73)专利权人 中国科学院地理科 学与资源研究 所 地址 100101 北京市朝阳区大屯路甲1 1号 专利权人 中国科学院合肥物质科 学研究院 (72)发明人 张超凡 陶泽兴 王琦 吴茂炜  丁子津  (74)专利代理 机构 北京正和明知识产权代理事 务所(普通 合伙) 11845 专利代理师 刘阳阳 李建刚(51)Int.Cl. G06V 20/17(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/766(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) 审查员 周永传 (54)发明名称 一种无人机航拍目标检测识别方法和系统 (57)摘要 本发明提出一种无人机航拍目标检测识别 方法和系统。 方法包括: 融合公开数据和实际采 集的数据, 构建大量的训练和测试数据库, 采用 旋转数据增强和Mosaic数据增强处理原始样本 图像, 丰富样本数量以及提高复杂背景和小目标 在样本中的比例; 设计加权循环的特征金字塔融 合不同尺度的特征图, 得到融合丰富语义信息和 几何位置 特征信息的特征图; 根据不同尺度大小 的特征图, 将分类和回归视为两个任务, 设计注 意力机制分别处理两个不同的任务, 获取鲁棒的 特征; 设计一种动态调节多任务损失的方法, 提 高网络模型的收敛速度; 设定一定的步长, 训练 网络, 探究权重大小对精度的影响, 得到使网络 泛化能力更强的权重, 从而实现对 无人机航拍目 标的准确检测识别。 权利要求书3页 说明书11页 附图6页 CN 114842365 B 2022.11.29 CN 114842365 B 1.一种无 人机航拍目标检测识别方法, 其特 征在于, 所述方法包括: 步骤S1、 收集 航拍目标的图像并建立图像数据集; 步骤S2、 对所述图像数据集中的图像进行 标注; 步骤S3、 采用融合旋转数据增强和Mosaic数据增强的样本数据增强方式, 对含有标注 的图像进行增强处 理, 得到处 理后的增强的图像数据集; 步骤S4、 将增强后的图像进行归一化处理, 输入模型的主干网络, 得到相应的第一特征 图; 步骤S5、 设计加权循环 的特征金字塔结构, 对不同分辨率的所述第一特征图添加不同 的权重, 得到融合丰富语义信息和几何位置特 征信息的第二特 征图; 在YOLOX原始的特征金字塔结构基础上进行处理, 将Darknet5的结果直接上采样和 Darknet5与Darknet4特征融合后的结果进行加权特征融合, 并将加权特征融合的结果直接 和Darknet3的结果进行融合, 将特征金字塔结构循环两次得到加权循环的特征金字塔结 构; 使用深度可分离卷积以减缓循环造成的参数量和计算 量的上升; 步骤S6、 根据不同尺度大小的第二特征图, 将无人机航拍目标检测识别中的分类和回 归视为两个任务, 分别提取特征, 获取不同任务的鲁棒特征, 获得类别、 位置信息和置信度 的预测结果; 步骤S7、 通过均衡难分类样本与易分类样本, 以及考虑不同的损失权重, 建立Focal   Loss函数; 建立Focal  Loss函数的具体公式为: Lnew=w1Liou+w2Lcls+w3FLconf 其中, Liou表示边界框的损失, Lcls表示类别的损失, FLconf表示置信度的损失; w1表示对 边界框的损失权 重, w2表示对类别的损失权 重, w3表示对置信度的损失权 重; 若用t表示epoc h次数, 即训练次数, 则w1、 w2和w3的计算公式为: 其中, w1′、 w2′和w3′为计算的过程变量, wn为更新计算后的权重; 在训练初试阶段, 前两 个epoch会先以1为权 重, 第三个epoc h会按照所述 w1、 w2和w3的计算公式进行计算; 步骤S8、 设定一定的步长, 训练模型, 探究模型的网络权重大小对精度的影响, 得到使 模型的网络泛化能力更强的权 重; 采用迁移学习的方式, 预训练所述主干网络的权重, 所述主干网络先冻结训练, 然后在权 利 要 求 书 1/3 页 2 CN 114842365 B 2所述图像数据集上进行微调, 微调后主干网络解冻, 参与模型的训练; 步骤S9、 应用训练好的模型做无 人机航拍目标的检测识别。 2.根据权利要求1所述的一种无人机航拍目标检测 识别方法, 其特征在于, 在所述步骤 S3中, 所述采用融合旋转数据增强和Mosaic数据增强的样本数据增强方式, 对含有标注的 图像进行增强处 理的方法包括: 采用albumentations库对图像以一定概率进行旋转增强, 同时以一定概率进行Mosaic 数据增强。 3.根据权利要求1所述的一种无人机航拍目标检测 识别方法, 其特征在于, 在所述步骤 S6中, 所述根据不同尺度大小的第二特征图, 将无人机航拍目标检测识别中的分类和回归 视为两个任务, 分别提取特征, 获取不同任务的鲁棒特征, 获得类别、 位置信息和置信度的 预测结果的方法包括: 设计基于多任务注意力机制的预测头, 通过融合通道注意力和 空间注意力机制, 分别 处理两个不同的任务, 获取不同任务的鲁棒特征, 然后, 将融合通道注意力和空间注意力机 制的每个特征层作为共享特征层, 再将共享特征层的特征通过Force  Attention  Block模 块, 获得类别、 位置信息和置信度的预测结果。 4.根据权利要求3所述的一种无人机航拍目标检测 识别方法, 其特征在于, 在所述步骤 S6中, 将共享特征层的特征通过Force  Attention  Block模块, 获得类别、 位置信息和置信 度的预测结果的方法包括: 采用第一个Force  Attention  Block模块, 将共享特征层的特征通过一层卷积学习注 意力的掩码, 将所述掩码的结果和另外一个共享特征层的特征相乘, 进而得到第三特征图; 同时在第二个Forc e Attention  Block模块和第三个For ce Attention  Block模块, 先将 共 享特征层的特征和前一个Force  Attention  Block模块的输出相加后, 再利用卷积学习注 意力掩码, 获得类别、 位置信息和置信度的预测结果。 5.一种用于无 人机航拍目标检测识别系统, 其特 征在于, 所述系统包括: 第一处理模块, 被 配置为, 收集 航拍目标的图像并建立图像数据集; 第二处理模块, 被 配置为, 对所述图像数据集中的图像进行 标注; 第三处理模块, 被配置为, 采用融合旋转数据增强和Mosaic数据增强的样本数据增强 方式, 对含有标注的图像进行增强处 理, 得到处 理后的增强的图像数据集; 第四处理模块, 被配置为, 将增强后的图像进行归一化处理, 输入基线模型的主干网 络, 得到相应的第一特 征图; 第五处理模块, 被配置为, 设计加权循环的特征金字塔结构, 对不同分辨率的所述第一 特征图添加不同的权 重, 得到融合丰富语义信息和几何位置特 征信息的第二特 征图; 在YOLOX原始的特征金字塔结构基础上进行处理, 将Darknet5的结果直接上采样和 Darknet5与Darknet4特征融合后的结果进行加权特征融合, 并将加权特征融合的结果直接 和Darknet3的结果进行融合, 将特征金字塔结构循环两次得到加权循环的特征金字塔结 构; 使用深度可分离卷积以减缓循环造成的参数量和计算 量的上升; 第六处理模块, 被配置为, 根据不同尺度 大小的第 二特征图, 将无人机航拍目标检测 识 别中的分类和回归视为两个任务, 分别提取特征, 获取不同任务的鲁棒特征, 获得类别、 位 置信息和置信度的预测结果;权 利 要 求 书 2/3 页 3 CN 114842365 B 3

.PDF文档 专利 一种无人机航拍目标检测识别方法和系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种无人机航拍目标检测识别方法和系统 第 1 页 专利 一种无人机航拍目标检测识别方法和系统 第 2 页 专利 一种无人机航拍目标检测识别方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:27:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。