(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210811820.3 (22)申请日 2022.07.11 (71)申请人 北京航空航天大 学 地址 100191 北京市海淀区学院路37号 申请人 北京京航计算 通讯研究所 (72)发明人 王磊 王瑞生 白洋 张依漪  (74)专利代理 机构 北京卓特专利代理事务所 (普通合伙) 11572 专利代理师 段旺 田冰 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 20/10(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 基于teach er-student模型的半监督目标检 测方法 (57)摘要 提供了基于teach er‑student模型的半监督 目标检测方法。 包括以下步骤: 获取半监督目标 检测数据集D; 在有标注数据集DL上按照全监督 目标检测方法, 用模型预测样本 的标注得到 teacher模型; 利用的teacher模型, 对无标签数 据XU做预测, 生成伪标签, 并用伪标签更新标注 集合YU; 对无标注样本集合XU进行数据增强第 五 步, 训练student模型; 将student模型的权重参 数θs以指数滑动平均的方式更新至teacher模 型的权重θt中; 进行数轮迭代, 以最终的 teacher模型作为所述基于teacher ‑student模 型的半监 督目标检测方法训练的目标模型。 权利要求书2页 说明书6页 附图2页 CN 115115886 A 2022.09.27 CN 115115886 A 1.一种基于teacher ‑student模型的半监督目标检测方法, 其特征在于, 包括以下步 骤: 第一步, 获取半监督目标检测数据集D, 其中, 半监督目标检测数据集D的元素来源于有 标注数据集DL和无标注数据集DU; 获取有标注数据集 N为有标注数据集中样本的数目, 其样本的集合 记为 分别为第1, 2, …, N个样本; 相应的标注的集合记为 分别为 对应的标注信息, 对于DL中每一个元素 可记为由样本 和标注 形成的二元组 i为正整数; 获取无标注数据集 M为无标注数据集中样本的数目对于DU中每一 个元素 可记为由样本 和标注 形成的二元组 来自于无标注样本 集合 来自于无标注样本的标注集合 其中YU为 其中的元 素 也为空, 在接下来 生成伪标签的步骤中为元 素 赋值; 第二步, 在有标注数据集DL上按照全监督目标检测方法, 对于每个输入的样本 用模 型预测样本 的标注, 使之和真实标注 尽量保持一致, 通过优化损失函数训练得到 teacher模型; ‑ 第三步, 利用的teach er模型, 对无标签 数据XU做预测, 将得到的预测结果进行置信 度阈 值过滤后生成伪标签, 并用伪标签更新标注集 合YU; 第四步, 对无标注样本集合XU进行数据增强, 包括遮挡、 平移、 旋转、 翻转、 颜色变换、 色 彩抖动和/或高斯模糊, 得到的集合记为记为 对第三步中更新后的标注集合YU也做相应 调整, 将调整后的标注集 合记为 得到扩充无 标签数据集 第五步, 训练student模型; 训练起始时将teacher模型的全部参数赋值给student模型 初始化, 并让student模型在扩充后的全部数据集 上再次训练; 训练时, 在每个 批次中将DL与 两部分数据进行一定比例的混合, 作为一个批次的数据送入student模型, 并以标注集合YL和前述步骤中生成的集合 作为监督信息进行训练, 计算并优化损失函 数, 得到st udent模型; 还利用一致正则化对扩充无标签数据集 在训练中产生的损失函 数 作约束; 迭代训练数个 轮次, 直至模型损失函数收敛至稳定结果; 第六步, 将student模型的权重参数θs以指数滑动平均的方式更新至teacher模型的权 重θt中; 该步骤要求: 对于student模型中全部可以训练的参数θs, 以 的公式将teac her模型权 重θt迭代更新, 其中j为当前迭代次数, a为 参数更新权重; 第七步, 按照第三步至第六步的操作进行数轮迭代, 每一轮迭代中将teacher模型输出 的集合 作为监督信息训练student模 型, 并将student模 型参数更新至teacher模 型中, 在 下一轮迭代中使用更新的teacher模型对XU重新预测, 将生成的结果作为新 的伪标签信息 监督student模型的训练; 如此循环往复, 直至student模型损失函数在迭代中收敛稳定; 以 最终的teacher模型作为所述基于teacher ‑student模型的半监督目标检测方法训练的目 标模型。权 利 要 求 书 1/2 页 2 CN 115115886 A 22.根据权利要求1所述的方法, 其中所述第一步包括收集图像数据, 建立数据集; 对其 中部分图像数据作完全且精确的标定框标注, 该部 分图像数据在所接收的图像数据中的比 例不超过20%; 该部分图像数据集即为XL, 其相应的标注记为YL; 其余无标注的图像数据集 记为XU。 3.根据权利要求1所述的方法, 其中所述第二 步中的目标检测学习方法包括: 一、 使用特征提取网络提取图像特征, 其中特征提取网络包括VGG, ResNet, Mobilenet, RetinaNet或者Ef ficientNet; 二、 使用特征加工网络对图像特征做进一步提取与优化, 其中特征加工网络包括BAM, CBAM, SPP, FPN和/或NAS ‑FPN; 三、 使用目标检测头预测目标的种类与位置, 其中目标检测头包括SSD, YOLO, Faster   RCNN或者CenterNet; 四、 优化损失函数将输出的预测结果与标注信息保持一致, 损失函数定义为 此处数据来源于DL, 即xi为样本集合XL的元素, yi为标注集合YL的元素; θ为 teacher模型内的可学习参数; 损失函数P(xi|yi, θ )的形式包括MSE, L2, IoU  loss或者Focal   loss。 4.根据权利要求2所述的方法, 所述第三步中, 使用所述teacher模型, 将XU作为待预测 数据输入所述teacher模型, 得到的结果即为该部分数据的预测标签, 称其为伪标签, 并用 伪标签更新标注集 合YU。 5.根据权利要求1所述的方法, 所述第 四步中, 使用的数据增强方法包括图像的遮挡、 平移、 旋转、 翻转、 颜色变换、 色彩抖动和/或高斯模糊; 其中, 遮挡会将图片上随机选取的一 定大小方框填充为纯色色块, 以起到遮挡屏蔽的作用; 平移指将图像整体 向各个方向平移 一定距离; 旋转指图像以图像中心作顺时针或逆时针的旋转; 翻转指以图像的中心垂直轴 或水平轴作翻转; 颜色变换指将数据集的RGB图像转换为HSV或者灰度图像等; 色彩抖动通 过对构成图像的色相产生位移, 造成临近点状差异的色彩交叉效果; 高斯模糊指图像与正 态分布做卷积, 使图像模糊化, 可视作一低通滤波器。 6.根据权利要求1所述的方法, 所述第五步中, 训练过程中数据的混合方法如下: 一个 批次的训练中, 分别从DL与 中随机各取出部分数据, 两者之间 的比例定为一 固定值δ, 该 值的选取视具体项目而定 。 7.根据权利要求3所述的方法, 所述第五步中, 所述Student模型的损失函数形式与所 述teacher模型保持一 致, 即 仅数据来源变更为全部数据集 8.根据权利要求1所述的方法, 所述第五步 中, teacher模型与student模型具有完全一 致的可学习参数, 且训练前student模型参数数值也与teacher模 型完全相同, 故称student 模型为teac her模型的一份完全拷贝。 9.一种信息处理设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的 程序, 行所述程序时实现, 其特征在于, 所述计算机程序由处理器执行时实现如权利要求1 至8任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115115886 A 3

.PDF文档 专利 基于teacher-student模型的半监督目标检测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于teacher-student模型的半监督目标检测方法 第 1 页 专利 基于teacher-student模型的半监督目标检测方法 第 2 页 专利 基于teacher-student模型的半监督目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:29:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。