专利基于注意力机制的驾驶行为检测模型训练方法及装置 -在线下载 -pdf文件-doc.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210763876.6 (22)申请日 2022.06.30 (71)申请人杭州电子科技大学地址 310018 浙江省杭州市下沙高教园区二号路1158号 (72)发明人徐海涛　赵际　陈婧　 (74)专利代理机构北京同立钧成知识产权代理有限公司 1 1205 专利代理师董建姣　臧建明 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/42(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于注意力机制的驾驶行为检测模型训练方法及装置 (57)摘要本申请实施例提供一种基于注意力机制的驾驶行为检测模型训练方法及装置。该方法包括：获取多个第一样本数据和多个第二样本数据，第一样本数据包括第一样本图像和第一样本图像的第一样本图像类型，第二样本数据中分别包括第二样本图像和第二样本图像的第二样本图像类型；通过多个第一样本数据对预设模型进行训练，得到第一模型，第一模型包括注意力模块、膨胀归一化模块、耦合模块和分类模块；依次通过注意力模块、膨胀归一化模块、耦合模块和分类模块对第二样本图像进行处理，得到预测图像类型；根据预测图像类型和第二样本图像类型，更新第一模型的模型参数。提高了模型检测驾驶行为的准确性。权利要求书2页说明书14页附图5页 CN 115223008 A 2022.10.21 CN 115223008 A 1.一种模型训练方法，其特征在于，包括：获取多个第一样本数据和多个第二样本数据，所述第一样本数据包括第一样本图像和所述第一样本图像的第一样本图像类型，所述第二样本数据中分别包括第二样本图像和所述第二样本图像的第二样本图像类型；通过所述多个第一样本数据对预设模型进行训练，得到第一模型，所述第一模型包括注意力模块、膨胀归一化模块、耦合模块和分类模块；依次通过所述注意力模块、所述膨胀归一化模块、所述耦合模块和所述分类模块对所述第二样本图像进行处理，得到预测图像类型，所述预测图像类型用于指示驾驶行为；根据所述预测图像类型和所述第二样本图像类型，更新所述第一模型的模型参数，所述第一模型用于检测所述驾驶行为。 2.根据权利要求1所述的方法，其特征在于，依次通过所述注意力模块、所述膨胀归一化模块、所述耦合模块和所述分类模块对所述第二样本图像进行处理，得到预测图像类型，包括：通过所述注意力模块对所述第二样本图像进行特征提取处理，得到第一图像特征信息；通过所述膨胀归一化模块对所述第一图像特征信息进行多尺度特征处理，得到多尺度特征信息；通过所述耦合模块对所述多尺度特征信息进行耦合处理，得到全局特征信息；通过所述分类模块对所述全局特征信息进行处理，得到所述预测图像类型。 3.根据权利要求2所述的方法，其特征在于，所述注意力模块包括至少一个残差层和至少一个注意力层，所述至少一个残差层和所述至少一个注意力层间隔分布；通过所述注意力模块对所述第二样本图像进行特征提取处理，得到第一图像特征信息，包括：按照所述至少一个残差层和所述至少一个注意力层的排列顺序，依次对所述第二样本图像进行处理，以得到所述第一图像特征信息；其中，所述残差层用于对接收的信息进行特征提取处理，所述注意力层用于根据接收到的信息确定注意力特征图，所述注意力特征图中的像素用于指示所述像素为感兴趣对象的概率，所述第一图像特征信息为所述注意力模块中最后一层输出的信息。 4.根据权利要求2或3所述的方法，其特征在于，所述膨胀归一化模块包括M个膨胀卷积层和池化层，所述M个膨胀卷积层的膨胀率不同，所述M为大于或等于1的整数；通过所述膨胀归一化模块对所述第一图像特征信息进行多尺度特征处理，得到多尺度特征信息，包括：通过所述M个膨胀卷积层分别对所述第一图像特征信息进行处理，得到M个特征信息，所述M个特征信息的尺度不同；通过所述池化层对所述M个特征信息进行池化处理，得到所述多尺度特征信息。 5.根据权利要求2 ‑4任一项所述的方法，其特征在于，通过所述耦合模块对所述多尺度特征信息进行耦合处理，得到全局特征信息，包括：确定耦合策略，所述耦合策略中包括归一化方法和特征融合方法；通过所述归一化方法对所述多尺度特征信息进行归一化处理，以及通过所述特征融合权　利　要　求　书 1/2 页 2 CN 115223008 A 2方法对所述归一化处理后得到的信息进行融合处理，以得到所述全局特征信息；所述耦合处理包括所述归一化处理和所述融合处理。 6.根据权利要求2 ‑5任一项所述的方法，其特征在于，所述分类模块包括全连接层和分类层；通过所述分类模块对所述全局特征信息进行处理，得到所述预测图像类型，包括：通过所述全连接层对所述全局特征信息进行组合处理，得到目标特征信息；通过所述分类模块对所述目标特征信息进行分类处理，得到所述预测图像类型。 7.一种模型训练装置，其特征在于，所述装置包括：获取模块，用于获取多个第一样本数据和多个第二样本数据，所述第一样本数据包括第一样本图像和所述第一样本图像的第一样本图像类型，所述第二样本数据中分别包括第二样本图像和所述第二样本图像的第二样本图像类型；训练模块，用于通过所述多个第一样本数据对预设模型进行训练，得到第一模型，所述第一模型包括注意力模块、膨胀归一化模块、耦合模块和分类模块；处理模块，用于依次通过所述注意力模块、所述膨胀归一化模块、所述耦合模块和所述分类模块对所述第二样本图像进行处理，得到预测图像类型，所述预测图像类型用于指示驾驶行为；更新模块，用于根据所述预测图像类型和所述第二样本图像类型，更新所述第一模型的模型参数，所述第一模型用于检测驾驶行为。 8.一种模型训练设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至 6中任一项所述的方法。 9.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，其中，所述计算机指令用于使所述计算机执行根据权利要求1至 6中任一项所述的方法。 10.一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现权利要求1至6任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115223008 A 3

专利 基于注意力机制的驾驶行为检测模型训练方法及装置

专利基于注意力机制的驾驶行为检测模型训练方法及装置