(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202110838538.X
(22)申请日 2021.07.23
(71)申请人 中国科学院自动化研究所
地址 100190 北京市海淀区中关村东路95
号
申请人 中国航空工业 集团公司成 都飞机设
计研究所
(72)发明人 高阳 陈琳 王彦雄 常惠
何少钦
(74)专利代理 机构 北京路浩知识产权代理有限
公司 11002
代理人 李文丽
(51)Int.Cl.
G06F 30/15(2020.01)
G06F 30/27(2020.01)G06N 3/12(2006.01)
G06F 119/14(2020.01)
(54)发明名称
飞行器对抗决策方法及装置
(57)摘要
本发明提供一种飞行器对抗决策方法及装
置, 所述方法包括: 编码生成初始的分类器种群,
分类器种群中的分类器个体的编码包括飞行器
的攻击信息; 计算分类器个体的适应度值, 并基
于适应度值对分类器种群进行遗传算法的选择
操作, 根据交叉概率对分类器种群进行遗传算法
的交叉操作, 根据变异概率对分类器种群进行遗
传算法的变异操作, 基于得到的新的分类器种群
获取最优分类器个体; 判断是否满足预设终止条
件, 若不满足, 则将计算得到的种群多样性及种
群进化速度输入至模糊控制器更新变异概率和
交叉概率后重复执行遗传迭代 流程, 直至达到预
设终止条件。 本发明提供的飞行器对抗决策方法
及装置, 实现了对飞行器对抗决策方法的优化,
同时提高了决策效率。
权利要求书3页 说明书18页 附图5页
CN 113962013 A
2022.01.21
CN 113962013 A
1.一种飞行器对抗决策 方法, 其特 征在于, 包括:
初始化流程, 包括: 编码生成初始的分类器种群; 其中, 所述分类器种群中的分类器个
体的编码包括飞行器的攻击信息;
遗传迭代流程, 包括: 计算所述分类器个体的适应度值, 并基于所述适应度值对所述分
类器种群进行遗传算法的选择操作, 根据交叉概率对所述分类器种群进 行遗传算法的交叉
操作, 根据变异概率对所述分类器种群进行遗传算法的变异操作, 基于得到的新的所述分
类器种群获取最优分类 器个体;
模糊控制流程, 包括: 判断是否满足预设终止条件, 若不满足, 则计算种群多样性及种
群进化速度, 并将所述种群多样性及所述种群进化速度输入至模糊控制器更新所述变异 概
率和所述交叉概 率后重复执 行所述遗传迭代流 程, 直至达到所述预设终止条件。
2.根据权利要求1所述的飞行器对抗决策方法, 其特征在于, 所述方法还包括: 基于所
述最优分类器个体的所述编 码获取最优对抗策略, 根据所述最优对抗策略执行动作并与 环
境交互, 得到综合奖励值, 基于所述综合奖励值更新所述 适应度值。
3.根据权利要求2所述的飞行器对抗决策方法, 其特征在于, 所述基于所述综合奖励值
更新所述 适应度值, 具体包括:
根据遗传算法的适应函数 得到适应度评价结果;
比较所述适应度评价结果及所述综合奖励值的大小, 取所述适应度评价结果及所述综
合奖励值中的较大值作为所述 适应度值。
4.根据权利要求1所述的飞行器对抗决策方法, 其特征在于, 所述基于得到的新的所述
分类器种群获取最优分类器个体, 具体包括: 当得到的所述新的所述分类器种群中多个所
述分类器个体与环境消息匹配时, 计算所述多个所述分类器个体的适应度值, 并将具有最
高适应度值的所述分类 器个体作为所述 最优分类 器个体。
5.根据权利要求2所述的飞行器对抗决策方法, 其特征在于, 所述飞行器执行动作时,
满足如下运动模型 F:
其中, x、 y、 z表示飞行器在惯性坐标系中的位置, v表示飞行器速度, α 表示轨迹倾斜角,
β表示轨迹偏转角, θ表示绕速度矢量滚转角, kx表示切向过载, kz表示法向过载,权 利 要 求 书 1/3 页
2
CN 113962013 A
2分别表示v在三个坐标轴方向的分量, g表示重力加速度。
6.根据权利要求2所述的飞行器对抗决策 方法, 其特 征在于, 所述综合奖励值表示 为:
R=α1Ra+α2Rv+α3Rh
其中, α1、 α2、 α3表示权重系数, α1+α2+α3=1; Ra表示角度奖励 值, Rv表示速度奖励 值, Rh表
示高度奖励值;
其中, P表示偏离角, T表示脱离角, vr表示我方飞行器的速度, vb表示敌方飞行器的速
度, vg表示我方飞行器和敌方飞行器的最佳对抗速度, Δh表示我方飞行器相对于敌方飞行
器的高度差, Δ h'为我方飞行器和敌方飞行器的最佳对抗高度差 。
7.根据权利要求1所述的飞行器对抗决策方法, 其特征在于, 所述种群进化速度表示
为:
其中, N为所述分类器种群中所述分类器个体的数量, f(k,i)表示第k代第i个所述分类
器个体的适应度, f(k ‑1,j)表示第k ‑1代第j个所述分类器个体的适应度, Ev(k)表示第k代
所述分类 器种群的进化速度;
所述种群多样性表示 为:
其中, xi,1表示第i个个体对应的第1个变量, xi,n表示第i个个体对应的第n个变量,
表示对应不同变量的种群中心, A(k)表示第k代所述分类器种群的
种群多样性。
8.一种飞行器对抗决策装置, 其特 征在于, 包括:
初始化模块, 用于: 编码生成初始的分类器种群; 其中, 所述分类器种群中的分类器个
体的编码包括飞行器的攻击信息;
遗传迭代模块, 用于: 计算所述分类器个体的适应度值, 并基于所述适应度值对所述分
类器种群进行遗传算法的选择操作, 根据交叉概率对所述分类器种群进 行遗传算法的交叉权 利 要 求 书 2/3 页
3
CN 113962013 A
3
专利 飞行器对抗决策方法及装置
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:58:09上传分享