中文 | English

Introduction of platform新闻资讯

无人机避障的方法有哪些?(五)

更新时间:2022-02-11 作者:东方哨兵


对于无人机反制相信大家并不陌生,因为随着我国无人机黑飞事件不断发生,而无人机反制刚好可以进行打击来阻止黑飞事件。那么对于无人机反制系统的相关知识你了解多少呢?下面就由东方哨兵小编为大家详细介绍下。

强化学习是将动态规划与监督学习相结合的一种新型学习方法,强调在于环境的交互中不断学习,执行“尝试-失败”机制,通过反馈的评价,实现输出最优决策,在无人机复杂避障决策问题得到应用。这种学习理念能够通过奖励指标最大化,使得系统做出一系列决策,而不需要人工干预,流程图如图6所示。2005年,Michels J等[73]将强化学习应用在避障系统中,通过训练模型预测合适的避障策略。Xie等[74]基于Double DQN 算法,实现了室内场景自主避障。Vamvoudakis等[75]也将强化学习应用在智能体避障领域,但实验表明样本特征质量的选择影响避障效果。邹启杰等[76]提出强化学习驱动快速探索随机数的RL-RRT方法,加快搜索速度,实现解脱路径多目标决策优化。Kulkarni等[77]基于目标驱动内在动机的深度学习方法,在实时环境中学习导向行为,以提高复杂环境内收敛速度。

其核心思想是用神经网络来表征函数或者参数化动作策略,基于梯度对损失函数进行优化,实现了“感知-动作”的学习算法。Lü等[80]提出了一种改进的学习策略,该策略基于不同学习阶段对经验深度和广度的不同需求,其中DQN计算Q值,采用密集网络框架。在学习的初始阶段,创建一个经验价值评价网络,增加深度经验的比例,以更快地理解环境规则。当发生路径漫游现象时,采用平行探索结构,考虑漫游点等点的探索,提高了经验池的广度。刘庆杰等[81]采用改进DQN算法克服了Q-learning表格式算法在连续状态下导致内存不足的局限性。通过改进奖励机制,增加实时奖惩作为补充,解决学习耗时长和训练不稳定的问题。

以上就是关于无人机避障方法的详细介绍,希望可以帮助到大家,如果后期大家还有相关无人机防御的问题,大家可以持续关注东方哨兵官网。