阅读 111

Combining STDP and binary networks for reinforcement learning from images and sparse rewards

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!

 

 

Neural Networks 2021

 

Abstract

  脉冲神经网络(SNN)旨在复制生物大脑的能源效率、学习速度和时间处理。然而,此类网络的准确性和学习速度仍落后于基于传统神经模型的强化学习(RL)模型。这项工作将预训练的二值卷积神经网络与通过奖励调节的STDP在线训练的SNN相结合,以利用两种模型的优势。脉冲网络是其先前版本的扩展,在架构和动态方面进行了改进,以应对更具挑战性的任务。我们专注于对所提出的模型进行广泛的实验评估,这些模型具有优化的最先进基准,即近端策略优化(PPO)和深度Q网络(DQN)。这些模型在具有高维观察的网格世界环境中进行比较,该环境由高达256×256像素的RGB图像组成。实验结果表明,所提出的架构可以成为评估环境中深度强化学习(DRL)的竞争替代品,并为脉冲网络的更复杂的未来应用奠定基础。

 

Keywords: spiking neural networks, binary neural networks, STDP, reinforcement learning.

 

1. Introduction

 

原文:https://www.cnblogs.com/lucifer1997/p/15309976.html

文章分类
代码人生
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐