基于糊糙集的改进Q学习算法

CN 41-1437/TS ISSN 2096-1553

×

《轻工学报》严正声明

基于糊糙集的改进Q学习算法

过金超 , 刘杰 , 崔光照

过金超, 刘杰, 崔光照. 基于糊糙集的改进Q学习算法[J]. 轻工学报, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

引用本文: 过金超, 刘杰, 崔光照. 基于糊糙集的改进Q学习算法[J]. 轻工学报, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

GUO Jin-chao, LIU Jie and CUI Guang-zhao. An improved Q-learning algorithm based on rough set[J]. Journal of Light Industry, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

Citation: GUO Jin-chao, LIU Jie and CUI Guang-zhao. An improved Q-learning algorithm based on rough set[J]. Journal of Light Industry, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

基于糊糙集的改进Q学习算法

郑州轻工业学院电气信息工程学院, 河南郑州 450002
中图分类号: TP242.6;TP181

An improved Q-learning algorithm based on rough set

College of Electric and Information Engineering, Zhengzhou University of Light Industry, Zhengzhou 450002, China
Received Date: 2013-01-20
Available Online: 2013-05-15
CLC number: TP242.6;TP181

摘要: 针对Q学习算法容易出现错误的时间间隔重叠和高估Q值的情况,进而导致收敛速度慢、学习性能下降的问题,提出了一种改进的Q学习算法,即粗糙集Q学习算法.该算法通过有效处理不完备信息和不确定性知识,使Q值所引起的误差最小化,进而减少Q值的高估,提高学习性能.基于2种算法的机器人自主导航实验结果表明,粗糙集Q学习算法有更高的学习效率和更强的避障能力.
- Q学习算法 /
- 粗糙集 /
- 机器人导航
Abstract: Q-learning algorithm has a fundamental flaw,that is,prone to error intervals overlap,and thus overestimation of the correct Q-value.These are likely to lead to low convergence speed and continuous decline in the performance of Q-learning,an improved Q-learning algorithm was proposed,that was rough sets Q-learning algorithm.The algorithm can be able to minimize the overestimation caused by Q-values and improve performance of learning through effectively deal with incomplete information and uncertain knowledge.Navigation experiments based on these two algorithms were conducted,the results showed that rough sets Q-learning algorithm had higher efficiency of learning and stronger ability of obstacle avoidance than Q-learning algorithm.
- Q-learning algorithm /
- rough set /
- robot navigation
1. [1]
  王雪松,程玉虎.机器学习理论、方法及应用[M].北京:科学出版社,2009.
2. [2]
  James F Peters,Christopher Henry.Approximation spaces in off-policy Monte Carlo learning[J].Engineering Applications of Artificial Intelligence,2007(20):667.
3. [3]
  Peng J, Williams R J. Incremental multi-step Q-learning[J].Machine Leaning,1996,22(1/3):283.
4. [4]
  Pandey D,Pandey P.Approximate Q-learning:An introduction[C]//2010 Second International Conference on Machine Learning and Computing,Washington DC:IEEE Computer Society,2010.
5. [5]
  邱玉霞.进化计算与粗糙集研究及应用[M].北京:冶金工业出版社,2009.
6. [6]
  高庆吉.基于粗糙集理论的移动机器人自主导航研究[D].哈尔滨:哈尔滨工业大学,2006:15-16.
1. [1]
  张建栋 , 杨忠泮 , 吴恋恋 , 徐大勇 , 朱萍 , 张雯晶 , 堵劲松 . 基于高光谱成像及机器学习的烟叶糖料液施加量判别模型. 轻工学报, 2024, 39(5): 86-94. doi: 10.12187/2024.05.010
2. [2]
  张雷 , 马永帅 , 洪斌斌 , 熊开胜 , 徐大勇 , 堵劲松 , 李银华 , 邹泉 . 一种改进OSELM算法在片烟复烤过程水分在线检测中的应用. 轻工学报, 2025, 40(3): 95-103. doi: 10.12187/2025.03.011
3. [3]
  卢晓波 , 徐海 , 朱俊召 , 张宇 , 谭健 , 高冠男 , 胡军华 , 林龙 . 基于机器视觉的加热卷烟烟支端部质量检测系统设计. 轻工学报, 2024, 0(0): -.
4. [4]
  卢晓波 , 徐海 , 朱俊召 , 张宇 , 谭健 , 高冠男 , 胡军华 , 林龙 . 基于机器视觉的加热卷烟烟支端部质量检测系统设计. 轻工学报, 2024, 39(6): 101-107,115. doi: 10.12187/2024.06.012

WeChat

点击查看大图

计量

PDF下载量: 25
文章访问数: 3478
引证文献数: 0

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

过金超, 刘杰, 崔光照. 基于糊糙集的改进Q学习算法[J]. 轻工学报, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

引用本文: 过金超, 刘杰, 崔光照. 基于糊糙集的改进Q学习算法[J]. 轻工学报, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

GUO Jin-chao, LIU Jie and CUI Guang-zhao. An improved Q-learning algorithm based on rough set[J]. Journal of Light Industry, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

Citation: GUO Jin-chao, LIU Jie and CUI Guang-zhao. An improved Q-learning algorithm based on rough set[J]. Journal of Light Industry, 2013, 28(3): 42-45. doi: 10.3969/j.issn.2095-476X.2013.03.010

基于糊糙集的改进Q学习算法

郑州轻工业学院电气信息工程学院, 河南郑州 450002

收稿日期: 2013-01-20
网络出版日期: 2013-05-15

关键词:

摘要: 针对Q学习算法容易出现错误的时间间隔重叠和高估Q值的情况,进而导致收敛速度慢、学习性能下降的问题,提出了一种改进的Q学习算法,即粗糙集Q学习算法.该算法通过有效处理不完备信息和不确定性知识,使Q值所引起的误差最小化,进而减少Q值的高估,提高学习性能.基于2种算法的机器人自主导航实验结果表明,粗糙集Q学习算法有更高的学习效率和更强的避障能力.

English Abstract

参考文献 (6) 相关文章 (4)

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

网站版权 © 轻工学报编辑部

地址：河南省郑州市科学大道136号邮编：450001

电话：	(086)0371-86608635, (086)0371-86608633

E-mail：qgxb@zzuli.edu.cn

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net