分拣机器人在哪里找智能分拣机器人优缺点
【能源人都在看,点击右上角加'关注'】

可阅读全文
原文发表在《工矿自动化》2021年第1期,欢迎品读。
煤矸石分拣是煤炭粗选的首要环节,也是提高煤炭质量以及矿井效益的重要方法。传统煤矸石分拣如人工分拣、湿选和干选等分拣方式正面临工伤风险率高、环境污染严重及智能化程度低的困境。机械臂分拣不仅能有效降低工伤风险率,同时还具有效率高、绿色分拣的优势。煤矸石分拣朝着智能机器人化方向发展符合现代工业发展趋势。针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(DDPG)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDPG算法中的神经网络结构和奖励函数进行了改进,提出了一种适合处理六自由度煤矸石分拣机械臂的基于强化学习的改进DDPG算法。煤矸石进入机械臂工作空间后,改进DDPG算法可根据相应传感器返回的煤矸石位置及机械臂状态进行决策,并向相应运动控制器输出一组关节角状态控制量,根据煤矸石位置及关节角状态控制量控制机械臂运动,使机械臂运动到煤矸石附近,实现煤矸石分拣。仿真实验结果表明:改进DDPG算法相较于传统DDPG算法具有无模型通用性强及在与环境交互中可自适应学习抓取姿态的优势,可率先收敛于探索过程中所遇的最大奖励值,利用改进DDPG算法控制的机械臂所学策略泛化性更好、输出的关节角状态控制量更小、煤矸石分拣效率更高。
引用格式
张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42.
ZHANGYongchao,YUZhiwei,mbasedonreinforcementlearning[J].IndustryandMineAutomation,2021,47(1):36-42.
张永超(1977-),男,山东金乡人,讲师,博士研究生,主要研究方向为机电智能控制、流体机械,E-mail:jdxzyc@。通信作者:于智伟(1995-),男,山东德州人,硕士研究生,主要研究方向为机器人智能控制,E-mail:yzw_edu@163.com。
张强,E-mail:zhangqiang@
基于强化学习的煤矸石分拣机械臂智能控制算法研究
Researchonintelligentcontrolalgorithmofcoalganguesortingrobotarmbasedonreinforcementlearning
张永超,于智伟,丁丽林
【Author】ZHANGYongchao,YUZhiwei,DINGLilin
山东科技大学机械电子工程学院,山东青岛266590
【Unit】CollegeofMechanicalandElectronicEngineering,ShandongUniversityofScienceandTechnology,Qingdao266590,China
【摘要】针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(DDPG)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDPG算法中的神经网络结构和奖励函数进行了改进,提出了一种适合处理六自由度煤矸石分拣机械臂的基于强化学习的改进DDPG算法。煤矸石进入机械臂工作空间后,改进DDPG算法可根据相应传感器返回的煤矸石位置及机械臂状态进行决策,并向相应运动控制器输出一组关节角状态控制量,根据煤矸石位置及关节角状态控制量控制机械臂运动,使机械臂运动到煤矸石附近,实现煤矸石分拣。仿真实验结果表明:改进DDPG算法相较于传统DDPG算法具有无模型通用性强及在与环境交互中可自适应学习抓取姿态的优势,可率先收敛于探索过程中所遇的最大奖励值,利用改进DDPG算法控制的机械臂所学策略泛化性更好、输出的关节角状态控制量更小、煤矸石分拣效率更高。
【Abstract】TheproblemsofthetraditionalganguesortingrobotarmcontrolalgorithmssuchasthegraspingfunctionmethodandthedynamictargetgraspingalgorithmbasedonFerrarymethodarerelyingonan,theproblemsofthetraditionalintelligentcontrolalgorithmssuchasdeepdeterministicpolicygradient(DDPG),thisstudyimprovestheneuralnetworkstructureandrewardfunctioninthetraditionalDDPGalgorithm,andproposesanimprovedDDPGalgorithmbasedonreinforcementlearning,whichi,theimprovedDDPGalgorithmcanmakedecisionsaccordingtotheganguepositionandrobotarmstatereturnedbythecorrespondingsensor,andcanoutputasetofjguepositionandjointanglestatecontrolquantity,ithm,theimprovedDDPGalgorithmhastheadvantagesofmodel-freeversatilitya,theimprovedalgorithmcanbethefireneralization,smallerjointanglestatecontroloutputandhigherganguesortingefficiency.
【关键词】选煤;煤矸石分拣;分拣机器人;机械臂;关节角状态控制;强化学习;奖励函数;DDPG算法
【Keywords】coalpreparation;coalganguesorting;sortingrobot;robotarm;jointanglestatecontrol;reinforcementlearning;rewardfunction;DDPGalgorithm
【基金项目】山东省自然科学基金项目(ZR2018MEE036)
信息提供:张强图文编辑:张聚
审核:王晖

免责声明:以上内容转载自工矿自动化,所发内容不代表本平台立场。
全国能源信息平台联系电话:010-65367702,邮箱:hz@,地址:北京市朝阳区金台西路2社



