一种基于迭代学习的扫地机器人轨迹控制方法

未命名 08-15 阅读:58 评论:0


1.本发明涉及迭代学习控制技术领域,更具体地说,涉及一种基于迭代学习的扫地机器人轨迹控制方法。


背景技术:

2.迭代学习控制采用输出误差来修正输入控制量,从而实现对控制目标的改善。其思想最初由日本学者于1978年提出,经过多年的发展,现已成为一种有效的控制技术。
3.扫地机器人是一种智能化的机器人,能够自主清扫室内环境。然而,由于其时变、强耦合的非线性复杂特性,如何实现对其精确和快速的控制一直是工业自动化领域的难点。尽管建模的技术已经发展到非常高的水平,但由于外部干扰和建模的不精确,扫地机器人的完整运动模型无法得到。鉴于扫地机器人的这种特点以及重复学习控制特有的性质,迭代学习控制作为一种高效的控制策略,将其应用在扫地机器人的轨迹控制上以提高其控制精度和速度是可行的。


技术实现要素:

4.本发明的目的是在现有的方法上做改进,提供一种基于迭代学习的扫地机器人轨迹控制方法,在全局和局部两个层面上进行搜索,通过引入个体性能的概率量化和多样化的进化策略,避免过早陷入局部最优解,提高迭代控制的全局搜索速度和收敛精度,且减少了控制过程的跟踪误差,满足扫地机器人快速、高精度跟踪控制需求。
5.本发明采用如下技术方案:
6.本发明一种基于迭代学习的扫地机器人轨迹控制方法,包括:
7.s1,迭代学习动力学模型建立步骤;
8.建立扫地机器人轨迹控制的迭代学习动力学模型,如下:
9.ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
10.ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
11.其中,;;;;表示扫地机器人在第次迭代学习时轨迹控制动力学输出;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位
置、纵坐标位置以及方向角;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位置、纵坐标位置以及方向角;表示第次迭代学习时扫地机器人的线速度,表示第次迭代学习时扫地机器人的方向角速度;表示采样周期;,表示扫地机器人最大运行周期;
12.s2,参数设置步骤;
13.设置迭代学习最大次数为及控制方法最大运行次数为;
14.设置控制参数;令迭代学习次数时扫地机器人轨迹控制动力学系统输入,,计算对应的迭代学习控制适应度值函数,设置当前最优迭代输入,及设置当前最优迭代学习控制适应度值为;
15.设置种群数目为,进化种群概率为,其中且;
16.s3,参数比较步骤;获取内服从均匀分布的随机数,比较与的大小,如果,执行s4,如果,执行s5;
17.s4,全局搜索步骤;
18.全局搜索获得的迭代控制输入如下式:
19.ꢀꢀꢀ
(3)
20.其中,表示第次迭代学习时搜索的最优解对应的维度数值,;表示第次迭代学习时搜索的最优解对应的维度数值,和分别表示第次和第次迭代学习时第代搜索的解对应的维度数值,;和表示内服从均匀分布的随机数;表示求最小值操作;表示绝对值;
21.计算种群产生的迭代控制输入对应的迭代学习控制适应度值;
22.s5,局部搜索步骤;
23.局部搜索获得的迭代控制输入如下式:
24.ꢀꢀ
(4)
25.其中,和为内服从均匀分布的随机数,表示求最大值操作;
26.计算种群产生的迭代控制输入对应的迭代学习控制适应度值;
27.s6,更新步骤;
28.更新最优迭代控制输入和最优控制适应度值;
29.如果迭代学习控制适应度值小于当前最优迭代学习控制适应度值,更新当前最优迭代学习控制适应度值为,且将对应的迭代控制输入更新为当前最优解;
30.令控制参数;
31.s7,运行次数判断步骤;
32.重复执行s3~s6,直至达到最大运行次数,令,执行s8;
33.s8,迭代学习次数判断步骤;
34.如果迭代学习次数达到,则输出当前最优迭代学习控制适应度值及最优解,并停止执行,否则转向s3继续执行;
35.s9,跟踪轨迹输出步骤;
36.将获得的最优解代入建立的扫地机器人轨迹控制的迭代学习动力学模型(1),获得跟踪上理想跟踪轨迹的动力学输出。
37.优选的,所述迭代学习控制适应度值函数,表示如下:
38.ꢀꢀꢀ
(5)
39.其中,和为大于0的权重因子;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;为第次迭代控制跟踪误差;,表示扫地机器人轨迹控制的理想跟踪轨迹;表示向量2-范数。
40.由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
41.(1)本发明一种基于迭代学习的扫地机器人轨迹控制方法,在全局和局部两个层面上进行搜索,通过引入个体性能的概率量化和多样化的进化策略,避免过早陷入局部最优解,提高迭代控制的全局搜索速度和收敛精度,且减少了控制过程的跟踪误差,满足扫地机器人快速、高精度跟踪控制需求;
42.(2)本发明一种基于迭代学习的扫地机器人轨迹控制方法,在搜索时不断更新迭代学习控制适应度值,以获取到最优迭代学习控制适应度值及对应的最优迭代控制输入,进而获快速跟踪上理想跟踪轨迹的动力学输出,满足扫地机器人快速、高精度跟踪控制需求。
附图说明
43.图1是本发明实施例的基于迭代学习的扫地机器人轨迹控制方法的流程图;
44.图2是本发明实施例的扫地机器人轨迹控制原理图。
具体实施方式
45.以下通过具体实施方式对本发明作进一步的描述。
46.参见图1所示,本发明一种基于迭代学习的扫地机器人轨迹控制方法,包括:
47.s1,迭代学习动力学模型建立步骤。
48.具体的,建立扫地机器人轨迹控制的迭代学习动力学模型,如下:
49.ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
50.ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
51.其中,;;;;表示扫地机器人在第次迭代学习时轨迹控制动力学输出;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位置、纵坐标位置以及方向角;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位置、纵坐标位置以及方向角;表示第次迭代学习时扫地机器人的线速度,表示第次迭代学习时扫地机器人的方向角速度;表示采样周期;,表示扫地机器人最大运行周期。
52.进一步的,扫地机器人轨迹控制的迭代学习动力学模型的建立过程如下。
53.扫地机器人在二维平面运行,设其当前时刻的状态位置为,
,其中,,和分别表示在平面坐标轴的扫地机器人的横、纵坐标位置以及方向角,,为扫地机器人最大运行周期,符号为共轭转置操作。扫地机器人速度控制量为,,其中表示机器人的线速度,表示方向角速度。假设扫地机器人理想跟踪轨迹为,。扫地机器人轨迹控制的目标是在迭代学习控制的作用下,确定扫地机器人速度控制量,使得,也即是,,,。
54.参见图2所示,扫地机器人的运动力学系统方程如下所示:
[0055][0056]
其中是系统采样周期。由前述内容可知,式(1)可以转化为以下动力学系统:
[0057][0058][0059]
其中,和分别表示扫地机器人轨迹控制动力学系统输出和输入。
[0060]
应用于扫地机器人轨迹控制的迭代学习控制动力学系统转化为如公式(1)和(2)所示的迭代学习动力学模型。
[0061]
s2,参数设置步骤。
[0062]
具体的,设置迭代学习最大次数为及控制方法最大运行次数为;
[0063]
设置控制参数;令迭代学习次数时扫地机器人轨迹控制动力学系统输入,,计算对应的迭代学习控制适应度值函数,设置当前最优迭代输入,及设置当前最优迭代学习控制适应度值为;
[0064]
设置种群数目为,进化种群概率为,其中且。
[0065]
s3,参数比较步骤。
[0066]
具体的,获取内服从均匀分布的随机数,比较与的大小,如果,执行s4,如果,执行s5。
[0067]
s4,全局搜索步骤。
[0068]
具体的,全局搜索获得的迭代控制输入如下式:
[0069]
ꢀꢀ
(3)
[0070]
其中,表示第次迭代学习时搜索的最优解对应的维度数值,;表示第次迭代学习时搜索的最优解对应的维度数值,和分别表示第次和第次迭代学习时第代搜索的解对应的维度数值,;和表示内服从均匀分布的随机数;表示求最小值操作;表示绝对值;
[0071]
计算种群产生的迭代控制输入对应的迭代学习控制适应度值。
[0072]
s5,局部搜索步骤;
[0073]
具体的,局部搜索获得的迭代控制输入如下式:
[0074]
ꢀꢀ
(4)
[0075]
其中,和为内服从均匀分布的随机数,表示求最大值操作;
[0076]
计算种群产生的迭代控制输入对应的迭代学习控制适应度值。
[0077]
s6,更新步骤;
[0078]
具体的,更新最优迭代控制输入和最优控制适应度值;
[0079]
如果迭代学习控制适应度值小于当前最优迭代学习控制适应度值,更新当前最优迭代学习控制适应度值为,且将对应的迭代控制输入更新为当前最优解;
[0080]
令控制参数。
[0081]
s7,运行次数判断步骤。
[0082]
具体的,执行s3~s6,直至达到最大运行次数,令,执行s8;
[0083]
s8,迭代学习次数判断步骤。
[0084]
具体的,如果迭代学习次数达到,则输出当前最优迭代学习控制适应度值及最优解,并停止执行,否则转向s3继续执行。
[0085]
s9,跟踪轨迹输出步骤。
[0086]
具体的,将获得的最优解代入建立的扫地机器人轨迹控制的迭代学习动力学模型(1),获得跟踪上理想跟踪轨迹的动力学输出。
[0087]
具体的,所述迭代学习控制适应度值函数,表示如下:
[0088]
ꢀꢀ
(5)
[0089]
其中,和为大于0的权重因子;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;为第次迭代控制跟踪误差;,表示扫地机器人轨迹控制的理想跟踪轨迹;表示向量2-范数。
[0090]
对应的,计算当前最优迭代学习控制适应度值为时,为将公式(5)中的替换成即可。
[0091]
本发明能够克服扫地机器人轨迹跟踪中的瞬态性能不足问题。传统的轨迹控制方法在机器人运动起始阶段或者遇到轨迹变化时存在不足,导致机器人偏离轨迹或者出现震荡。但是,基于本发明提出的方法,通过不断学习和调整,每次迭代学习控制的跟踪误差都是单调递减的。因此,在每次迭代中不断优化,逐步接近期望的轨迹,从而提高了轨迹跟踪的准确性和稳定性。这使得机器人能够更加准确地遵循预定轨迹,提高了扫地效率和清洁效果。此外,本发明提出的控制方法还具有自适应性能。扫地机器人工作环境常常复杂多变,包括不同地面材质、家具布局和障碍物等。基于迭代学习控制的设计,机器人可以根据实时的跟踪误差和系统特性进行自动调整和优化。这意味着机器人能够根据不同环境条件,自动调整控制参数,适应不同工作场景,并提供更好的轨迹跟踪性能。
[0092]
本实施例还公开了一种基于迭代学习的扫地机器人轨迹控制系统,包括:迭代学习动力学模型建立模块;参数设置模块;参数比较模块;全局搜索模块;局部搜索模块;更新模块;运行次数判断模块;迭代学习次数判断模块及跟踪轨迹输出模块。
[0093]
各模块的具体实现同一种基于迭代学习的扫地机器人轨迹控制方法中各步骤,本实施例不再重复说明。
[0094]
上述实施例仅仅用以说明本发明,而并非用作对本发明的限定。只要是依据本发明的技术实质,对上述实施例进行变化、变型等都将落在本发明的权利要求范围内。

技术特征:
1.一种基于迭代学习的扫地机器人轨迹控制方法,其特征在于,包括:s1,迭代学习动力学模型建立步骤;建立扫地机器人轨迹控制的迭代学习动力学模型,如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,;;;;表示扫地机器人在第次迭代学习时轨迹控制动力学输出;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位置、纵坐标位置以及方向角;、和分别表示第次迭代学习时时刻扫地机器人在平面坐标轴的横坐标位置、纵坐标位置以及方向角;表示第次迭代学习时扫地机器人的线速度,表示第次迭代学习时扫地机器人的方向角速度;表示采样周期;,表示扫地机器人最大运行周期;s2,参数设置步骤;设置迭代学习最大次数为及控制方法最大运行次数为;设置控制参数;令迭代学习次数时扫地机器人轨迹控制动力学系统输入,,计算对应的迭代学习控制适应度值函数,设置当前最优迭代输入,及设置当前最优迭代学习控制适应度值为;设置种群数目为,进化种群概率为,其中且;s3,参数比较步骤;获取内服从均匀分布的随机数,比较与的大小,如果,执行s4,如果,执行s5;s4,全局搜索步骤;全局搜索获得的迭代控制输入如下式:
ꢀꢀꢀ
(3)其中,表示第次迭代学习时搜索的最优解对应的维度数值,;表示第次迭代学习时搜索的最优解对应的维度数值,和分别表示第次和第次迭代学习时第代搜索的解对应的维度数值,;和表示内服从均匀分布的随机数;表示求最小值操作;表示绝对值;计算种群产生的迭代控制输入对应的迭代学习控制适应度值;s5,局部搜索步骤;局部搜索获得的迭代控制输入如下式:
ꢀꢀ
(4)其中,和为内服从均匀分布的随机数,表示求最大值操作;计算种群产生的迭代控制输入对应的迭代学习控制适应度值;s6,更新步骤;更新最优迭代控制输入和最优控制适应度值;如果迭代学习控制适应度值小于当前最优迭代学习控制适应度值,更新当前最优迭代学习控制适应度值为,且将对应的迭代控制输入更新为当前最优解;令控制参数;s7,运行次数判断步骤;重复执行s3~s6,直至达到最大运行次数,令,执行s8;s8,迭代学习次数判断步骤;如果迭代学习次数达到,则输出当前最优迭代学习控制适应度值及最优解,并停止执行,否则转向s3继续执行;s9,跟踪轨迹输出步骤;
将获得的最优解代入建立的扫地机器人轨迹控制的迭代学习动力学模型(1),获得跟踪上理想跟踪轨迹的动力学输出。2.根据权利要求1所述的基于迭代学习的扫地机器人轨迹控制方法,其特征在于,所述迭代学习控制适应度值函数,表示如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,和为大于0的权重因子;表示扫地机器人在第次迭代学习时轨迹控制动力学输入;为第次迭代控制跟踪误差;,表示扫地机器人轨迹控制的理想跟踪轨迹;表示向量2-范数。

技术总结
本发明涉及一种基于迭代学习的扫地机器人轨迹控制方法,包括:S1,迭代学习动力学模型建立步骤;S2,参数设置步骤;S3,参数比较步骤;S4,全局搜索步骤;S5,局部搜索步骤;S6,更新步骤;S7,运行次数判断步骤;S8,迭代学习次数判断步骤;S9,跟踪轨迹输出步骤。本发明在全局和局部两个层面上进行搜索,通过引入个体性能的概率量化和多样化的进化策略,避免过早陷入局部最优解,提高迭代控制的全局搜索速度和收敛精度,且减少了控制过程的跟踪误差,满足扫地机器人快速、高精度跟踪控制需求。高精度跟踪控制需求。高精度跟踪控制需求。


技术研发人员:傅文渊
受保护的技术使用者:华侨大学
技术研发日:2023.07.14
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐