Une nouvelle technique pour améliorer la capacité d'apprentissage des robots qui effectuent des tâches répétitives
5 juin 2023
Cet article a été révisé conformément au processus éditorial et aux politiques de Science X. Les éditeurs ont mis en évidence les attributs suivants tout en garantissant la crédibilité du contenu :
fact-vérifié
relire
par Cactus Communications
Apprendre de ses erreurs passées ne se limite pas aux humains. Les ordinateurs le font aussi. Dans les industries, cela se fait via des systèmes de contrôle informatisés qui aident à faire fonctionner les systèmes de production. Pour les robots industriels qui effectuent des tâches spécifiques par lots, par exemple la production de vêtements, de puces informatiques ou de produits de boulangerie, la technique de contrôle la plus couramment utilisée est le contrôle d'apprentissage itératif (ILC). La plupart des industries s'appuient encore sur des systèmes ILC qui utilisent une stratégie d'apprentissage appelée règle de mise à jour de type proportionnel (PTUR). Cette technique améliore les performances des systèmes ILC en répétant la même tâche encore et encore et en mettant à jour son entrée de contrôle en fonction des erreurs rencontrées lors des itérations précédentes.
Cependant, cette méthodologie de contrôle a été proposée il y a des décennies. Et comme les systèmes ILC sont de plus en plus adoptés pour effectuer des tâches plus complexes, il existe un besoin de techniques capables d'apprendre plus rapidement et avec une plus grande précision.
Dans une percée récente, un groupe de scientifiques a proposé une nouvelle technique qui utilise la règle de mise à jour de la puissance fractionnaire (FPUR) pour améliorer le potentiel de performance des systèmes ILC linéaires à entrée unique et sortie unique. L'étude a été publiée dans le IEEE/CAA Journal of Automatica Sinica.
Les taux de convergence - les taux auxquels la différence entre la sortie souhaitée et la sortie réelle diminue au fil du temps - jouent un rôle crucial dans la définition de l'efficacité d'un système ILC. Les méthodes existantes pour améliorer le taux de convergence s'avèrent souvent insatisfaisantes dans des situations nécessitant une grande précision. Même dans le cas de gains d'apprentissage constants ou sélectionnés manuellement, les systèmes ILC actuels qui utilisent la méthode de mise à jour linéaire ne parviennent pas à exploiter au maximum les informations disponibles. Par conséquent, les scientifiques ont étudié des approches au-delà de PTUR, qui utilisaient des méthodes de mise à jour non linéaires pour apprendre et atteindre le résultat souhaité.
"Le PTUR traditionnel utilise un terme linéaire pour l'erreur de suivi pour mettre à jour l'entrée de contrôle. D'autre part, FPUR utilise un terme fractionnaire pour la mise à jour. Étant donné que tout nombre positif inférieur à un a une puissance fractionnaire plus grande que lui-même, l'intensité de mise à jour de FPUR est plus grand que celui du PTUR pour les petites erreurs de suivi, ce qui conduit à un taux de convergence plus rapide », explique Zihan Li, l'auteur principal de l'étude et étudiant à la maîtrise à l'École de mathématiques de l'Université Renmin de Chine.
L'équipe a développé une nouvelle méthode FPUR inspirée des nouvelles stratégies de contrôle en temps fini (FTC) et de contrôle en mode glissant terminal (TSMC), qui sont des techniques potentielles pour surmonter les problèmes mentionnés précédemment et pour améliorer la vitesse de convergence. Les scientifiques ont également adopté une approche de cartographie non linéaire pour explorer la dynamique des erreurs au fil du temps. Cette approche leur a permis de rendre compte des performances de convergence rapide et de caractériser les cycles limites possibles des erreurs de suivi dans les systèmes ILC. De plus, des simulations numériques ont également été réalisées pour valider l'efficacité de la nouvelle méthode.
Lorsqu'on lui a demandé comment le système proposé changerait le domaine des systèmes ILC, Li a déclaré : "Cette étude a trois objectifs principaux. Premièrement, elle fournit un algorithme qui utilise une méthode de mise à jour non linéaire pour améliorer la capacité d'apprentissage. Deuxièmement, elle montre que l'adaptation les termes de puissance fractionnaires permettent de réguler le taux de convergence en fonction des performances réelles. Et enfin, il présente des taux de convergence rapides comparables à ceux de FTC et TMSC.
Cette étude a démontré, pour la première fois, l'utilisation du FPUR pour l'ILC dans des systèmes linéaires à entrée unique et sortie unique. La technique proposée pourrait potentiellement être utilisée dans d'autres systèmes répétitifs tels que les véhicules autonomes, les véhicules aériens sans pilote et les robots de rééducation.
Plus d'information: Zihan Li et al, Améliorer le contrôle de l'apprentissage itératif avec la loi de mise à jour de puissance fractionnaire, IEEE/CAA Journal of Automatica Sinica (2023). DOI : 10.1109/JAS.2023.123525
Plus d'informations : Citation