Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Delay Aware Universal Notice Network: Real world multi-robot transfer learning

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Université Clermont Auvergne (UCA); Centre National de la Recherche Scientifique (CNRS); Équipe Mouvement des Systèmes Anthropomorphes (LAAS-GEPETTO); Laboratoire d'analyse et d'architecture des systèmes (LAAS); Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse 1 Capitole (UT1); Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Université Toulouse III - Paul Sabatier (UT3); Université Fédérale Toulouse Midi-Pyrénées-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse); Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National Polytechnique (Toulouse) (Toulouse INP); Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse 1 Capitole (UT1); Université Fédérale Toulouse Midi-Pyrénées
    • بيانات النشر:
      HAL CCSD
    • الموضوع:
      2021
    • Collection:
      Archive ouverte HAL (Hyper Article en Ligne, CCSD - Centre pour la Communication Scientifique Directe)
    • الموضوع:
    • نبذة مختصرة :
      National audience ; Un problème majeur lors du passage de la simulation à la réalité est le retard sur le robot physique qui peut détériorer les performances de l'agent déployé. En outre, une fois qu'une politique de contrôle basée sur l'apprentissage a été entraînée avec succès, la réaffectation des connaissances acquises par l'agent pour permettre à un agent structurellement distinct d'effectuer la même tâche est dangereuse si elle est effectuée naïvement. Dans ce travail, nous abordons les problèmes ci-dessus avec une seule méthode, le DA-UNN (Delay Aware Universal Notice Network), qui décompose les connaissances en modules spécifiques au robot et à la tâche pour un transfert rapide. Notre méthode traite les retards immanents aux systèmes physiques afin d'améliorer le transfert sim2réel. Nous évaluons l'efficacité de notre approche en utilisant des robots simulés et réels sur une tâche de manipulation dynamique où la gestion des délais est cruciale.
    • Relation:
      hal-03298723; https://hal.archives-ouvertes.fr/hal-03298723; https://hal.archives-ouvertes.fr/hal-03298723/document; https://hal.archives-ouvertes.fr/hal-03298723/file/RJCIA_2021_paper_8.pdf
    • Rights:
      info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.35205515