Auto-Encodeurs Variationnels Dynamiques pour le Traitement Multimédia ; Dynamical Variational Autoencoders for Multimedia Processing

Item request has been placed!

Item request cannot be made.

Processing Request

اقرأ أكثر حفظ في قائمتي

المؤلفون: Bie, Xiaoyu
الموضوع:
Apprentissage profond; Dynamical variational autoencoder; Modèles probabilistes hybrides; Traitement du signal de parole; Deep learning; Hybrid probabilistic model; Speech processing
نوع التسجيلة:
thesis
اللغة:
English

معلومة اضافية
- Contributors:
  Université Grenoble Alpes; Girin, Laurent; Alameda-Pineda, Xavier
- الموضوع:
  2023
- Collection:
  theses.fr
- الموضوع:
  004; 620
- نبذة مختصرة :
  Le domaine de la modélisation des données séquentielles, telles que les signaux de parole, a connu des progrès remarquables grâce aux récents développements dans l'apprentissage profond. Parmi la myriade d'approches, les modèles génératifs profonds, en particulier ceux ayant des définitions explicites de fonctions de densité de probabilité comme les Variational AutoEncoders (VAEs), ont attiré une attention significative en raison de leurs avantages uniques dans trois domaines cruciaux. Premièrement, ils opèrent dans un cadre d'apprentissage non supervisé, éliminant ainsi le besoin d'étiquetage intensif en main-d'œuvre. Deuxièmement, ils acquièrent des représentations latentes expressives, ce qui leur permet d'être utilisés dans une large gamme de tâches ultérieures. Enfin, ces modèles sont probabilistes par nature, ce qui les rend facilement intégrables dans les algorithmes existants basés sur un cadre de modélisation bayésienne. Néanmoins, le VAE vanille d'origine traite chaque vecteur de données indépendamment en raison de l'hypothèse d'indépendance et d'identiquement distribuée (i.i.d.). Cette approche est sous-optimale pour modéliser avec précision les séquences corrélées (temporelles). Par conséquent, trouver une adaptation appropriée du VAE vanille à la modélisation de données séquentielles reste un défi passionnant.Dans cette thèse, nous apportons les contributions suivantes : 1) nous passons en revue en détail les avancées récentes dans l'extension du modèle VAE pour prendre en compte les données séquentielles et les regroupons dans une classe générale de modèles appelés dynamical VAEs (DVAEs), en fournissant une définition générale de leurs modèles génératifs et d'inférence, ainsi que de l'objectif d'optimisation ; (FTML'21) 2) nous réalisons une étude quantitative comparative des modèles DVAE existants pour évaluer leurs performances dans la modélisation de données séquentielles avec différentes architectures (FTML'21, Interspeech'21) ; 3) nous proposons un nouveau modèle DVAE qui intègre un espace ...
- Relation:
  http://www.theses.fr/2023GRALT069/document
- الدخول الالكتروني :
  http://www.theses.fr/2023GRALT069/document
- Rights:
  Open Access ; http://purl.org/eprint/accessRights/OpenAccess
- الرقم المعرف:
  edsbas.65CB6D75

تعليقات

No Comments.

Auto-Encodeurs Variationnels Dynamiques pour le Traitement Multimédia ; Dynamical Variational Autoencoders for Multimedia Processing

اتصل بنا

اتبع