نبذة مختصرة : Dans cette thèse, nous nous intéressons à des méthodes d'apprentissage statistique sur données spatio-temporelles et données mixtes. En effet, la croissance rapide des systèmes d'informations en santé publique permet aujourd'hui de disposer de données variées en temps réel pour de nombreuses maladies. L'objectif est de développer des méthodes pour utiliser ces données afin de construire des systèmes d'aide à la décision exploitables.Nous proposons d'abord un pipeline spatio-temporel pour estimer la distribution de la population et mettre en évidence des différences temporelles. Ce pipeline est une première étape vers un système d'aide à la décision et d'alerte pour l'analyse spatio-temporelle de l'évolution d'une population. Ce pipeline est conçu de manière à ce que différentes distributions et donc différents algorithmes puissent être envisagés. Pour une première application, ce pipeline est combiné avec des algorithmes EM robustes permettant l'estimation de modèles de mélange gaussiens. Il est éprouvé sur des données d'hôpitaux parisiens correspondant aux personnes testées positives à l'infection par le SARS-CoV-2 sur onze semaines en 2020.Dans une deuxième partie nous proposons un ensemble d'algorithmes pour l'estimation de modèles de mélange sur données mixtes. Nous décrivons d'abord des modèles de mélange pour diverses lois continues et discrètes, en supposant une indépendance conditionnelle entre les variables discrètes et continues. Nous proposons ensuite des algorithmes dynamiques de type EM, permettant l'estimation de tous les paramètres du mélange ainsi que l'estimation du nombre de classes. Nous montrons que nos différents algorithmes dynamiques permettent d'atteindre le nombre réel de classes et d'estimer correctement les paramètres des lois discrètes comme continues. Nous soulignons aussi l'intérêt d'introduire des régularisations sur des paramètres particuliers afin d'améliorer les performances dans des situations où la taille de l'échantillon n'est pas suffisante en regard de la complexité du ...
No Comments.