نبذة مختصرة : Many statistical challenges arose in the advertisement field, such as displaying an advertisement at the right place and the right time. To achieve this, several performance metrics of airing of an ad were measured over time, for example the number or rate of clicks on an advertisement. A crucial aim is to be able to predict the clicks rate. Nevertheless, it is essential to understand beforehand the voluminous and heterogeneous data structure. Therefore, we introduce a clustering method of publicity campaign tim-series, i.e. of non-Gaussian longitudinal data, with a mixture of generalized linear models (GLM). ; De nombreux enjeux statistiques ont émergé du contexte de la publicité, il s'agit notamment d'afficher une publicité au bon endroit et au bon moment. Dans ce but, plusieurs métriques de performance de diffusion d'une campagne sont mesurées au cours du temps, comme le nombre ou le taux de clics sur une publicité. Un enjeu essentiel est de prédire le taux de clics. Mais, il est important de comprendre au préalable la structure des données volumineuses et hétérogènes dont nous disposons. Pour cela, nous proposons ici une méthode de classification des profils de campagnes publicitaires, i.e. de données longitudinales non gaussiennes, par un mélange de modèles linéaires généralisés (GLM).
No Comments.