Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Comparison study of variable selection procedures in high-dimensional Gaussian linear regression ; Étude de comparaisons de procédures de sélection de variables en régression linéaire gaussienne de grande dimension

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Laboratoire de Mathématiques d'Orsay (LMO); Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS); Statistique mathématique et apprentissage (CELESTE); Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Centre Inria de l'Université Paris-Saclay; Centre Inria de Saclay; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre Inria de Saclay; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria); Institut des Sciences des Plantes de Paris-Saclay (IPS2 (UMR_9213 / UMR_1403)); Université d'Évry-Val-d'Essonne (UEVE)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE); Institut de Biologie Intégrative de la Cellule (I2BC); Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS); AgroParisTech; ANR-11-LABX-0056,LMH,LabEx Mathématique Hadamard(2011); ANR-17-EURE-0007,SPS-GSR,Ecole Universitaire de Recherche de Sciences des Plantes de Paris-Saclay(2017)
    • بيانات النشر:
      CCSD
    • الموضوع:
      2025
    • نبذة مختصرة :
      38 pages, 23 figures, 1 table ; We propose an extensive simulation study to compare some variable selection procedures in a high-dimensional framework. Assuming that the relationship between the actives variables and the response variable is linear, the high-dimensional Gaussian linear regression provides a relevant statistical framework to identify active variables related to the response variable. Many variable selection procedures exist, and in this article, we focus on methods based on regularization paths. We perform a comparison study by considering different simulation settings with various dependency structures for variables and evaluate the performance of the methods by computing several metrics. As expected, no method is optimal for all the evaluated performances but we provide recommendations for the best procedures according to the metric to control. Lastly, we test the importance of some assumptions of the model, especially the high dimensionality and the Gaussian ones.
    • Relation:
      info:eu-repo/semantics/altIdentifier/arxiv/2109.12006v2; ARXIV: 2109.12006v2
    • الدخول الالكتروني :
      https://hal.science/hal-03366851
      https://hal.science/hal-03366851v3/document
      https://hal.science/hal-03366851v3/file/2109.12006v3.pdf
    • Rights:
      info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.16B7F97A