Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

PhylteR: Efficient Identification of Outlier Sequences in Phylogenomic Datasets

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Institut Français de Bioinformatique (IFB-CORE); Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE); South Green Bioinformatics Platform Montpellier; Plant Health Institute of Montpellier (UMR PHIM); Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut de Recherche pour le Développement (IRD)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Montpellier; Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Université de Montpellier (UM); Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE); Université Claude Bernard Lyon 1 (UCBL); Université de Lyon-Université de Lyon-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS); Artificial Evolution and Computational Biology (BEAGLE); Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS); Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL); Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL); Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon); Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL); Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Inria Lyon; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria); Centre de Biologie pour la Gestion des Populations (UMR CBGP); Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut de Recherche pour le Développement (IRD France-Sud )-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Montpellier; Institut des Sciences de l'Evolution de Montpellier (UMR ISEM); Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-École Pratique des Hautes Études (EPHE); Université Paris Sciences et Lettres (PSL)-Université Paris Sciences et Lettres (PSL)-Institut de recherche pour le développement IRD : UR226-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM); Ecologie quantitative et évolutive des communautés LBBE; Département écologie évolutive LBBE; Université de Lyon-Université de Lyon-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL); Université de Lyon-Université de Lyon-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE); Work was funded by ANR Grant ANR-18-CE02-0007 (STHORIZ) to DMDV, ANR Grant ANR-19-CE45-0010 (Evoluthon) to ET, and European Research Council grant ERC-2015-CoG-683257 (ConvergeAnt project) to FD. This is also contribution of the Institut des Sciences de l’Evolution de Montpellier (ISEM).; ANR-18-CE02-0007,STHORIZ,DETECTION DE LA DIVERSITÉ ÉTEINTE ET INCONNUE À L'AIDE DES TRANSFERTS HORIZONTAUX(2018); ANR-19-CE45-0010,Evoluthon,La vie articifielle comme banc d'essai pour l'évolution moléculaire(2019); European Project: 683257,ERC-2015-CoG,ConvergeAnt(2016)
    • بيانات النشر:
      HAL CCSD
      Oxford University Press (OUP)
    • الموضوع:
      2023
    • نبذة مختصرة :
      Data Availability: The documented code of PhylteR is available at https://github.com/damiendevienne/phylter along with thorough documentation. All data and scripts used in this study are available on the dedicated GitHub repository available at https://github.com/damiendevienne/phylter-data/.Software Availability: PhylteR is a package written in R language (R Core Team 2023) available on CRAN (https://cran.r-project.org/web/ packages/phylter/index.html) for the latest stable version and on GitHub (https://github.com/damiendevienne/phylter) for the latest development version. The latest version of PhylteR is also distributed as a Singularity container (https://cloud.sylabs.io/library/theo.treecou/tool/phylter_singularity) and a docker container (https://hub.docker.com/r/treecoutheo/phylter_docker). Extensive documentation can be found at https://damiendevienne.github.io/phylter/index.html. ; International audience ; In phylogenomics, incongruences between gene trees, resulting from both artifactual and biological reasons, are known to decrease the signal-to-noise ratio and complicate species tree inference. The amount of data handled today in classical phylogenomic analyses precludes manual error detection and removal. However, a simple and efficient way to automate the identification of outlier sequences is still missing. Here, we present PhylteR, a method that allows a rapid and accurate detection of outlier sequences in phylogenomic datasets, i.e. species from individual gene trees that do not follow the general trend. PhylteR relies on DISTATIS, an extension of multidimensional scaling to 3 dimensions to compare multiple distance matrices at once. In PhylteR, distance matrices obtained either directly from multiple sequence alignments or extracted from individual gene phylogenies represent evolutionary distances between species according to each gene. On simulated datasets, we show that PhylteR identifies outliers with more sensitivity and precision than a comparable existing method. On a biological dataset ...
    • Relation:
      info:eu-repo/semantics/altIdentifier/pmid/37879113; info:eu-repo/grantAgreement//683257/EU/An Integrative Approach to Understanding Convergent Evolution in Ant-eating Mammals/ConvergeAnt; hal-03995366; https://hal.science/hal-03995366; https://hal.science/hal-03995366v3/document; https://hal.science/hal-03995366v3/file/msad234.pdf; BIORXIV: 2023.02.02.526888; PUBMED: 37879113; WOS: 001186460200003
    • الرقم المعرف:
      10.1093/molbev/msad234
    • Rights:
      http://creativecommons.org/licenses/by-nc/ ; info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.EE2AD153