Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

ToMATo: an efficient and robust clustering algorithm for high dimensional datasets. An illustration with spike sorting ; ToMATo : un algorithme de clustering efficace et robuste pour jeux de données en grande dimension. Une illustration avec le tri des potentiels d'action

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Institut de Recherche Mathématique Avancée (IRMA); Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS); ANR-22-CE45-0027,SIMBADNESTICOST,Estimation de la structure des réseaux neuronaux par simulations contrainte par des séquences de potentiels d'action observées(2022)
    • بيانات النشر:
      CCSD
    • الموضوع:
      2025
    • نبذة مختصرة :
      Clustering algorithms became an essential part of the neurophysiological data analysis toolbox in the last twenty five years. Many problems, from the definition of cell types/groups based on morphological, molecular and physiological data to the identification of sub-networks in fMRI data, are now routinely tackled with clustering analysis. Since the datasets to which this type of analysis is applied tend to be defined in larger and larger dimensional spaces, there is a need for efficient and robust clustering methods in high dimension. There is also a need for methods that assume as little as possible about the clusters shape and size. We report here our experience with the ToMATo (Topological Mode Analysis Tool) algorithm. It is based on a definitely deep mathematical theory (algebraic topology), but its Python based open-source implementation is easily accessible to practitioners. We applied ToMATo to a problem we know well, spike sorting. Its capability to work in the "native" space of the data (no dimension reduction is required) is remarkable, as well as its robustness with respect to outliers (superposed spikes). ; Les algorithmes de clustering sont devenus un ingrédient essentiel pour l'analyse des données en neurophysiologie depuis une vingtaine d'années. La méthode du clustering permet de résoudre de nombreux problèmes depuis la définition de groupes/types cellulaires basés sur des données morphologiques, moléculaires ou physiologiques, jusqu'à l'identification de sous-réseaux en IRMf. Comme les jeux de données auxquels ce type d'analyse est appliquée ont tendance à être définis dans des espaces de dimension de plus en plus grande, le besoin de méthodes de clustering efficaces et robustes est accru. Il est également important que ces méthodes utilisent le moins d'hypothèses possibles concernant la forme et la taille des clusters. Nous présentons nos travaux utilisant l'algorithme ToMATo (Topological Mode Analysis Tool). Cet algorithme s'appuie sur la théorie mathématique développée en topologie ...
    • الدخول الالكتروني :
      https://hal.science/hal-05267380
      https://hal.science/hal-05267380v1/document
      https://hal.science/hal-05267380v1/file/ToMATo_for_spike_sorting.pdf
    • Rights:
      http://creativecommons.org/licenses/by/ ; info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.CDA9646D