Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Phonolette: a grapheme-to-phoneme converter for French ; Phonolette : un convertisseur graphème-phonème du français

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Université de Toulouse (UT); Cognition, langues, langage, ergonomie (CLLE); École Pratique des Hautes Études (EPHE); Université Paris Sciences et Lettres (PSL)-Université Paris Sciences et Lettres (PSL)-Université Toulouse - Jean Jaurès (UT2J); Université de Toulouse (UT)-Université de Toulouse (UT)-Université Bordeaux Montaigne (UBM)-Centre National de la Recherche Scientifique (CNRS)-Toulouse Mind & Brain Institut (TMBI); Université Toulouse - Jean Jaurès (UT2J); Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3); Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J); Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3); Université Paris Cité (UPCité); Laboratoire de Linguistique Formelle (LLF - UMR7110); Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité); ANR-17-CE23-0005,DEMONEXT,Dérivation Morphologique en Extension(2017)
    • بيانات النشر:
      HAL CCSD
      UMR 8163 STL « Savoirs, Textes, Langage »
      Université de Lille
    • الموضوع:
      2023
    • Collection:
      Université Toulouse 2 - Jean Jaurès: HAL
    • نبذة مختصرة :
      International audience ; This paper presents Phonolette, a phonologizer for the French language, capable of predicting a phonological transcription of a word from its orthographic representation. Phonolette is based on a bidirectional LSTM architecture. The training protocol of Phonolette combines orthographic forms from the GLÀFF lexicon and phonological transcriptions from Flexique. Two datasets were used: the intersection of GLÀFF and Flexique entries; and the same intersection, but keeping only those forms with French graphotactics. The results are promising. Accuracy is 97.82% for the full dataset and 98.11% for the reduced dataset. ; L'article présente Phonolette, un phonologiseur du français, capable de prédire une transcription phonologique d'un mot à partir de sa représentation orthographique. Phonolette est basé sur une architecture LSTM bidirectionnelle. Le protocole d'apprentissage de Phonolette combine les formes orthographiques du lexique GLÀFF et les transcriptions phonologiques de Flexique. Deux jeux de données ont été utilisés : l'intersection des entrées de GLÀFF et de Flexique ; la même intersection, mais en conservant seulement les formes qui ont une graphotactique française. Les résultats obtenus sont prometteurs. La précision est de 97,82 % sur le jeu complet et de 98,11 % sur le jeu réduit.
    • Relation:
      hal-04363593; https://hal.science/hal-04363593; https://hal.science/hal-04363593/document; https://hal.science/hal-04363593/file/lex33_calderone_al_bat_pdf_5_12_2023.pdf
    • الرقم المعرف:
      10.54563/lexique.1129
    • الدخول الالكتروني :
      https://hal.science/hal-04363593
      https://hal.science/hal-04363593/document
      https://hal.science/hal-04363593/file/lex33_calderone_al_bat_pdf_5_12_2023.pdf
      https://doi.org/10.54563/lexique.1129
    • Rights:
      http://creativecommons.org/licenses/by/ ; info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.CB777BF5