Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Converting POS-tag and Lemma Annotations into the Universal Dependencies Format : A Case Study on Alsatian and Occitan ; Transformation d’annotations en parties du discours et lemmes vers le format Universal Dependencies : étude de cas pour l’alsacien et l’occitan

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • Contributors:
      Cognition, Langues, Langage, Ergonomie (CLLE-ERSS); École pratique des hautes études (EPHE); Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université Toulouse - Jean Jaurès (UT2J)-Université Bordeaux Montaigne-Centre National de la Recherche Scientifique (CNRS); Linguistique, Langues et Parole (LILPA); Université de Strasbourg (UNISTRA); Ecole Nationale Supérieure d'Informatique pour l'Industrie et l'Entreprise (ENSIIE); Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI); Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS); Formes et représentations en linguistique, littérature et dans les arts de l’image et de la scène (FORELLIS); Université de Poitiers; ANR; ANR-14-CE24-0003,RESTAURE,RESsources informatisées et Traitement AUtomatique pour les langues REgionales(2014)
    • بيانات النشر:
      HAL CCSD
      ATALA
    • الموضوع:
      2019
    • Collection:
      Archive ouverte HAL (Hyper Article en Ligne, CCSD - Centre pour la Communication Scientifique Directe)
    • الموضوع:
    • نبذة مختصرة :
      International audience ; This article presents a retrospective report on the transformation of annotated corpora for Alsatian and Occitan into the CONLL-U format defined in the Universal Dependencies project. In particular, it emphasizes various issues to be taken into account, concerning the tokenization and the definitionof the categories. ; Cet article présente un retour d’expérience sur la transformation de corpus annotés pour l’alsacien et l’occitan vers le format CONLL-U défini dans le projet Universal Dependencies. Il met en particulier l’accent sur divers points de vigilance à prendre en compte, concernant la tokénisation et la définition des catégories pour l’annotation.
    • Relation:
      hal-02123743; https://hal.archives-ouvertes.fr/hal-02123743; https://hal.archives-ouvertes.fr/hal-02123743/document; https://hal.archives-ouvertes.fr/hal-02123743/file/UD_TALN19.pdf
    • Rights:
      info:eu-repo/semantics/OpenAccess
    • الرقم المعرف:
      edsbas.E17FBD50