Classification de documents métiers pour l'aide à l'extraction et la classification de relations lexico-sémantiques typées et pondérées - APIA-2023
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Poster De Conférence Année : 2023
Classification de documents métiers pour l'aide à l'extraction et la classification de relations lexico-sémantiques typées et pondérées
1 Berger-Levrault (104 avenue du Président Kennedy 75016 Paris - France)
"> Berger-Levrault
2 LIRMM | TEXTE - Exploration et exploitation de données textuelles (LIRMM, 161 rue Ada, 34000 Montpellier - France)
"> LIRMM | TEXTE - Exploration et exploitation de données textuelles

Résumé

La langue française est riche et complexe dans sa nature, offrant un vaste choix de mots et de possibilités d'expression. Cependant, cette richesse peut également conduire à la polysémie des mots. L'extraction de relations lexicosémantiques dans ce cadre peut être une tâche complexe et difficile, en raison de la nature de la langue et de la façon dont les phrases sont construites. Après une extraction terminologique, l'extraction de relations entre ces termes de mêmes domaines peut être effectuée à l'aide d'une classification de type de relations. Le classifieur nous permet de confirmer un type donné entre deux termes du corpus. Ensuite, un filtre sur les relations extraites peut être appliqué en utilisant la classification par domaine métier. Cependant, sur des textes de spécialité, les algorithmes de classification multi-classe sont-ils aussi performants comme leur application sur les textes génériques ? Dans cet article, nous évaluons plusieurs modèles de classifications ayant différents types de représentation de documents pour une application à des domaines métiers. Cette évaluation a permis de constater une extraction de relations plus fine avec certains modèles.
Fichier principal
Vignette du fichier
APIA2023_paper_6869.pdf (351.02 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04160837 , version 1 (12-07-2023)

Licence

Identifiants
  • HAL Id : hal-04160837 , version 1

Citer

Camille Gosset, Mokhtar Boumedienne Billami, Mathieu Lafourcade, Christophe Bortolaso. Classification de documents métiers pour l'aide à l'extraction et la classification de relations lexico-sémantiques typées et pondérées. Christelle Launois; Catherine Roussey. APIA 2023 - 9e Conférence Nationale sur les Applications Pratiques de l’Intelligence Artificielle @PFIA2023, Jul 2023, Strasbourg, France. AFIA-Association Française pour l'Intelligence Artificielle, PFIA_2023, pp.37-40, 2023. ⟨hal-04160837⟩
151 Consultations
86 Téléchargements

Partager

More