Unsupervised Linking of Unstructured Data Entities to a Knowledge Graph

21 Oct 2025
Graphe de Connaissance, Ontologie, Similarité d'Embedding, Contexte, Texte Libre

Abstract

Récemment, les grands modèles de langage (LLM) ont été utilisés pour générer des données structurées sous forme de graphes à partir de texte non structuré. Cependant, certains nœuds extraits manquent d’informations et un réentraînement est nécessaire chaque fois que le graphe change. Nous proposons une approche non supervisée basée sur la similarité des embeddings, pour lier les entités extraites par un LLM à partir de données textuelles non structurées aux nœuds d’un graphe de connaissances, généré selon une ontologie. Testés sur trois ensembles de données issus d’un cas d’utilisation de la cybersécurité maritime, les résultats indiquent une amélioration de la précision de 86,2 % à 91,4 %, selon le nombre de voisins et de nœuds candidats dans le contexte.

Citation

A paraitre.

En savoir plus : https://ijckg2025.github.io/