Executive Secretary

III International Symposium on “Generation and Transfer of Knowledge for Digital Transformation

SITIC 2025

Named entity recognition dynamic retraining system with generative artificial intelligence

Abstract

Natural language processing models for the recognition of named entities face the problem that when new words emerge in the language, it is not possible to extract and classify them correctly, which is why this research proposes the generation of new training data through the use of large language models such as LlaMa 3.5, creating synthetic data and the retraining of the named entity recognition models such as the models from the spaCy library, avoiding catastrophic forgetting.

Resumen

En la actualidad los modelos de procesamiento del lenguaje natural para el reconocimiento de entidades nombradas, se enfrentan a la problemática de que al surgir nuevas palabras en el idioma no sea posible extraerlas y clasi-ficarlas de manera correcta, por lo que se propone en esta investigación la generación de nuevos datos de entrenamiento mediante el uso de grandes modelos de lenguaje como LlaMa 3.5, creando datos sintéticos y el rentrenamiento de los modelos de reconocimiento de entidades nombradas como los modelos de la biblioteca spaCy, evitando el olvido catastrófico.