Executive Secretary
III International Symposium on “Generation and Transfer of Knowledge for Digital Transformation
SITIC 2025
Abstract
Natural language processing models for the recognition of named entities face the problem that when new words emerge in the language, it is not possible to extract and classify them correctly, which is why this research proposes the generation of new training data through the use of large language models such as LlaMa 3.5, creating synthetic data and the retraining of the named entity recognition models such as the models from the spaCy library, avoiding catastrophic forgetting.
Resumen
En la actualidad los modelos de procesamiento del lenguaje natural para el reconocimiento de entidades nombradas, se enfrentan a la problemática de que al surgir nuevas palabras en el idioma no sea posible extraerlas y clasi-ficarlas de manera correcta, por lo que se propone en esta investigación la generación de nuevos datos de entrenamiento mediante el uso de grandes modelos de lenguaje como LlaMa 3.5, creando datos sintéticos y el rentrenamiento de los modelos de reconocimiento de entidades nombradas como los modelos de la biblioteca spaCy, evitando el olvido catastrófico.
About The Speaker
Dr. Dionis López Ramos

Discussion