Executive Secretary
III International Symposium on “Generation and Transfer of Knowledge for Digital Transformation
SITIC 2025
Abstract
This work proposes the development of a specialized semantic search engine for content analysis in the Cuban press, integrating domain ontologies and intelligent agents to improve information retrieval and classification. The system uses an ontology that models key concepts (politics, economy, culture, historical events), semantic relationships, and the Cuban geopolitical context, enabling more precise searches that overcome the limitations of traditional keyword-based search engines. Intelligent agents automate the extraction, categorization, and linking of entities (personalities, institutions, locations) from news sources, while Natural Language Processing (NLP) techniques enrich the metadata. The architecture combines a data ingestion module (connectors to Cuban digital media), a knowledge graph for storing contextual relationships, and an inference engine that expands queries using ontological reasoning. As a result, the system allows complex queries ("impact of the blockade on public health") through semantic expansion and suggests related content based on the Cuban historical and institutional context. Preliminary evaluations show a 30% improvement in relevance compared to traditional solutions, highlighting its usefulness for researchers and journalists. Future improvements include the incorporation of language models (LLMs) for automatic summarization and the detection of media bias, consolidating this tool as a reference for the critical analysis of information in Cuba.
Resumen
Este trabajo propone el desarrollo de un buscador semántico especializado para el análisis de contenido en la prensa cubana, integrando ontologías de dominio y agentes inteligentes para mejorar la recuperación y clasificación de información. El sistema utiliza una ontología que modela conceptos clave (política, economía, cultura, eventos históricos), relaciones semánticas y contexto geopolítico cubano, permitiendo búsquedas más precisas que superan las limitaciones de los motores de búsqueda tradicionales basados en palabras clave. Agentes inteligentes automatizan la extracción, categorización y vinculación de entidades (personalidades, instituciones, ubicaciones) desde fuentes noticiosas, mientras técnicas de Procesamiento de Lenguaje Natural (PLN) enriquecen los metadatos. La arquitectura combina un módulo de ingesta de datos (conectores a medios digitales cubanos), un grafo de conocimiento para almacenar relaciones contextuales y un motor de inferencia que expande consultas usando razonamiento ontológico. Como resultado, el sistema permite consultas complejas ("impacto del bloqueo en la salud pública") mediante expansión semántica y sugiere contenido relacionado con base en el contexto histórico-institucional cubano. Evaluaciones preliminares muestran un 30% de mejora en la relevancia respecto a soluciones tradicionales, destacando su utilidad para investigadores y periodistas. Futuras mejoras incluyen la incorporación de modelos de lenguaje (LLMs) para resúmenes automáticos y la detección de sesgos mediáticos, consolidando esta herramienta como referencia para el análisis crítico de la información en Cuba.
Palabras Clave: buscador semántico, prensa cubana, ontologías, agentes inteligentes, grafo de conocimiento, PLN, recuperación de información.
About The Speaker
Dr. Amed Abel Leiva Mederos

Profesor del departamento de CI
Discussion