Executive Secretary

III International Symposium on “Generation and Transfer of Knowledge for Digital Transformation "SITIC 2025"

III International Symposium on “Generation and Transfer of Knowledge for Digital Transformation

SITIC 2025

Diseño del buscador semántico de la mediateca de la prensa cubana
Set Favorite

Abstract

This work proposes the development of a specialized semantic search engine for content analysis in the Cuban press, integrating domain ontologies and intelligent agents to improve information retrieval and classification. The system uses an ontology that models key concepts (politics, economy, culture, historical events), semantic relationships, and the Cuban geopolitical context, enabling more precise searches that overcome the limitations of traditional keyword-based search engines. Intelligent agents automate the extraction, categorization, and linking of entities (personalities, institutions, locations) from news sources, while Natural Language Processing (NLP) techniques enrich the metadata. The architecture combines a data ingestion module (connectors to Cuban digital media), a knowledge graph for storing contextual relationships, and an inference engine that expands queries using ontological reasoning. As a result, the system allows complex queries ("impact of the blockade on public health") through semantic expansion and suggests related content based on the Cuban historical and institutional context. Preliminary evaluations show a 30% improvement in relevance compared to traditional solutions, highlighting its usefulness for researchers and journalists. Future improvements include the incorporation of language models (LLMs) for automatic summarization and the detection of media bias, consolidating this tool as a reference for the critical analysis of information in Cuba.

Resumen

Este trabajo propone el desarrollo de un buscador semántico especializado para el análisis de contenido en la prensa cubana, integrando ontologías de dominio y agentes inteligentes para mejorar la recuperación y clasificación de información. El sistema utiliza una ontología que modela conceptos clave (política, economía, cultura, eventos históricos), relaciones semánticas y contexto geopolítico cubano, permitiendo búsquedas más precisas que superan las limitaciones de los motores de búsqueda tradicionales basados en palabras clave. Agentes inteligentes automatizan la extracción, categorización y vinculación de entidades (personalidades, instituciones, ubicaciones) desde fuentes noticiosas, mientras técnicas de Procesamiento de Lenguaje Natural (PLN) enriquecen los metadatos. La arquitectura combina un módulo de ingesta de datos (conectores a medios digitales cubanos), un grafo de conocimiento para almacenar relaciones contextuales y un motor de inferencia que expande consultas usando razonamiento ontológico. Como resultado, el sistema permite consultas complejas ("impacto del bloqueo en la salud pública") mediante expansión semántica y sugiere contenido relacionado con base en el contexto histórico-institucional cubano. Evaluaciones preliminares muestran un 30% de mejora en la relevancia respecto a soluciones tradicionales, destacando su utilidad para investigadores y periodistas. Futuras mejoras incluyen la incorporación de modelos de lenguaje (LLMs) para resúmenes automáticos y la detección de sesgos mediáticos, consolidando esta herramienta como referencia para el análisis crítico de la información en Cuba.

Palabras Clave: buscador semántico, prensa cubana, ontologías, agentes inteligentes, grafo de conocimiento, PLN, recuperación de información.

About The Speaker

Amed Abel Leiva Mederos

Dr. Amed Abel Leiva Mederos

UCLV Flag of Cuba

Profesor del departamento de CI

Discussion

Practical Info
Presentation
Spanish / Español
October 22, 2025 10:10 AM
5 minutes
Hotel Grand Memories Cayo Santa María
Authors
Dr. Amed Abel Leiva Mederos
Livia Reyes
Yorjandy Martínez Lamas
Keywords
agentes inteligentes
buscador semántico
cuban press
grafo de conocimiento
information retrieval.
intelligent agents
knowledge graph
nlp
ontologies
ontologías
pln
prensa cubana
recuperación de información.
semantic search engine
Documents