Simposio “Transferencia de Conocimiento en Tecnologías de la Información”
Abstract
Extracting useful knowledge from the web and digital social platforms has become a new trend in software requirements engineering, with data-driven requirements engineering emerging. User opinions are a very valuable source of needs, demands, dissatisfaction and assessments of product features. How to effectively analyze this large volume of information to extract relevant information on these very important aspects to predict the evolution of a product is a challenge. In this paper, we present an approach based on machine learning techniques to predict requirement categories from opinion texts, as a task prior to the automatic extraction of aspect-based product assessments. This solution predicts requirements associated with functionalities, errors and others, and at the same time predicts similar requirements. The proposal has been evaluated with four datasets: Facebook, Swiftkey, Tapfish and Templerun2, with very promising results, compared to other categorization models.
Resumen
La extracción de conocimientos útiles de la web y las plataformas sociales digitales se ha convertido en una nueva tendencia en la ingeniería de requisitos de software, surgiendo la ingeniería de requisitos basada en datos. Las opiniones de los usuarios constituyen una fuente muy valiosa de necesidades, demandas, insatisfacciones y valoraciones sobre características de los productos. Como analizar eficazmente ese gran volumen de información para extraer información relevante sobre esos aspectos muy importantes para predecir la evolución de un producto constituye un gran desafío. En este trabajo, se presenta un acercamiento basado en técnicas de aprendizaje automático para predecir categorías de requisitos a partir de textos de opinión, como tarea previa a la extracción automática de valoraciones sobre aspectos de los productos. Mediante esta solución se predicen requisitos asociados a funcionalidades, errores y otros, y al mismo tiempo se predicen requerimientos similares. La propuesta ha sido evaluada con cuatro datasets, Facebook, Swiftkey, Tapfish y Templerun2, con resultados muy prometedores, a partir de su comparación con soluciones afines.
About The Speaker
Dr. Alfredo Simón Cuevas