Executive Secretary

II Conferencia Internacional de Procesamiento de la Información "CIPI - IOTAI2019" -International Workshop on Internet of Things and Artificial Intelligence

II Conferencia Internacional de Procesamiento de la Información

CIPI - IOTAI2019

Scalable Large-Margin Distance Metric Learning usando Gradiente Descendente en Apache Spark

El aprendizaje de una función de distancia (DML) es una técnica efectiva para aprender una función de distancia basada en los datos y permite mejorar el rendimiento de algoritmos de aprendizaje automático ante problemas de clasificación, regresión, agrupamiento entre otros. La mayoría de los algoritmos empleados en esta área necesitan aprender una matriz de Mahalanobis, que es semidefinida positiva y escala cuadráticamente con el número de características de los datos de entrada. Además, si sumamos a esto el volumen creciente de información en problemas reales, el costo computacional durante la etapa de aprendizaje es muy alto. En este trabajo, aprovechando el poder de la computación distribuida y específicamente las bondades de Apache Spark en problemas de aprendizaje automatizado se propone una variante distribuida del algoritmo LMDML-A que logra acelerar el proceso de aprendizaje y que puede ser utilizado en problemas con grandes volúmenes de datos.

El aprendizaje de una función de distancia (DML) es una técnica efectiva para aprender una función de distancia basada en los datos y permite mejorar el rendimiento de algoritmos de aprendizaje automático ante problemas de clasificación, regresión, agrupamiento entre otros. La mayoría de los algoritmos empleados en esta área necesitan aprender una matriz de Mahalanobis, que es semidefinida positiva y escala cuadráticamente con el número de características de los datos de entrada. Además, si sumamos a esto el volumen creciente de información en problemas reales, el costo computacional durante la etapa de aprendizaje es muy alto. En este trabajo, aprovechando el poder de la computación distribuida y específicamente las bondades de Apache Spark en problemas de aprendizaje automatizado se propone una variante distribuida del algoritmo LMDML-A que logra acelerar el proceso de aprendizaje y que puede ser utilizado en problemas con grandes volúmenes de datos.

Sobre el ponente

Christian Ariel Isac Palma

Lic. Christian Ariel Isac Palma

Datys Flag of Cuba
Información Práctica
Spanish / Español
No definido
15 minutos
No definido
Autores
Carlos Morell Pérez
Lic. Christian Ariel Isac Palma
Palabras clave
Aprendizaje de distiancia
apache spark