Executive Secretary

1st. Summer School on Knowledge Graphs and Semantic Web "CINDUS 2019"

1st. Summer School on Knowledge Graphs and Semantic Web

CINDUS 2019

Scalable Large-Margin Distance Metric Learning usando Gradiente Descendente en Apache Spark

El aprendizaje de una función de distancia (DML) es una técnica efectiva para aprender una función de distancia basada en los datos y permite mejorar el rendimiento de algoritmos de aprendizaje automático ante problemas de clasificación, regresión, agrupamiento entre otros. La mayoría de los algoritmos empleados en esta área necesitan aprender una matriz de Mahalanobis, que es semidefinida positiva y escala cuadráticamente con el número de características de los datos de entrada. Además, si sumamos a esto el volumen creciente de información en problemas reales, el costo computacional durante la etapa de aprendizaje es muy alto. En este trabajo, aprovechando el poder de la computación distribuida y específicamente las bondades de Apache Spark en problemas de aprendizaje automatizado se propone una variante distribuida del algoritmo LMDML-A que logra acelerar el proceso de aprendizaje y que puede ser utilizado en problemas con grandes volúmenes de datos.

El aprendizaje de una función de distancia (DML) es una técnica efectiva para aprender una función de distancia basada en los datos y permite mejorar el rendimiento de algoritmos de aprendizaje automático ante problemas de clasificación, regresión, agrupamiento entre otros. La mayoría de los algoritmos empleados en esta área necesitan aprender una matriz de Mahalanobis, que es semidefinida positiva y escala cuadráticamente con el número de características de los datos de entrada. Además, si sumamos a esto el volumen creciente de información en problemas reales, el costo computacional durante la etapa de aprendizaje es muy alto. En este trabajo, aprovechando el poder de la computación distribuida y específicamente las bondades de Apache Spark en problemas de aprendizaje automatizado se propone una variante distribuida del algoritmo LMDML-A que logra acelerar el proceso de aprendizaje y que puede ser utilizado en problemas con grandes volúmenes de datos.

About The Speaker

Christian Ariel Isac Palma

Lic. Christian Ariel Isac Palma

Datys Flag of Cuba
Practical Info
Spanish / Español
Not defined
15 minutes
Not defined
Authors
Carlos Morell Pérez
Lic. Christian Ariel Isac Palma
Keywords
Aprendizaje de distiancia
apache spark