GDMix de código abierto de LinkedIn, un marco para entrenar modelos de personalización de IA

LinkedIn recientemente abrió GDMix, un marco que hace que el entrenamiento de modelos de personalización de IA sea aparentemente más eficiente y requiere menos tiempo.

La compañía propiedad de Microsoft dice que es una mejora con respecto al lanzamiento anterior de LinkedIn en el espacio, Photon ML, porque admite modelos de aprendizaje profundo.

GDMix entrena modelos de efectos fijos y de efectos aleatorios, dos tipos de modelos utilizados en la personalización de búsquedas y los sistemas de recomendación.

Normalmente son difíciles de entrenar de forma aislada, pero GDMix acelera el proceso dividiendo los modelos grandes en un modelo global (efecto fijo) y muchos modelos pequeños (efectos aleatorios) y luego resolviéndolos individualmente.

Este enfoque de divide y vencerás permite un entrenamiento más rápido de modelos con hardware básico, según LinkedIn, eliminando así la necesidad de procesadores especializados, memoria y equipos de red.

GDMix utiliza TensorFlow para la lectura de datos y el cálculo de gradientes, lo que según LinkedIn condujo a una mejora de la velocidad de entrenamiento del 10% al 40% en varios conjuntos de datos en comparación con Photon ML.

El marco entrena y evalúa modelos automáticamente y puede manejar modelos del orden de cientos de millones.

GDMix

DeText

Un conjunto de herramientas para clasificar con énfasis en las características textuales, se puede utilizar dentro de GDMix para entrenar de forma nativa como un modelo global de efectos fijos.

(DeText en sí mismo se puede aplicar a una variedad de tareas, incluida la clasificación de búsqueda y recomendación, clasificación de clases múltiples y comprensión de consultas).

Aprovecha la coincidencia semántica, utilizando redes neuronales profundas para comprender las intenciones de los miembros en los sistemas de búsqueda y recomendación.

Los usuarios pueden especificar un tipo de modelo de efectos fijos y DeText y DMix lo entrenarán y evaluarán automáticamente, conectando el modelo a los modelos de efectos aleatorios posteriores.

Actualmente, GDMix admite modelos de regresión logística y modelos naturales profundos que DeText admite, así como modelos arbitrarios que los usuarios diseñan y entrenan fuera de GDMix.

El código abierto de GDMix se produce después de que LinkedIn lanzó un conjunto de herramientas para medir la equidad del modelo de IA: LinkedIn Fairness Toolkit (LiFT).

LiFT se puede implementar durante la capacitación para medir los sesgos en los corpora y evaluar las nociones de equidad de los modelos mientras detecta diferencias en su desempeño entre subgrupos.

LinkedIn dice que ha aplicado LiFT internamente para medir las métricas de equidad de los conjuntos de datos de entrenamiento para los modelos antes de su entrenamiento.

Fuente y foto: https://venturebeat.com/2020/09/29/linkedin-open-sources-gdmix-a-framework-for-training-ai-personalization-models/