La Inteligencia Artificial (IA) ya forma parte esencial del presente y la utilizamos a diario a través de asistentes de voz, traductores automáticos, coches autónomos, chatbots multitareas… El entrenamiento de algoritmos para esta tecnología se ha convertido en imprescindible para impulsar su crecimiento. El mercado de entrenamiento de datos para estos sistemas está valorado en más de 1.100 millones de dólares (datos anuales 2020) y la previsión de crecimiento en Europa es de un 31% anual durante los próximos 5 años, según Marketwatch.
En este contexto se lanza al mercado M47.IA, la primera plataforma en España centrada en el entrenamiento de algoritmos de aprendizaje automático para startups, pymes y grandes empresas. Su equipo fundador quiere democratizar el acceso a datos de calidad en diferentes idiomas para el entrenamiento de Inteligencia Artificial. Esta startup nace con la misión de entrenar a los algoritmos mediante una combinación de automatización y refuerzo humano (“human-in-the-loop”).
“Gracias a la tecnología de aprendizaje automático y a la supervisión humana a través de un equipo de expertos multicultural, nuestro servicio permite a las empresas de todos los sectores obtener soluciones de IA imparciales y de calidad. Algunos ejemplos de la aplicación de esta metodología serían la capacidad de los sistemas para detectar el espectro completo de tonos de piel, evitando así sesgos raciales; o el análisis automático de textos legales para evitar la introducción de sesgos de género”, explica Enric Plana, CEO de M47.IA.
El objetivo de este proyecto emprendedor es que las empresas que desarrollen tecnología de Inteligencia Artificial puedan entrenar y mejorar sus algoritmos. Su sistema trabaja con distintos recursos que servirán de entrenamiento para el perfeccionamiento de algoritmos:
- Anotación rápida de datos en cualquier idioma.
- Gestión de recursos internos y/o externos que permiten seleccionar quién entrenará los algoritmos (ya sean personas de la propia organización o un equipo de especialistas de M47.AI) y tener el control sobre los anotadores, las tareas, los KPI, los cronogramas, los revisores, etc.
- Automatización de la anotación con técnicas de aprendizaje automático (ML): M47.AI es capaz de conectarse a las bibliotecas multilingües NLP (Procesamiento del Lenguaje Natural) de última generación como spaCy, NLTK o HuggingFace, lo que permite una anotación previa rápida en varios idiomas.
- Creación, administración e importación de sus propios conjuntos de datos y conjuntos de etiquetas o mediante la biblioteca pública de M47.AI que contiene una variedad de textos multilingües procedentes de twitter, wikipedia, noticias y otras fuentes de texto de acceso libre listas para ser utilizadas.
“Partimos de la idea de que los algoritmos de Inteligencia Artificial no son perfectos: los modelos generalistas no se adaptan a las necesidades específicas de cada empresa, tienen poca fiabilidad, no se ajustan bien a otros idiomas que no sean inglés y pueden reproducir sesgos (culturales, raciales, de género, etc.). Pero los algoritmos pueden entrenarse mediante la obtención de datos de calidad anotados por especialistas, seguros, diversos y obtenidos de una fuente de datos ética, legal y sin errores como la que proponemos”, explica Enric Plana.
M47.IA pretende derribar dos de los principales problemas que encuentran las empresas que quieren trabajar con IA. Por un lado, la falta de datos de entrenamiento de calidad y correctamente anotados. Por otro, la falta de datos en idiomas que no sea inglés; entorno que obliga a las empresas sin recursos a desarrollar sus algoritmos para mercados de habla inglesa. El desarrollo de tecnologías del procesamiento de lenguaje natural (NLP) en español está un paso por detrás del inglés y representa menos del 30% del mercado mundial, según la consultora Credence Research.