Facebooktwitterlinkedin

La startup Argilla, plataforma de código abierto para el procesamiento del lenguaje natural (PNL) basada en datos, anunció el cierre de una ronda de financiación semilla de 1,6 millones de dólares (1,5 millones de euros). La operación fue co-liderada por Zetta Venture Partners, la primera firma de capital de riesgo dedicada a la inversión exclusiva de inteligencia artificial (IA), y por Caixa Capital Risc, una deeptech centrada en infraestructura de datos y herramientas de desarrollo.

Los fondos recaudados se utilizarán para profundizar el desarrollo de etiquetado de datos de código abierto y para ampliar los flujos de trabajo de retroalimentación para sus clientes empresariales. También planean lanzar la herramienta Argilla Cloud, para empresas que requieren escalar los flujos de trabajo de selección y etiquetado de datos. Se espera que esté disponible el primer trimestre de 2023.

Un modelo que se basa en datos personalizados y bucles de retroalimentación

Fundada en junio de 2021 por Francisco Aranda y Daniel Vila Suero, la visión de Argilla se basa en la retroalimentación humana y la colaboración entre expertos y equipos de datos. Confiando en que la clave del éxito de las aplicaciones empresariales de PNL son los datos, la propuesta de valor está en centrar sus esfuerzos en entrenamientos de datos de alta calidad, en lugar de aumentar el tamaño del modelo en miles de millones de parámetros.

Es por esto que la startup ha desarrollado una plataforma de etiquetado de datos de código abierto, que permite que los equipos de data y machine learning puedan construir y supervisar entrenamientos de alta calidad, a la vez que es lo suficientemente sencilla como para integrarse con otras herramientas de PNL y machine learning.

De esta manera, las empresas pueden utilizar la plataforma de Argilla para implicar a los especialistas en su ciclo de vida de PNL y garantizar que los modelos utilizados se ajusten a sus requerimientos, logrando reducir el coste del etiquetado y el tiempo que se necesita para etiquetar manualmente miles de ejemplos de entrenamiento. Argilla hace más fácil que se puedan adaptar modelos pre entrenados a casos de uso específico de las empresas, lo que les ayuda a aprovechar mejor sus soluciones PNL.

La clave está en el machine learning

Desde Argilla indican que el etiquetado programático puede marcar una gran diferencia en términos de productividad, especialmente cuando se pone en manos de expertos en la materia sin necesidad de que programen, «pero no es la solución única y más importante para el problema del etiquetado de datos. Creemos que los flujos de trabajo sólidos de MLOps (Machine Learning Operations), creados en torno a ciclos de retroalimentación y colaboración, son la solución”, indican. Por eso, la startup centrará sus esfuerzos en construir puentes e integraciones con plataformas de machine learning ampliamente utilizadas.

Actualmente, Argilla es utilizada por miles de usuarios y docenas de empresas de diferentes sectores, como atención médica, TI, medios y servicios financieros de Europa, Estados Unidos, Sudamérica y Asia, que hacen uso de las funciones del etiquetado programático de la plataforma para crear productos de PNL más eficientemente.

Imagen: Depositphotos

 

Mantente informado de las noticias más relevantes en nuestro canal de Telegram

Escribir comentario

¡Mantente al día!