
La startup Argilla, plataforma de código abierto para el procesamiento del lenguaje natural (PNL) fundamentada en datos, declaró el cierre de una ronda de financiación semilla de 1,6 millones de dólares (1,5 millones de euros). La operación fue co-dirigida por Zetta Venture Partners, la primera firma de capital de riesgo enfocada en la inversión exclusiva en inteligencia artificial (IA), y por Caixa Capital Risc, una deeptech dedicada a la infraestructura de datos y herramientas de desarrollo.
Los recursos obtenidos se destinarán a intensificar el desarrollo de etiquetado de datos de código abierto y a ampliar los flujos de trabajo de retroalimentación para sus clientes corporativos. También tienen previsto presentar la herramienta Argilla Cloud, dirigida a empresas que necesitan escalar los flujos de trabajo de selección y etiquetado de datos. Se anticipa que estará disponible en el primer trimestre de 2023.
Un modelo que se fundamenta en datos personalizados y ciclos de retroalimentación
Fundada en junio de 2021 por Francisco Aranda y Daniel Vila Suero, la visión de Argilla se basa en la retroalimentación humana y la cooperación entre expertos y equipos de datos. Al confiar en que la clave del éxito de las aplicaciones empresariales de PNL reside en los datos, la propuesta de valor se enfoca en entrenamientos de datos de alta calidad, en lugar de incrementar el tamaño del modelo en miles de millones de parámetros.
Por esto, la startup ha creado una plataforma de etiquetado de datos de código abierto, que permite que los equipos de datos y aprendizaje automático construyan y supervisen entrenamientos de alta calidad, mientras es lo suficientemente simple para integrarse con otras herramientas de PNL y aprendizaje automático.
Así, las empresas pueden aprovechar la plataforma de Argilla para involucrar a los expertos en su ciclo de vida de PNL y asegurar que los modelos utilizados cumplan con sus requisitos, logrando disminuir el costo del etiquetado y el tiempo necesario para etiquetar manualmente miles de ejemplos de entrenamiento. Argilla facilita la adaptación de modelos pre entrenados a casos de uso específicos de las empresas, lo que les permite optimizar mejor sus soluciones PNL.
El secreto está en el aprendizaje automático
Desde Argilla afirman que el etiquetado programático puede hacer una gran diferencia en términos de productividad, especialmente cuando se confía en expertos en la materia sin necesidad de que programen, «pero no es la única y más relevante solución para el problema del etiquetado de datos. Creemos que los flujos de trabajo robustos de MLOps (Machine Learning Operations), diseñados en torno a ciclos de retroalimentación y colaboración, constituyen la solución”, aseguran. Por ello, la startup concentrará sus esfuerzos en establecer conexiones e integraciones con plataformas de aprendizaje automático ampliamente usadas.
En la actualidad, Argilla es empleada por miles de usuarios y numerosas empresas de diversos sectores, como atención médica, TI, medios y servicios financieros de Europa, Estados Unidos, Sudamérica y Asia, que utilizan las capacidades del etiquetado programático de la plataforma para desarrollar productos de PNL de manera más eficiente.
Imagen: Depositphotos