Guarani AI: Cuando construir tecnología en lenguajes implica construir comunidad

El proyecto de El Surti construye tecnología más inclusiva a través del entrenamiento de un chatbot y la recolección de datos de voces. Conoce cómo las comunidades locales lideran el proceso

Primer encuentro de pytyvõhára (facilitadores comunitarios) en la redacción de El Surti en Asunción (Crédito: Milena Coral).

Por Alejandro Valdez Sanabria y Sebastian Auyanet

A principios de mayo, y de manera silenciosa, algo poderoso pasó en Asunción, Paraguay. No fue solo el inicio oficial de nuestras mingas de datos (reuniones de trabajo colectivo donde las comunidades se unen para construir algo en beneficio común) para completar los datasets de Common Voice de Mozilla. Ni fue el momento en que nuestro chatbot de IA finalmente comenzó a lidiar con pedidos de suscripciones reales. Fue algo mucho más profundo: un punto de quiebre en cómo estamos reimaginando la intersección de lenguaje, tecnología, sustentabilidad y comunidad para nuestra organización. 

El proyecto: AIkuaa

AIkuaa (un juego de palabras que combina “IA” con “ikuaa”, que en guaraní significa “saber”, algo así como “yo sé IA”) es una iniciativa liderada por El Surti para crear y fortalecer datos abiertos de voz en guaraní, uno de los idiomas oficiales de Paraguay y una de las lenguas indígenas más habladas de Sudamérica.

Los grandes modelos de lenguaje (LLM, por sus siglas en inglés) han ampliado la brecha digital, ya que las lenguas predominantemente orales como el guaraní están severamente subrepresentadas por la falta de datos de entrenamiento. Esto deja a casi 7 millones de hablantes en Paraguay, Bolivia y Argentina aún más vulnerables a la desinformación, la exclusión digital y el debilitamiento de sus derechos lingüísticos.

Nuestro objetivo es simple pero ambicioso: que las tecnologías de voz (desde el reconocimiento de habla hasta los asistentes con IA) puedan entender y hablar guaraní.

Primer encuentro de pytyvõhára (facilitadores comunitarios) en la redacción de El Surti en Asunción.

¿Cómo lo estamos haciendo?

  • Organizando mingas (hackatones comunitarios enraizados en tradiciones latinoamericanas de trabajo colectivo) para poblar el conjunto de datos de Common Voice de Mozilla con audios en guaraní.

  • Entrenando modelos de IA para comprender el guaraní oral, usando los aportes que recopilamos en las mingas.

  • Integrando este trabajo con un chatbot capaz de procesar guaraní hablado para interactuar con nuestra comunidad en su propio idioma.

  • Construyendo un repositorio abierto de conocimiento para que organizaciones y medios puedan responder mejor a audiencias que usan lenguas orales.

En definitiva, se trata de diseñar infraestructura cultural: no solo para que las personas contribuyan a la IA, sino para que puedan moldearla a nivel sistémico. En este breve artículo, compartimos algunos aprendizajes que tuvimos hasta ahora.

Populación de audio en Guarani con la interfaz de Common Voice durante un aminga en Arroyito, a 320 kilómetros de Asunción, Paraguay.

Crear una comunidad de voces abiertas: un hito de pertenencia

Uno de nuestros primeros logros estuvo relacionado con más que apenas cumplir una meta: involucró energía, coordinación y, sobre todo, un sentido de pertenencia.

El 11 de mayo realizamos nuestro primer encuentro presencial (minga) junto a la increíble cohorte de Pytyvõhára, los facilitadores capacitados para liderar nuestras hackatones comunitarias. Ellos estarán en el corazón de una red creciente de datos de voz abiertos en guaraní: una verdadera comunidad de voces abiertas. Los resultados fueron movilizantes.

Nuestras guías funcionaron (con espacio para mejorar), el ambiente fue colaborativo y los participantes no solo estaban motivados a contribuir: realmente sentían que eran parte de un hecho significativo.

¿Qué hallazgo nos sorprendió? Nos dimos cuenta de que la mejor manera de escalar este esfuerzo no es únicamente digital, sino híbrida. Aprendimos que contribuir a un conjunto de datos de voz puede ser una tarea lenta, tediosa e incluso sentirse extractiva. Pero cuando transformamos esa tarea solitaria en un acto colectivo de participación, se vuelve un llamado poderoso a la acción cívica.

Materiales impresos para populación de audio con la revista impresa de El Surti como regalo durante una minga en Arroyito.

Aprender haciendo: diseñar para una lengua oral

Como siempre, prepararse para la primera hackatón tomó tiempo. Necesitábamos los facilitadores adecuados, los mejores flujos de trabajo y un enfoque que no solo “funcionara”, sino que honrara la importancia cultural de lo que estamos construyendo. Diseñar la incorporación, las herramientas y las guías de modo que quienes contribuyeran se sintieran empoderados (y no solo instruidos) fue un proceso de aprendizaje en sí mismo.

Después del primer encuentro, la cohorte de pytyvõhára, salió equipada con recursos prácticos para activar mingas en sus comunidades. 

A nivel técnico, estas mingas cumplen un rol clave: asegurar que el conjunto de datos de voz sea robusto y verdaderamente representativo. Esto significa recolectar muestras diversas en cuanto a acentos, tonos, edades, velocidades de habla y niveles de volumen. Al crear espacios donde participan personas de distintas regiones, generaciones y estilos de habla, se logra capturar la riqueza y variedad del guaraní tal como se habla en la vida cotidiana.

Uno de los aprendizajes clave: los beneficios de contribuir a datos de voz abiertos suelen ser indirectos y de largo plazo. Por eso, más allá de promover el sentido de pertenencia, estamos aprendiendo a abrazar la cosmovisión que vive en el lenguaje, y a ofrecer oportunidades de aprendizaje significativas que puedan motivar y sostener la participación.

Este enfoque en la cosmovisión es fundamental. Porque un idioma no es solo un conjunto de signos: es una forma de ver el mundo, de entender el tiempo, las relaciones y la vida misma. Y esa visión del mundo no siempre se alinea con las lenguas coloniales como el español, el inglés o el francés.

Otro gran desafío que hemos encontrado es que, incluso en proyectos como Common Voice de Mozilla, la experiencia de usuario (UX) sigue diseñada con las lenguas escritas en mente. Pero muchas personas hablantes de guaraní no necesariamente se expresan por escrito. Por ahora, estamos desarrollando una metodología mixta dentro de nuestras mingas para acortar esa brecha. También estamos explorando activamente alternativas al diseño de UX/UI estándar, que den espacio y forma a lenguas orales como el guaraní.

Validación de audio en la estación pop-up de AIKUAA en el Festival Roa Bastos de Periodismo en Atyrá, a 60 kilómetros de Asunción.

¿Qué sigue?

En los próximos meses, continuaremos expandiendo los datasets, refinando nuestro proceso de validación y profundizando en nuestra conexión con las comunidades que hablan –y viven– el lenguaje. 

Si bien la participación cívica es ya un logro poderoso que está alineado con la misión y la visión de El Surti, también esperamos que al mejorar el dataset de idioma Guaraní fortalecerá nuestras herramientas editoriales –por ejemplo mejorando las transcripciones asistidas por IA– y nuestro set de herramientas para gestión comunitaria, como por ejemplo seguir mejorando el chatbot que maneja suscripciones y responde a las necesidades de nuestros usuarios que ya son suscriptos. 

Nuestro objetivo final es desarrollar una metodología replicable que otras organizaciones de medios puedan adoptar para servir mejor a audiencias que se comunican a través de lenguas orales, contribuyendo así a un ecosistema de IA más inclusivo y representativo del Sur Global. 

Una de las mingas comunitarias en Arroyito.

La IA como excusa para acercarnos 

Comenzamos este proyecto profundamente convencidos de que los usos más significativos de la inteligencia artificial no son para la generación de contenido, si no para crear interacciones en el mundo real y cara a cara entre las personas y los medios a los que apoyan. Y estamos comenzando a ver cómo eso se convierte en algo real.

Con Aikuaa, no estamos simplemente entrenando máquinas – estamos creando espacios en los que las personas se sienten vistas, escuchadas y además parte de algo mucho más grande. 

A menudo, estos esfuerzos de democratización del acceso a las tecnologías suelen estar a nivel estatal, pero no podemos permitirnos el lujo de esperar que esto simplemente suceda a ese nivel, porque podría no suceder en absoluto. Pero con estas iniciativas, estamos intentando que por lo menos estos temas comiencen a aparecer en esas conversaciones. Y solamente estamos comenzando.

———

Este artículo es parte de una serie que ofrece actualizaciones de los 35 equipos beneficiarios del JournalismAI Innovation Challenge, apoyado por la Google News Initiative. Clickea aquí para leer otros artículos de nuestros grantees.

Previous
Previous

Guarani AI: When building language tech means building community

Next
Next

Media leaders from Sub-Saharan Africa join JournalismAI Academy