La UA y MasterWord se asocian para reducir la brecha digital del idioma maya q’anjob’al

ALICANTE 1 Jun. Agencias –
El grupo de investigación Transducens de la Universidad de Alicante (UA) y MasterWord (en particular su Proyecto de Preservación de Lenguas Mayas) se han asociado para reducir la brecha digital de la lengua maya q’anjob’al, un idioma con muy baja presencia en internet, pero que cuenta con más de 170.000 hablantes en el departamento guatemalteco de Huehuetenango y varios miles más en Chiapas (México).
El grupo Transducens de la UA ya coordinó recientemente un taller técnico presencial en Antigua Guatemala, bajo la supervisión del investigador de la UA Andrés Lou, en el que se abordó la traducción del conocido conjunto datos de evaluación FLORES+ a cuatro lenguas mayas: k’iche’, kaqchikel, q’eqchi’ y mam. Ahora, según explican, añadirán una quinta lengua, q’anjob’al, gracias a la alianza con MasterWord, ha detallado la institución académica en un comunicado.
Bajo esta alianza colaborativa, la Fundación MasterWord financia y remunera directamente a traductores y revisores nativos de q’anjob’al «en condiciones laborales justas, mientras que la UA aporta su infraestructura técnica y metodológica, así como su conocimiento sobre tecnologías de inteligencia artificial para lenguas con pocos recursos digitales».
Complementando esta asociación se encuentra la Fundación Proyecto Lingüístico Francisco Marroquín de Guatemala, un tercer pilar que colabora con ambas entidades para «reclutar y supervisar a los lingüistas nativos de q’anjob’al que realizarán la tarea de traducción».
Actualmente, FLORES+ cubre más de 200 idiomas de todo el mundo. Las cuatro lenguas mayas traducidas se integrarán próximamente en este conjunto de datos multilingüe, mientras que el q’anjob’al se incorporará poco después. Al integrar el q’anjob’al en FLORES+, el proyecto «garantiza que desarrolladores e investigadores de todo el mundo puedan incorporar esta lengua maya en futuros modelos de inteligencia artificial».
Está previsto que la traducción comience en julio de 2026 y tenga una duración de cuatro meses. Para cumplir con el espíritu de código abierto del conjunto de datos FLORES+ y con las recomendaciones de la UNESCO, todas las traducciones resultantes al q’anjob’al se publicarán bajo una licencia abierta (Creative Commons) y se alojarán en repositorios públicos y abiertos.
«Los derechos lingüísticos son derechos humanos, y la tecnología debe ser un puente, no una barrera, para la preservación del patrimonio indígena», ha afirmado Ludmila Golovine, directora ejecutiva de MasterWord. «Al alinear nuestra red ya activa sobre el terreno y nuestra financiación con la experiencia en traducción automática de la Universidad de Alicante, estamos garantizando que los beneficios de la innovación digital reviertan directamente en las comunidades que mantienen vivas estas lenguas», ha señalado.
Reflexionando sobre el impacto social del proyecto, Juan Antonio Pérez Ortiz, uno de los dos investigadores principales de la Universidad de Alicante, ha añadido: «Trabajar junto a MasterWord, el Proyecto de Preservación de Lenguas Mayas y la Fundación Proyecto Lingüístico Francisco Marroquín permite que nuestra investigación alcance su verdadero propósito social. Aquí no se trata solo de entrenar algoritmos, sino que estamos construyendo una base digital abierta y validada por las propias comunidades».
«Estos esfuerzos allanarán el camino para sistemas de traducción automática que faciliten el acceso a servicios esenciales de salud, educación y justicia para miles de hablantes de q’anjob’al», ha añadido Víctor Sánchez Cartagena, coinvestigador principal del proyecto en la UA. El equipo investigador de la Universidad de Alicante implicado en este proyecto también incluye a Felipe Sánchez-Martínez, director del grupo de investigación Transducens, y a los investigadores Andrés Lou Ríos y Miquel Esplà Gomis.
En colaboración con la Fundación Proyecto Lingüístico Francisco Marroquín de Guatemala, esta iniciativa histórica de código abierto ayudará a integrar el idioma q’anjob’al en modelos de traducción de inteligencia artificial, preservando el patrimonio cultural mediante tecnología avanzada.
Según la UA, las lenguas mayas representan «uno de los legados lingüísticos más vibrantes del mundo, con 22 idiomas mayas distintos hablados en Guatemala de los 30 que conforman toda la familia lingüística que también se extiende a partes de México y Belice».
«GRAVE EXCLUSIÓN DIGITAL»
A pesar de ser habladas por millones de personas, estas lenguas «enfrentan una grave exclusión digital, quedando en gran medida al margen de la inteligencia artificial moderna». Para garantizar que las comunidades indígenas puedan participar plenamente en la era digital, la tecnología «debe ser capaz tanto de comprender como de generar estos idiomas».
Aunque el objetivo a largo plazo apunta hacia modelos generativos de inteligencia artificial de propósito general implementados mediante grandes modelos de lenguaje, «el desafío inmediato actual consiste en establecer sistemas sólidos de traducción automática».
Esta tecnología actúa como un primer paso fundamental, permitiendo, por ejemplo, la traducción de textos relevantes jurídicos, administrativos, educativos y sanitarios a las lenguas nativas.
El grupo de investigación Transducens de la UA, en España, aporta más de 25 años de experiencia académica en el desarrollo de herramientas y sistemas de traducción automática para lenguas con escasos recursos digitales.
El equipo recibió recientemente reconocimiento internacional al obtener el prestigioso Google Academic Research Award (GARA) para un proyecto destinado a financiar la digitalización de gramáticas y diccionarios mayas, así como la traducción a cuatro lenguas mayas de un conocido conjunto de evaluación utilizado mundialmente para medir sistemas de traducción automática.
La empresa global de servicios lingüísticos MasterWord, con sede en Houston, ha liderado activamente el Proyecto de Preservación de Lenguas Mayas a través de la Fundación MasterWord. Operando bajo el mandato del Decenio Internacional de las Lenguas Indígenas de la Unesco (2022-2032), el proyecto está dirigido por el antropólogo cultural Dr. Winston Scott.
Durante las últimas tres décadas, el Dr. Scott ha trabajado estrechamente sobre el terreno con diversos grupos lingüísticos mayas en Guatemala, centrando su investigación en la movilización sociolingüística y dedicando años a ayudar a las comunidades indígenas a acceder a servicios esenciales de salud, justicia y educación en sus lenguas maternas.
CL11
