La biblioteca nacional de Quebec avanza con un proyecto de banco de datos culturales de IA – Montreal


La biblioteca nacional de Quebec sigue adelante con sus planes para crear una base de datos de contenido cultural y gubernamental que podría usarse para entrenar sistemas de inteligencia artificial y mejorar su comprensión de la sociedad, la cultura y las lenguas indígenas de Quebec.

Bibliothèque et Archives nationales du Québec, o BAnQ, la biblioteca y la institución de archivos nacionales de la provincia, ha lanzado la fase experimental de su propuesta de banco de datos gubernamental y cultural en francés y lenguas indígenas después de completar un estudio de viabilidad a principios de este año.

El proyecto tiene como objetivo abordar las preocupaciones de que los principales sistemas generativos de IA a menudo tienen dificultades para proporcionar información confiable sobre la sociedad, la economía y la cultura de Quebec debido a la cantidad limitada de datos relacionados con Quebec disponibles.

“Todos los escenarios están un poco sobre la mesa en este momento”, dijo en una entrevista Valérie D’Amour, quien dirigió el estudio de viabilidad. «Tenemos muchas ideas y queremos validar las posibilidades con las partes interesadas culturales, así como con los propietarios y proveedores de datos, que participarán en las discusiones».

La historia continúa debajo del anuncio.

BAnQ dice que la futura plataforma no serviría como canal de distribución pública para obras creativas y que el acceso a los datos estaría estrictamente controlado.

Marie Grégoire, presidenta y directora ejecutiva de BAnQ, dijo que el objetivo es garantizar que los sistemas de inteligencia artificial reflejen mejor la sociedad y la cultura de Quebec.

Recibe las últimas noticias nacionales

Reciba las últimas noticias de Canadá en su bandeja de entrada a medida que suceden para no perderse ninguna noticia de actualidad.

“Eso significa tener referencias quebequenses, ya sean modelos pequeños o grandes, ya provengan de la investigación o de la comunidad empresarial”, afirmó.

Han surgido iniciativas similares en otros lugares, incluso en Suecia, donde se han reunido grandes colecciones de textos en lengua nórdica para ayudar a desarrollar modelos de IA generativa para las lenguas escandinavas.

BAnQ planea comenzar con sus propias colecciones antes de considerar datos de otras fuentes.

La iniciativa surge de una recomendación hecha en un informe de 2024 del consejo de innovación de Quebec. El informe atribuyó el problema en parte a la “muy pequeña cantidad de datos sobre Quebec” disponibles en los conjuntos de datos de entrenamiento de IA.

Destiny Tchéhouali, cotitular de una cátedra de investigación con sede en Quebec centrada en la inteligencia artificial y las tecnologías digitales en francés, dijo que la cultura quebequense sigue “subrrepresentada en los corpus que actualmente circulan en el mundo de la IA”.

«Y corremos el riesgo de reproducir sesgos lingüísticos y culturales. Y cuando también hablamos de pueblos indígenas, corremos un riesgo aún mayor de sufrir todos estos sesgos», dijo Tchéhouali, profesor del departamento de comunicaciones de la Universidad de Québec en Montreal.

La historia continúa debajo del anuncio.

Dijo que la base de datos propuesta representaría una “infraestructura estratégica” que podría ayudar a establecer pautas sobre cómo se identifica, cataloga y rastrea el contenido local dentro de los sistemas de inteligencia artificial actuales.

Las preocupaciones sobre los derechos de autor han surgido como un problema importante para el sector cultural a medida que BAnQ desarrolla la base de datos propuesta.

Pero Grégoire argumentó que la plataforma propuesta podría ofrecer a los creadores una mayor protección que el sistema actual. «En este momento, es un poco como el Salvaje Oeste», dijo. «Los datos se recopilan de forma gratuita y ese no debería ser el caso».

Dijo que la base de datos podría actuar como una puerta de entrada centralizada que facilitaría la compensación a los creadores cuyas obras se utilizan.

Grégoire dijo que al trabajar colectivamente, las organizaciones culturales estarían mejor posicionadas para garantizar que los creadores reciban su remuneración y que el sector siga siendo sostenible a largo plazo.

Aún así, a algunos artistas les preocupa que contribuir con su trabajo a los sistemas de capacitación en IA pueda, en última instancia, socavar sus propios medios de vida.

«La principal crítica que escuchamos en este campo es que, incluso si los artistas obtienen ingresos de ello, todavía están alimentando a la bestia que eventualmente se utilizará para reemplazar los contratos que pueden perder debido a la IA», dijo Maxime Harvey, investigador postdoctoral en el Instituto Nacional de Investigación Científica y miembro de la misma cátedra de investigación.

El estudio de viabilidad prevé que la plataforma entre en funcionamiento en 2029, aunque D’Amour dijo que el cronograma se reevaluará después de la fase experimental.

La historia continúa debajo del anuncio.

El estudio estima un presupuesto quinquenal de casi 10,5 millones de dólares hasta 2030, incluidos los costos operativos y de capital. BAnQ ha recibido 340.000 dólares del gobierno de Quebec para el estudio de viabilidad y otros 750.000 dólares para apoyar la fase de experimentación de 12 meses del proyecto.

© 2026 La prensa canadiense



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here