Blog de CiberAbogados

BLOOM: el modelo de lenguaje multilingüe abierto más grande del mundo

Los modelos de lenguaje extenso (LLM) han tenido un impacto significativo en la investigación de IA. Estos potentes modelos generales pueden asumir una amplia variedad de nuevas tareas lingüísticas a partir de las instrucciones del usuario. Sin embargo, los laboratorios de investigación académicos, sin fines de lucro y de empresas más pequeñas tienen dificultades para crear, estudiar o incluso utilizar LLM, ya que solo unos pocos laboratorios industriales con los recursos necesarios y los derechos exclusivos pueden acceder a ellos por completo. Hoy, lanzamos BLOOM , el primer LLM multilingüe capacitado en total transparencia, para cambiar este status quo: el resultado de la mayor colaboración de investigadores de IA jamás involucrada en un solo proyecto de investigación.

Con sus 176 mil millones de parámetros, BLOOM puede generar texto en 46 lenguajes naturales y 13 lenguajes de programación. Para casi todos ellos, como el español, el francés y el árabe, BLOOM será el primer modelo de idioma con más de 100B de parámetros jamás creado. Esta es la culminación de un año de trabajo en el que participaron más de 1000 investigadores de más de 70 países y más de 250 instituciones, lo que llevó a una carrera final de 117 días (del 11 de marzo al 6 de julio) entrenando el modelo BLOOM en la supercomputadora Jean Zay en el sur de París, Francia, gracias a una subvención de cómputo por un valor estimado de 3 millones de euros de las agencias de investigación francesas CNRS y GENCI.

Los investigadores ahora pueden descargar, ejecutar y estudiar BLOOM para investigar el rendimiento y el comportamiento de los grandes modelos de lenguaje desarrollados recientemente hasta sus operaciones internas más profundas. En términos más generales, cualquier persona o institución que acepte los términos de la Licencia de IA responsable del modelo (desarrollada durante el propio proyecto BigScience) puede usar y desarrollar el modelo en una máquina local o en un proveedor de la nube, ya que está integrado en Hugging Face. ecosistema, es tan fácil como importarlo con transformadores y ejecutarlo con aceleración. En este espíritu de colaboración y mejora continua, también lanzamos, por primera vez, los puntos de control intermedios y los estados de optimización del entrenamiento. ¿No tienes 8 A100 para jugar? Estamos finalizando una API de inferencia para uso a gran escala incluso sin hardware o ingeniería dedicados. Mientras tanto, para pruebas rápidas, creación de prototipos y uso a menor escala, ya puede jugar con una versión anterior en el concentrador HF.

Este es sólo el comienzo. Las capacidades de BLOOM seguirán mejorando a medida que el taller continúe experimentando y jugando con el modelo. Hemos comenzado a trabajar para que sea tan instructivo como lo fue nuestro esfuerzo anterior T0++ y estamos programados para agregar más idiomas, comprimir el modelo en una versión más útil con el mismo nivel de rendimiento y usarlo como punto de partida para arquitecturas más complejas. … Todos los experimentos que los investigadores y profesionales siempre han querido realizar, comenzando con el poder de un modelo de más de 100 mil millones de parámetros, ahora son posibles. BLOOM es la semilla de una familia viva de modelos que pretendemos hacer crecer, no solo un modelo único, y estamos listos para apoyar los esfuerzos de la comunidad para expandirlo.

Fuente: https://bigscience.huggingface.co/blog/bloom

×
Stay Informed

When you subscribe to the blog, we will send you an e-mail when there are new updates on the site so you wouldn't miss them.

Estafas, famosos e influencers: cuatro recomendaci...
Registro de Responsables de Bases de Datos Persona...
 

Comentarios

No hay comentarios por el momento. Sé el primero en enviar un comentario.
¿Ya està registrado? Ingresa Aquí
Sábado, 01 Marzo 2025

Al aceptar, accederá a un servicio proporcionado por un tercero externo a https://www.ciberabogados.ar/

Publicaciones recientes

18 Octubre 2024
📢 Demanda Colectiva contra el Uso de IA para Clonación de Rostro y VozEn una interesante iniciativa para proteger los derechos de usuarios y consumidores se ha presentado una demanda colectiva de consumo para detener el uso de plataformas que emplean...
17 Octubre 2024
17 de octubre de 2024 En el siempre cambiante mundo de la ciberseguridad, surge una nueva amenaza: Mamba 2FA, una plataforma de phishing como servicio (PhaaS) diseñada para atacar cuentas de Microsoft 365. Este servicio emergente no solo facilita la ...

Suscribirme al sitio

En la comunidad

Artículos anclados
Actividades recientes
Aún no hay actividades aquí

Iniciar sesión o registrarse