
Google lanza una IA que revoluciona la generación de texto
Google ha presentado DiffusionGemma, un modelo experimental de inteligencia artificial que está cambiando la forma en que se genera el texto. Este innovador sistema genera bloques completos de texto en lugar de palabra por palabra, lo que lo hace mucho más rápido y eficiente.
Mayor velocidad y eficiencia
Según una publicación en el blog de Google, DiffusionGemma es capaz de alcanzar hasta cuatro veces más velocidad de inferencia que modelos convencionales como Gemma 4. En una GPU dedicada como la NVIDIA H100, este modelo supera los 1.000 tokens por segundo, equivalente a diez veces la velocidad de GPT-5.4 mini.
¿Cómo funciona?
La mayoría de los modelos de lenguaje funcionan generando un token tras otro en secuencia, lo que puede resultar ineficiente en ciertos contextos. DiffusionGemma, por otro lado, redacta bloques completos de 256 tokens a la vez, aprovechando al máximo el hardware disponible. Este enfoque innovador cambia el paradigma de generación de texto.
Atención bidireccional y refinamiento iterativo
Otra característica destacada de DiffusionGemma es su atención bidireccional, que permite a cada token relacionarse con todos los demás en paralelo. Además, el modelo sigue un proceso de refinamiento iterativo, partiendo de un bloque de texto aleatorio y puliéndolo mediante pasadas sucesivas, similar a la generación de imágenes con modelos como DALL-E 3 y Midjourney.
Accesibilidad y disponibilidad
DiffusionGemma es un modelo Mixture of Experts con un total de 26.000 millones de parámetros, pero durante la inferencia solo activa 3.800 millones, lo que lo hace compatible con GPUs de consumo. Este modelo ya está disponible en Hugging Face bajo licencia Apache 2.0, lo que permite a los usuarios descargarlo y utilizarlo de forma gratuita.
Limitaciones y usos recomendados
Es importante tener en cuenta que DiffusionGemma prioriza la velocidad sobre la calidad de salida, por lo que, en entornos de producción, los modelos Gemma 4 estándar pueden ser más adecuados. Sin embargo, para tareas como edición en tiempo real, prototipado rápido o experimentación con flujos no lineales, DiffusionGemma se destaca como una opción interesante.



