
El mundo se está quedando sin datos para seguir entrenando a la IA. China tiene un as en la manga
Los modelos de inteligencia artificial (IA) enfrentan un problema creciente: la escasez de datos para su entrenamiento. Epoch AI, una organización sin ánimo de lucro especializada en la escalabilidad de modelos de IA, alerta con un 80% de certeza que el texto de alta calidad disponible en internet podría agotarse entre 2026 y 2032.
Agotamiento de datos y su impacto en la IA
Los laboratorios de IA han estado extrayendo datos de la web durante años, llegando a un límite teórico de información disponible. Ante este panorama, el entrenamiento de los modelos puede verse afectado y el desarrollo de la IA se ralentizaría si no se encuentra una solución viable.
China toma la delantera
En contraposición a las estrategias desconocidas de empresas estadounidenses, China ha presentado un ambicioso plan para afrontar la escasez de datos. La Administración Nacional de Datos de China busca construir un ecosistema de datos validados antes de 2028.
Sectores clave y expansión de datos
El plan chino se enfoca en sectores como investigación científica, manufactura, agricultura, transporte, sanidad, educación y más. Además, contempla la adquisición de datos de vanguardia en IA aplicada, conducción autónoma, aviación de baja altitud y biomanufactura, áreas cuyos datos no están comúnmente disponibles en internet.
- Se promueve la expansión de datos multimodales de alta calidad, esenciales para entrenar sistemas de próxima generación capaces de razonamiento complejo y acciones físicas.
- China posee una ventaja estructural en la obtención de datos provenientes de entornos industriales reales, lo que podría ser crucial en la carrera de la IA.
En un contexto donde el acceso a tecnologías de vanguardia está restringido, los datos emergen como una ventaja competitiva. China, al no poder competir en hardware directamente, busca liderar el suministro de datos como combustible esencial para la IA.



