Nueva década de la industria de la IA: revolución DataFi impulsada por datos on-chain

robot
Generación de resúmenes en curso

La próxima década de la industria de la IA: revolución de la infraestructura de datos

El tamaño de los parámetros y la capacidad de cálculo de los modelos de inteligencia artificial (IA) continúan rompiendo límites, pero un núcleo de cuello de botella que ha sido ignorado durante mucho tiempo se destaca cada vez más: los datos. Los expertos de la industria señalan que la próxima revolución en la industria de la IA ya no será impulsada por la arquitectura del modelo o la potencia de cálculo de los chips, sino que dependerá de cómo convertir los datos de comportamiento humano fragmentados en capital verificable, estructurado y preparado para la IA. Esta percepción no solo revela la contradicción estructural en el desarrollo actual de la IA, sino que también esboza un nuevo panorama de la "era de DataFi": en esta era, los datos se convertirán en un factor de producción central que será medible, negociable y capaz de valorizarse, al igual que la electricidad y la potencia de cálculo.

Las contradicciones estructurales que enfrenta la industria de la IA

El desarrollo de la IA ha sido impulsado durante mucho tiempo por el "doble núcleo de modelos y potencia de cálculo". Desde la revolución del aprendizaje profundo, los parámetros del modelo han pasado de millones a billones, y la demanda de potencia de cálculo ha crecido de manera exponencial. Según datos de la industria, el costo de entrenar un modelo de lenguaje avanzado ha superado los 100 millones de dólares, de los cuales el 90% se destina al alquiler de clústeres de GPU. Sin embargo, mientras la industria centra su atención en "modelos más grandes" y "chips más rápidos", una crisis del lado de la oferta de datos está llegando silenciosamente.

Los expertos señalan que los "datos orgánicos" generados por humanos han alcanzado un techo de crecimiento. Tomando como ejemplo los datos textuales, la cantidad total de texto de alta calidad públicamente accesible en Internet (libros, artículos, noticias) es de aproximadamente 10^12 palabras, mientras que el entrenamiento de un modelo de mil millones de parámetros requiere consumir datos a nivel de aproximadamente 10^13 palabras, lo que significa que el pool de datos existente solo puede soportar el entrenamiento de 10 modelos de igual escala. Más grave aún, la proporción de datos duplicados y contenido de baja calidad supera el 60%, lo que comprime aún más la oferta de datos efectivos. Cuando los modelos comienzan a "devorar" los datos generados por sí mismos, la degradación del rendimiento del modelo causada por la "contaminación de datos" se ha convertido en una preocupación en la industria.

La raíz de esta contradicción radica en que la industria de la IA ha considerado durante mucho tiempo los datos como "recursos gratuitos", en lugar de "activos estratégicos" que necesitan ser cuidadosamente cultivados. Los modelos y la capacidad de cómputo han formado un sistema de mercado maduro: la capacidad de cómputo se valora en plataformas en la nube por FLOPS, y los modelos tienen interfaces API que cobran por número de llamadas; sin embargo, la producción, limpieza, verificación y transacción de datos aún se encuentran en la "era salvaje". Los expertos de la industria enfatizan: la próxima década de la IA será la década de la "infraestructura de datos", y los datos en cadena de la red de criptomonedas son la clave para desbloquear este dilema.

Datos en la cadena: la "base de datos de comportamiento humano" que más necesita la IA

En el contexto de la escasez de datos, los datos en cadena de las redes de criptomonedas están demostrando un valor insustituible. En comparación con los datos del internet tradicional, los datos en cadena poseen inherentemente la "autenticidad de alineación de incentivos": cada transacción, cada interacción de contrato y cada comportamiento de dirección de billetera están directamente vinculados a capital real y son inalterables. Los expertos lo definen como "los datos de comportamiento de alineación de incentivos humanos más concentrados en Internet", que se manifiestan en tres dimensiones:

"señales de intención" del mundo real

Los datos en la cadena registran comportamientos de decisión votados con dinero real. Por ejemplo, el acto de intercambiar activos en algún DEX, de hipotecar y pedir prestado en alguna plataforma de préstamos, o de registrar un dominio, refleja directamente el juicio del usuario sobre el valor del proyecto, su preferencia por el riesgo y su estrategia de asignación de fondos. Este tipo de datos "respaldados por capital" tiene un alto valor para entrenar la capacidad de decisión de la IA. En comparación, los datos de internet tradicionales están llenos de "ruido"; estos datos no solo no pueden entrenar modelos de IA confiables, sino que, en cambio, pueden inducir a error el juicio del modelo.

cadena de comportamiento "trazable"

La transparencia de la blockchain permite que el comportamiento del usuario sea completamente rastreable. El historial de transacciones de una dirección de billetera, los protocolos con los que ha interactuado y los cambios en los activos que posee, forman una "cadena de comportamiento" coherente. Por ejemplo, al analizar las operaciones de una dirección en protocolos DeFi desde 2020 hasta la fecha, la IA puede identificar con precisión si es un "tenedor a largo plazo", un "operador de arbitraje" o un "proveedor de liquidez", y en función de esto, construir un perfil de usuario. Estos datos de comportamiento estructurados son, de hecho, los "muestras de razonamiento humano" más escasas en los modelos de IA actuales.

acceso "sin permiso" en un ecosistema abierto

A diferencia de la naturaleza cerrada de los datos empresariales tradicionales, los datos en cadena son abiertos y no requieren permisos. Cualquier desarrollador puede acceder a los datos originales a través de exploradores de blockchain o APIs de datos, lo que proporciona una fuente de datos "sin barreras" para el entrenamiento de modelos de IA. Sin embargo, esta apertura también presenta desafíos: los datos en cadena existen en forma de "registros de eventos", son "señales crudas" no estructuradas, y necesitan ser limpiadas, estandarizadas y relacionadas para ser utilizadas por los modelos de IA. Los expertos señalan que la "tasa de conversión estructurada" de los datos en cadena actualmente es inferior al 5%, y una gran cantidad de señales de alto valor están enterradas entre miles de millones de eventos fragmentados.

El "sistema operativo" de los datos en la cadena

Para abordar el problema de la fragmentación de datos en la cadena, la industria está construyendo un "sistema operativo inteligente en cadena" diseñado específicamente para AI. Su objetivo principal es transformar las señales dispersas en la cadena en datos listos para AI, estructurados, verificables y combinables en tiempo real. Este sistema incluye los siguientes componentes clave:

Estándar de datos abiertos

El estándar de esquema de datos abierto unifica la definición y la descripción de los datos en la cadena. Por ejemplo, estandariza el "comportamiento de staking del usuario" en datos estructurados que incluyen campos como staker_address, protocol_id, amount, timestamp, reward_token, asegurando que el modelo de IA no necesite adaptarse a diferentes formatos de datos de cadenas o protocolos, sino que pueda "comprender" directamente la lógica comercial detrás de los datos.

mecanismo de verificación de datos

Asegurar la autenticidad de los datos a través de una red de nodos validadores de blockchain. Estos nodos son responsables de verificar la integridad y precisión de los datos en la cadena. Cuando el sistema procesa un evento en la cadena, los nodos validadores cruzan los valores hash de los datos, la información de firma y el estado en la cadena para garantizar que los datos estructurados resultantes sean exactamente coherentes con los datos originales en la cadena.

Capa de disponibilidad de datos de alto rendimiento

Diseñado para aplicaciones de IA de interacción en tiempo real, logrando el procesamiento en tiempo real de cientos de miles de eventos en la cadena por segundo a través de la optimización de algoritmos de compresión de datos y protocolos de transmisión. Por ejemplo, cuando se realiza una gran transacción en un DEX, el sistema puede completar la extracción de datos, normalización y verificación en 1 segundo, y enviar la "señal de gran transacción" estructurada a los modelos de IA suscritos, permitiéndoles ajustar sus estrategias de trading a tiempo.

Era DataFi: los datos son capital

El objetivo final de esta infraestructura de datos en cadena es impulsar la industria de la IA hacia la era de DataFi: los datos ya no son un "material de entrenamiento" pasivo, sino un "capital" activo, que puede ser valorado, comerciado y aumentado. Los expertos hacen una analogía: "Así como la electricidad se valora en kilovatios, la potencia de cálculo en FLOPS, los datos también deben ser evaluados, clasificados y valorados." La realización de esta visión depende de la transformación de los datos en cuatro propiedades clave:

  1. Estructurado: de "señal original" a "activo utilizable"
  2. Combinable: los "bloques de Lego" de datos
  3. Verificable: el "aval de crédito" de los datos
  4. Liquidez: la "realización del valor" de los datos

En esta era de DataFi, los datos se convertirán en el puente que conecta la IA con el mundo real: los agentes de trading perciben el sentimiento del mercado a través de datos en la cadena, las dApps autónomas optimizan sus servicios mediante datos de comportamiento de los usuarios, y los usuarios comunes obtienen ingresos continuos al compartir datos. Así como la red eléctrica dio lugar a la revolución industrial, la red de computación está dando lugar a la revolución de Internet, esta nueva red de datos está impulsando la "revolución de datos" de la IA.

Conclusión

Cuando hablamos del futuro de la IA, a menudo nos centramos en el "nivel de inteligencia" de los modelos, pero pasamos por alto el "suelo de datos" que sostiene esa inteligencia. La infraestructura de datos en cadena revela una verdad central: la evolución de la IA es, en esencia, la evolución de la infraestructura de datos. Desde la "limitación" de los datos generados por los humanos hasta el "descubrimiento de valor" de los datos en cadena, desde la "desorden" de señales fragmentadas hasta la "orden" de datos estructurados, desde los "recursos gratuitos" de los datos hasta los "activos de capital" de DataFi, esta infraestructura está reconfigurando la lógica subyacente de la industria de la IA.

Cuando los datos finalmente se les otorga el valor que merecen, la IA puede realmente liberar el poder de cambiar el mundo. Las aplicaciones nativas de IA de próxima generación no solo necesitan modelos o billeteras, sino también datos programables, de alto valor y sin necesidad de confianza. Esto no es solo la visión de una empresa, sino una tendencia inevitable hacia la madurez de la industria de la IA.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 3
  • Republicar
  • Compartir
Comentar
0/400
GasFeeCriervip
· hace13h
alcista啊 on-chain数据真要 To the moon了
Ver originalesResponder0
FromMinerToFarmervip
· hace13h
Generar comentarios:

¿Llegó una nueva táctica para tomar a la gente por tonta?
Ver originalesResponder0
WagmiWarriorvip
· hace13h
¿Cómo ganar dinero con datos que todavía no se comprenden?
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)