Nouvelle décennie pour l'industrie de l'IA : révolution DataFi alimentée par des données off-chain.

robot
Création du résumé en cours

Les dix prochaines années de l'industrie de l'IA : Révolution de l'infrastructure des données

Les paramètres et la capacité de calcul des modèles d'intelligence artificielle (IA) franchissent constamment des limites, mais un goulot d'étranglement central longtemps négligé devient de plus en plus évident : les données. Les experts de l'industrie soulignent que la prochaine révolution de l'industrie de l'IA ne sera plus alimentée par l'architecture des modèles ou la puissance de calcul des puces, mais dépendra de la manière dont les données comportementales humaines fragmentées peuvent être transformées en capital vérifiable, structuré et prêt pour l'IA. Cette perspective révèle non seulement les contradictions structurelles du développement actuel de l'IA, mais esquisse également un tout nouveau paysage de "l'ère DataFi" - dans cette ère, les données deviendront des facteurs de production centraux mesurables, négociables et valorisables, tout comme l'électricité et la puissance de calcul.

Les contradictions structurelles auxquelles l'industrie de l'IA est confrontée

Le développement de l'IA a longtemps été propulsé par le double noyau "modèle-puissance de calcul". Depuis la révolution de l'apprentissage profond, les paramètres des modèles sont passés de millions à des trillions, et la demande de puissance de calcul a augmenté de manière exponentielle. Selon des données de l'industrie, le coût de formation d'un modèle de langage avancé a déjà dépassé 100 millions de dollars, dont 90 % sont consacrés à la location de grappes de GPU. Cependant, alors que l'industrie se concentre sur des "modèles plus grands" et des "puces plus rapides", une crise du côté de l'offre de données se profile silencieusement.

Les experts soulignent que les "données organiques" générées par l'homme ont atteint le plafond de croissance. Prenons les données textuelles comme exemple : la quantité totale de textes de haute qualité accessibles sur Internet (livres, articles, nouvelles) est d'environ 10^12 mots, tandis qu'un modèle de cent milliards de paramètres nécessite environ 10^13 mots de données pour son entraînement - ce qui signifie que le pool de données existant ne peut soutenir que l'entraînement de 10 modèles de taille équivalente. Plus préoccupant encore, la part des données répétées et du contenu de faible qualité dépasse 60 %, ce qui comprime encore l'offre de données efficaces. Lorsque les modèles commencent à "avaler" leurs propres données générées, la dégradation des performances des modèles due à la "pollution des données" est devenue une préoccupation dans l'industrie.

La racine de cette contradiction réside dans le fait que l'industrie de l'IA considère depuis longtemps les données comme une "ressource gratuite" plutôt que comme un "actif stratégique" qui doit être soigneusement cultivé. Les modèles et la puissance de calcul ont formé un système de marché mature - la puissance de calcul est tarifée par les FLOPS sur des plateformes cloud, les modèles ont des interfaces API qui facturent par nombre d'appels - mais la production, le nettoyage, la validation et le commerce des données sont encore à l'"ère primitive". Les experts de l'industrie soulignent que la prochaine décennie de l'IA sera celle des "infrastructures de données", et les données on-chain des réseaux cryptographiques sont la clé pour déverrouiller cette impasse.

Données on-chain : La "base de données sur le comportement humain" dont l'IA a le plus besoin

Dans le contexte de la pénurie de données, les données on-chain des réseaux cryptographiques montrent une valeur irremplaçable. Par rapport aux données de l'internet traditionnel, les données on-chain possèdent intrinsèquement une authenticité d'"alignement des incitations" - chaque transaction, chaque interaction de contrat, chaque comportement d'adresse de portefeuille est directement lié à un capital réel et est immuable. Les experts le définissent comme "les données d'alignement des incitations humaines les plus concentrées sur Internet", qui se manifeste dans trois dimensions :

"signaux d'intention" du monde réel

Les données enregistrées sur la chaîne sont des comportements décisionnels votés avec de l'argent réel. Par exemple, l'échange d'actifs par un portefeuille sur un certain DEX, l'emprunt contre un prêt sur une certaine plateforme de prêt, ou l'enregistrement d'un nom de domaine, reflètent directement le jugement de l'utilisateur sur la valeur du projet, sa préférence de risque et sa stratégie de répartition des fonds. Ces données, qui "sont soutenues par le capital", ont une valeur extrêmement élevée pour former la capacité décisionnelle de l'IA. En revanche, les données d'Internet traditionnel sont envahies par le "bruit" ; ces données ne peuvent pas seulement entraîner des modèles d'IA fiables, mais elles peuvent également induire les modèles en erreur.

Chaîne de comportement traçable

La transparence de la blockchain permet de retracer intégralement le comportement des utilisateurs. L'historique des transactions d'une adresse de portefeuille, les protocoles avec lesquels elle a interagi et les variations des actifs détenus forment une "chaîne de comportement" cohérente. Par exemple, en analysant les opérations d'une adresse dans les protocoles DeFi depuis 2020 jusqu'à présent, l'IA peut identifier avec précision si elle est un "investisseur à long terme", un "arbitragiste" ou un "fournisseur de liquidités", et ainsi construire un profil utilisateur. Ces données comportementales structurées sont le "échantillon de raisonnement humain" le plus rare pour les modèles d'IA actuels.

accès "sans autorisation" à un écosystème ouvert

Contrairement à la fermeture des données des entreprises traditionnelles, les données on-chain sont ouvertes et sans autorisation. Tout développeur peut accéder aux données brutes via un explorateur de blockchain ou une API de données, ce qui fournit une source de données "sans barrières" pour l'entraînement des modèles d'IA. Cependant, cette ouverture pose également des défis : les données on-chain existent sous forme de "journaux d'événements", qui sont des "signaux bruts" non structurés, et doivent être nettoyées, normalisées et mises en relation avant de pouvoir être utilisées par les modèles d'IA. Les experts soulignent qu'actuellement, le "taux de conversion structuré" des données on-chain est inférieur à 5 %, et une grande quantité de signaux de haute valeur est enfouie dans des milliards d'événements fragmentés.

Le "système d'exploitation" des données on-chain

Pour résoudre le problème de la fragmentation des données sur la chaîne, l'industrie est en train de construire un "système d'exploitation intelligent sur la chaîne" conçu spécifiquement pour l'IA. L'objectif principal est de transformer les signaux dispersés sur la chaîne en données prêtes pour l'IA, structurées, vérifiables et en temps réel. Ce système comprend les composants clés suivants :

Norme de données ouvertes

Les normes de schéma de données ouvertes unifient la définition et la description des données sur la chaîne. Par exemple, elle standardise le "comportement de mise en jeu des utilisateurs" en une donnée structurée contenant des champs tels que staker_address, protocol_id, amount, timestamp, reward_token, etc., garantissant que les modèles d'IA n'ont pas besoin de s'adapter à différents formats de données de chaînes ou de protocoles, mais peuvent directement "comprendre" la logique commerciale derrière les données.

mécanisme de validation des données

Assurer l'authenticité des données via un réseau de nœuds validateurs sur la blockchain. Ces nœuds sont responsables de la vérification de l'intégrité et de l'exactitude des données sur la chaîne. Lorsque le système traite un événement sur la chaîne, les nœuds validateurs croisent les valeurs de hachage des données, les informations de signature et l'état sur la chaîne, garantissant que les données structurées produites sont entièrement cohérentes avec les données originales sur la chaîne.

Couche de disponibilité des données à haut débit

Conçu pour des applications AI interactives en temps réel, il optimise les algorithmes de compression de données et les protocoles de transmission pour traiter en temps réel des centaines de milliers d'événements on-chain par seconde. Par exemple, lorsqu'une transaction importante a lieu sur un DEX, le système peut extraire, normaliser et valider les données en une seconde, et envoyer le "signal de grande transaction" structuré aux modèles AI abonnés, leur permettant d'ajuster rapidement leur stratégie de trading.

L'ère DataFi : les données sont le capital

L'objectif ultime de cette infrastructure de données on-chain est de propulser l'industrie de l'IA dans l'ère du DataFi - les données ne sont plus un "matériel d'entraînement" passif, mais un "capital" actif, qui peut être évalué, échangé et valorisé. Les experts comparent : "Tout comme l'électricité est facturée en kilowatts, la puissance de calcul en FLOPS, les données doivent également être notées, classées et évaluées." La réalisation de cette vision repose sur la transformation des données en quatre attributs essentiels :

  1. Structuré : de "signal brut" à "actif utilisable"
  2. Combinable : les "blocs de Lego" des données
  3. Vérifiable : le "soutien de crédit" des données
  4. Liquidation : la "réalisation de la valeur" des données

Dans cette ère de DataFi, les données deviendront le pont reliant l'IA et le monde réel — les agents de trading perçoivent le sentiment du marché grâce aux données en chaîne, les dApps autonomes optimisent leurs services à partir des données comportementales des utilisateurs, tandis que les utilisateurs ordinaires obtiennent des revenus passifs en partageant des données. Tout comme le réseau électrique a engendré la révolution industrielle, le réseau de calcul a engendré la révolution d'Internet, ce nouveau type de réseau de données est en train de donner naissance à la "révolution des données" de l'IA.

Conclusion

Lorsque nous parlons de l'avenir de l'IA, nous avons souvent tendance à nous concentrer sur le "niveau d'intelligence" des modèles, tout en négligeant le "sol de données" qui soutient cette intelligence. L'infrastructure de données sur la blockchain révèle une vérité fondamentale : l'évolution de l'IA est essentiellement l'évolution de l'infrastructure de données. De la "limitation" des données générées par l'homme à la "découverte de valeur" des données sur la blockchain, du "désordre" des signaux fragmentés à l'"ordre" des données structurées, de la "ressource gratuite" des données à l'"actif capital" de DataFi, cette infrastructure est en train de remodeler la logique sous-jacente de l'industrie de l'IA.

Lorsque les données sont enfin dotées de la valeur qu'elles méritent, l'IA peut véritablement libérer le pouvoir de changer le monde. La prochaine génération d'applications natives à l'IA nécessite non seulement des modèles ou des portefeuilles, mais aussi des données programmables, sans confiance et à fort signal. Ce n'est pas seulement la vision d'une entreprise, mais une tendance inévitable vers la maturité de l'industrie de l'IA.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Reposter
  • Partager
Commentaire
0/400
GasFeeCriervip
· Il y a 15h
bull ah off-chain données vraiment vont To the moon
Voir l'originalRépondre0
FromMinerToFarmervip
· Il y a 15h
Générer un commentaire :

Se faire prendre pour des cons avec une nouvelle méthode ?
Voir l'originalRépondre0
WagmiWarriorvip
· Il y a 15h
Encore parler de concepts, je ne sais toujours pas comment gagner de l'argent avec les données.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)