AI-индустрия нового десятилетия: данные в блокчейне приводят к революции DataFi

robot
Генерация тезисов в процессе

Следующее десятилетие в индустрии ИИ: революция в инфраструктуре данных

Параметры масштабов моделей искусственного интеллекта (ИИ) и вычислительная мощность постоянно превышают пределы, но одна долго игнорируемая ключевая проблема становится все более очевидной — данные. Эксперты отрасли указывают, что следующая революция в ИИ-индустрии больше не будет вызвана архитектурой моделей или мощностью чипов, а будет зависеть от того, как преобразовать фрагментированные данные о человеческом поведении в проверяемый, структурированный и готовый к ИИ капитал. Это понимание не только выявляет структурные противоречия текущего развития ИИ, но и рисует новый пейзаж эпохи "DataFi" — в эту эпоху данные станут основным производственным фактором, который можно измерять, торговать и увеличивать, подобно электричеству и вычислительной мощности.

Структурные противоречия, с которыми сталкивается AI-индустрия

Развитие ИИ долгое время двигалось под двойным ядром "модель-вычислительная мощность". С момента революции глубокого обучения параметры модели увеличились с миллионов до триллионов, а потребность в вычислительной мощности возросла в геометрической прогрессии. Согласно данным отрасли, стоимость обучения продвинутой большой языковой модели уже превышает 100 миллионов долларов, из которых 90% идут на аренду GPU-кластеров. Однако, когда отрасль сосредоточила внимание на "больших моделях" и "быстрых чипах", кризис на стороне предложения данных тихо надвигается.

Эксперты указывают: сгенерированные человеком "органические данные" достигли потолка роста. Например, в случае текстовых данных общее количество высококачественных текстов (книги, статьи, новости), доступных для веб-сканирования в интернете, составляет около 10^12 слов, в то время как для обучения модели с сотней миллиардов параметров требуется примерно данных на уровне 10^13 слов — это означает, что существующий пул данных может поддерживать обучение только 10 моделей аналогичного масштаба. Более того, доля повторяющихся данных и низкокачественного контента превышает 60%, что еще больше сокращает предложение эффективных данных. Когда модель начинает "поглощать" данные, сгенерированные ею самой, "загрязнение данных" приводит к деградации производительности модели, что стало настораживающей проблемой в отрасли.

Корень этого противоречия заключается в том, что индустрия ИИ долгое время рассматривала данные как "бесплатный ресурс", а не как "стратегический актив", который требует тщательного ухода. Модели и вычислительная мощность уже образовали зрелую рыночную систему — вычислительная мощность оценивается по FLOPS на облачных платформах, а модели имеют API-интерфейсы с оплатой за количество вызовов — но производство, очистка, проверка и торговля данными все еще находятся в "дикими временами". Эксперты отрасли подчеркивают: следующее десятилетие ИИ станет "десятилетием инфраструктуры данных", а цепочные данные криптосетей являются ключом к решению этой проблемы.

Данные на блокчейне: "База данных человеческого поведения", необходимая AI

На фоне нехватки данных, ончейн-данные криптосетей демонстрируют непревзойденную ценность. В отличие от традиционных интернет-данных, ончейн-данные обладают подлинностью "выравнивания стимулов" — каждая транзакция, каждое взаимодействие с контрактом, каждое действие адреса кошелька напрямую связано с реальным капиталом и не подлежит изменению. Эксперты определяют это как "самые централизованные данные о поведении человека в интернете, выравнивающие стимулы", что конкретно проявляется в трех измерениях:

Реальные "сигналы намерения"

Данные на блокчейне фиксируют решения, принимаемые с использованием реальных денег. Например, обмен активов в определенном DEX, действия по залогу и кредитованию на определенной платформе, регистрация домена напрямую отражают оценку пользователем ценности проекта, его предпочтения в отношении рисков и стратегию распределения капитала. Такие данные "с капиталом в качестве гарантии" имеют огромную ценность для обучения способности ИИ к принятию решений. В отличие от этого, традиционные интернет-данные переполнены "шумом", который не только не позволяет обучать надежные модели ИИ, но и может вводить модели в заблуждение.

可追溯ного "цепочка действий"

Прозрачность блокчейна позволяет полностью отслеживать поведение пользователей. Исторические транзакции адреса кошелька, взаимодействовавшие протоколы и изменения в принадлежащих активов формируют последовательную "цепочку поведения". Например, анализируя операции определенного адреса в протоколах DeFi с 2020 года до настоящего времени, ИИ может точно определить, является ли он "долгосрочным держателем", "арбитражным трейдером" или "поставщиком ликвидности", и на основе этого создавать пользовательские профили. Эти структурированные данные о поведении являются наиболее дефицитными "образцами человеческого рассуждения" для текущих моделей ИИ.

"Безлицензионный доступ" открытой экосистемы

В отличие от закрытости данных традиционных предприятий, данные на блокчейне открыты и не требуют разрешения. Любой разработчик может получить исходные данные через блокчейн-браузер или API данных, что предоставляет «безбарьерный» источник данных для обучения AI-моделей. Однако такая открытость также приносит вызовы: данные на блокчейне существуют в виде «журналов событий», являются неструктурированными «исходными сигналами», которые необходимо очищать, стандартизировать и соотносить, чтобы их могли использовать AI-модели. Эксперты указывают, что в настоящее время «уровень структурированной трансформации» данных на блокчейне составляет менее 5%, и огромное количество высокоценного сигнала зарыто в миллиардах фрагментированных событий.

"Операционная система" для данных на блокчейне

Для решения проблемы фрагментации данных в блокчейне в отрасли создается "блокчейн-умная операционная система", специально предназначенная для ИИ. Ее основная цель заключается в том, чтобы преобразовать разрозненные блокчейн-сигналы в структурированные, проверяемые, готовые к ИИ данные в реальном времени. Эта система включает следующие ключевые компоненты:

Открытые стандарты данных

Открытый стандарт схемы данных унифицирует определение и описание данных на блокчейне. Например, он стандартизирует "поведение пользователей при ставке", превращая его в структурированные данные, содержащие такие поля, как staker_address, protocol_id, amount, timestamp, reward_token и т. д., что гарантирует, что AI-модель не требует адаптации к различным форматам данных блокчейна или протоколов и может напрямую "понимать" бизнес-логику, стоящую за данными.

Механизм верификации данных

Обеспечьте подлинность данных через сеть валидаторов блокчейна. Эти узлы отвечают за проверку целостности и точности данных в цепочке. Когда система обрабатывает событие в цепочке, валидаторы перекрёстно проверяют хэш-значения данных, информацию о подписи и состояние в цепочке, чтобы гарантировать, что выходные структурированные данные полностью соответствуют исходным данным в цепочке.

Высокопроизводительный уровень доступности данных

Специально разработано для AI-приложений в реальном времени, путем оптимизации алгоритмов сжатия данных и протоколов передачи, что позволяет обрабатывать сотни тысяч событий в цепочке в реальном времени каждую секунду. Например, когда на каком-либо DEX происходит крупная сделка, система может в течение 1 секунды завершить извлечение данных, стандартизацию и верификацию, а затем отправить структурированный "сигнал о крупной сделке" подписанным AI-моделям, позволяя им своевременно корректировать торговую стратегию.

Эра DataFi: данные как капитал

Конечной целью этой инфраструктуры данных на блокчейне является продвижение AI-индустрии в эпоху DataFi — данные больше не являются пассивным "тренировочным материалом", а становятся активным "капиталом", который можно оценивать, торговать и увеличивать. Эксперты проводят аналогию: "как электричество оценивается в киловаттах, вычислительная мощность оценивается в FLOPS, так и данные должны оцениваться, ранжироваться и оцениваться." Реализация этого видения зависит от преобразования данных в четыре ключевые характеристики:

  1. Структурирование: от "исходного сигнала" до "доступного актива"
  2. Комбинируемость: "Лего-кирпичики" данных
  3. Проверяемый: "кредитная поддержка" данных
  4. Ликвидность: "реализация ценности" данных

В эпоху DataFi данные станут мостом между ИИ и реальным миром — торговые агенты воспринимают рыночные настроения через данные на блокчейне, автономные dApp оптимизируют свои услуги на основе данных о поведении пользователей, обычные пользователи получают постоянный доход, делясь данными. Подобно тому как электрические сети породили промышленную революцию, сети вычислительной мощности стали основой интернет-революции, эта новая форма данных создает "данную революцию" для ИИ.

Заключение

Когда мы говорим о будущем ИИ, мы часто сосредотачиваемся на "умственном уровне" моделей, игнорируя "данные" как основу интеллекта. Инфраструктура данных на блокчейне раскрывает одну основную истину: эволюция ИИ по своей сути есть эволюция инфраструктуры данных. От "ограниченности" данных, сгенерированных человеком, до "открытия ценности" данных на блокчейне, от "беспорядка" фрагментированных сигналов до "упорядоченности" структурированных данных, от "бесплатных ресурсов" данных до "капитальных активов" DataFi, эта инфраструктура переосмысливает базовую логику индустрии ИИ.

Когда данные наконец будут наделены должной ценностью, ИИ сможет по-настоящему освободить силу, способную изменить мир. Приложения следующего поколения, основанные на ИИ, требуют не только моделей или кошельков, но и необработанных, программируемых, высокосигнальных данных. Это не просто видение какой-то компании, а неизбежная тенденция к зрелости индустрии ИИ.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 3
  • Репост
  • Поделиться
комментарий
0/400
GasFeeCriervip
· 15ч назад
Бык, данные в блокчейне действительно собираются На луну.
Посмотреть ОригиналОтветить0
FromMinerToFarmervip
· 15ч назад
Сгенерировать комментарий:

Будут играть для лохов новая схема пришла?
Посмотреть ОригиналОтветить0
WagmiWarriorvip
· 15ч назад
Опять обсуждают концепцию, как зарабатывать на данных, но не знают как.
Посмотреть ОригиналОтветить0
  • Закрепить