Штучні агенти входять до випробувальної зони

Коротко

Генеральний директор Recall Labs, Ендрю Хілл, обговорює виклики побудови та довіри до агентів штучного інтелекту, підкреслюючи створення арени на блокчейні для публічної перевірки виконання.

AI Агенті входять до випробувального майданчика

Що вас надихнуло на створення Recall Network, і чому ви вирішили структурувати його як ончейн арену для AI-агентів?

Інтернет переходить від інформації до дії. Не просто пошук, а делегування. Агенти вже пишуть код, управляють портфелями, підсумовують дослідження. Проблема не в створенні. Вона в довірі. Кожен може запустити агента. Лише небагато можуть довести продуктивність.

Recall був створений для вирішення цієї проблеми — не як продукт, а як протокольна інфраструктура. Кредибельно нейтральна мережа, де агенти доводять свої можливості публічно і в блокчейні. Конкурси та оцінювання стають доказом. Репутація стає портативною. А пошук більше не є грою на здогад.

Ми не просто хочемо більше агентів. Ми хочемо систему, яка з'єднує та заохочує ШІ вирішувати проблеми людства.

Яку основну проблему в сучасному ландшафті штучного інтелекту ви намагаєтеся вирішити — і як Recall унікально її вирішує?

У нас занадто багато агентів і занадто мало довіри. Вузьке місце не в можливостях. Це оцінка. Які агенти реальні? Які лише підказка та лендінг? Зараз відповіді надходять з маркетингу та гіпу. Ми хочемо, щоб вони походили з доказів.

Recall перетворює бенчмаркінг на живу та еволюціонуючу мережеву функцію. Агенти заробляють репутацію, змагаючись. Куратори заробляють токени за виведення продуктивності на поверхню. Споживачі слідкують за рейтингами, а не за хайпом.

У світі, де більшість систем ШІ працюють як чорні ящики, наскільки реалістичним є перехід до повної прозорості та публічних показників ефективності?

Це вже відбувається. Зміна викликана попитом. Користувачі хочуть знати, що може зробити агент, перш ніж його інтегрувати. Розумні користувачі хочуть брати участь у тестуванні та оцінюванні своїх можливостей. Творці хочуть реальних еталонів, а не розмитих порівнянь.

При поверненні кожна дія агента реєструється. Кожне змагання можна переграти. Оцінки є компоновними та змінними. Ми очікуємо, що інші системи з часом приймуть цей стандарт, оскільки він працює.

Як ви запобігаєте іграм або маніпуляціям у системі, де агенти отримують винагороду за продуктивність?

Ви не можете запобігти спробам, але можете зробити їх неприбутковими — використовуючи токен для підтримки чесних агентів і зменшуючи їх винагороду за нечесність. Ігри та маніпуляції виявляються через поєднання автоматизованих систем і людей, які беруть участь, що дозволяє людям виявляти поганих. Ми вже бачили це в дії на наших живих змаганнях, де куратори виявляють нечесну поведінку та виключають агентів з таблиці лідерів.

Які види завдань або змагань є найбільш значущими для оцінки агентів ШІ сьогодні — і як вони еволюціонують, коли моделі стають розумнішими?

Завдання, які потребують міркувань, контексту або суджень у реальному світі, є найсильнішими сигналами у чат-агентах. Для нас зараз важливо зосередитися на торгівлі, оскільки є багато агентів для оцінки, багато що потрібно зрозуміти щодо здатності ШІ керувати крипто-портфелями та багато невизначеності з боку споживачів щодо того, чи може будь-який агент успішно торгувати. Для нас торгівля криптовалютою на основі ШІ для мас не є питанням якщо, а коли. Ми сподіваємося зіграти важливу роль у прискоренні цього через бенчмаркінг та конкурси.

Яку роль ви бачите за блокчейном у майбутньому штучного інтелекту — інфраструктурний шар, шар управління, шар відповідальності?

Блокчейн може функціонувати як усі три з цих рівнів. Конкуренція відбувається в мережі, з управлінськими механізмами для правил взаємодії та спільним реєстром для поведінки агентів. Блокчейн надає нам публічну пам'ять, перевірну історію та програмовану довіру.

Однак його найважливіша роль є економічною. Він дозволяє нам винагороджувати людський шар, який підтримує чесність штучного інтелекту.

Чи бачите ви, що ончейн агенти замінюють традиційні моделі SaaS — чи доповнюють їх?

Вони почнуть з доповнення. Потім перевершать. Нарешті, вони замінять цілі категорії.

Яку роль, на вашу думку, відіграватимуть крипто-примітиви — такі як токени, стекинг або штрафи — у керуванні поведінкою ШІ в масштабах?

Токени дозволяють творцям платити за видимість. Вони дозволяють кураторам заробляти за виведення цінності на поверхню. Вони створюють стійкі записи переконання. Стейкінг пов'язує віру з витратами. Штрафування перетворює невдачу на зворотний зв'язок.

Як нам слід думати про взаємодію між агентними системами — чи з'являться стандарти, чи залишаться фрагментованими?

Фрагментація є стандартною. Взаємодія виникає, коли підключення легше, ніж відновлення. A2A все ще досить неперевірений як протокол для перетворення організаційних меж. Але для використання агентів між організаціями споживачі та бізнеси потребують систем, таких як Recall, щоб створити надійні еталони та безпеку для користувачів.

Як ви бачите розвиток взаємозв'язку між базовими моделями та агентними фреймворками протягом наступних кількох років?

Фундаційні моделі продовжать покращуватись. Ми розглядаємо агентний рівень як усе, що побудовано на основі сирих моделей; агенти — це програмні моделі, які є базою даних. Інтерфейс, який ми використовуємо, буде продовжувати абстрагувати все більше і більше маршрутизації та варіацій нижче. Grok 4 Heavy вже є роями агентів. Чутки свідчать, що GPT-5 буде вдосконаленою системою маршрутизації з багатьма моделями та агентами, які використовуються для вирішення правильних завдань. Відкриті системи підуть слідом.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити