Зростання AI браузерів: передова лінія третьої війни браузерів

AI-браузер: нове поле бою третьої війни браузерів

Третя війна браузерів тихо розгортається. Оглядаючи історію, починаючи з Netscape та IE від Microsoft у 90-х роках минулого століття, до Firefox, що ґрунтується на відкритому коді, та Google Chrome, суперечка між браузерами завжди була яскравим проявом контролю платформи та зміни технологічних парадигм. Chrome завоював панівну позицію завдяки швидкості оновлень та екологічним зв'язкам, а Google через "подвійний олігопол" пошуку та браузера сформував замкнене коло інформаційного входу.

Проте сьогодні ця структура почала коливатися. Поява великих мовних моделей (LLM) призвела до того, що все більше користувачів виконують завдання на сторінках результатів пошуку з "нульовими кліками", традиційна поведінка клацання на веб-сторінки зменшується. Тим часом чутки про те, що Apple може замінити стандартну пошукову систему в Safari, ще більше загрожують прибутковій основі Alphabet, ринок вже почав виявляти тривогу щодо "традиційного пошуку".

Браузер також стикається з перетворенням своєї ролі. Це вже не просто інструмент для відображення веб-сторінок, а контейнер, що об'єднує функції введення даних, поведінки користувачів, конфіденційності та ідентичності. Хоча AI Agent потужний, для виконання складних взаємодій на сторінці, виклику локальних даних про особу та контролю елементів веб-сторінки все ще потрібні довірчі межі та функціональні пісочниці браузера. Браузер перетворюється з людського інтерфейсу на платформу системних викликів для агентів.

Справжнім потенційним розривом у поточній структурі ринку браузерів буде не ще один "кращий Chrome", а нова структура взаємодії: не просто показ інформації, а виклик завдань. У майбутньому браузери повинні бути розроблені для AI-агентів - щоб не лише читати, а й писати та виконувати. Проекти на кшталт Browser Use намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структурований текст, який можна викликати за допомогою LLM, значно знижуючи витрати на взаємодію.

На ринку основні проекти вже почали експериментувати: Perplexity створює рідний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист конфіденційності з місцевим висновком, використовуючи LLM для покращення функцій пошуку та блокування; а такі проекти, як Donut, намагаються знайти нові способи взаємодії між ШІ та активами на блокчейні. Спільною рисою цих проектів є те, що вони намагаються перебудувати вхідний інтерфейс браузера, а не покращити його вихідний рівень.

Для підприємців можливості приховані у трикутних відносинах між введенням, структурою та агентом. Браузер, як інтерфейс для виклику світу майбутнього агентів, означає, що той, хто може надати структуровані, викликаючі, надійні "блоки можливостей", той зможе стати частиною нового покоління платформ. Від SEO до AEO (оптимізація агентського двигуна), від трафіку на сторінці до виклику ланцюга завдань, форми продуктів і дизайнерське мислення перебудовуються. Третя браузерна війна відбувається в "введенні", а не в "демонстрації"; вирішальним фактором не є те, хто привертає увагу користувачів, а те, хто завойовує довіру агентів і отримує доступ до виклику.

Історія розвитку браузерів

На початку 90-х років минулого століття, коли інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, як корабель, що відкриває нові землі, відкриваючи мільйонам користувачів двері до цифрового світу. Цей браузер не був першим, але став першим продуктом, який справді вийшов на масовий ринок і сформував інтернет-досвід. Тоді люди вперше змогли так легко переглядати веб-сторінки через графічний інтерфейс, немов увесь світ раптово став доступним.

Однак, велич часто є короткочасною. Microsoft швидко усвідомила важливість браузера і вирішила примусово зв'язати Internet Explorer з операційною системою Windows, зробивши його браузером за замовчуванням. Ця стратегія стала "вбивцею платформ", прямо зруйнувавши панування Netscape на ринку. Багато користувачів не вибирали IE свідомо, а просто приймали його, оскільки він був за замовчуванням у системі. IE завдяки можливостям розповсюдження Windows швидко став лідером галузі, тоді як Netscape впала в спіраль занепаду.

У скрутному становищі інженери Netscape обрали радикальний і ідеалістичний шлях – вони відкрили вихідний код браузера, звернувшись до спільноти з відкритим кодом. Це рішення нагадувало "македонську відмову" в технологічному світі, що передбачало кінець старої ери та підйом нових сил. Цей код згодом став основою проекту браузера Mozilla, спочатку названого Phoenix (що означає відродження фенікса), але через проблеми з торговою маркою неодноразово змінював назву, врешті-решт отримавши ім'я Firefox.

Firefox не є простим копіюванням Netscape, він досягнув значних проривів у користувацькому досвіді, екосистемі плагінів, безпеці та інших аспектах. Його народження знаменує перемогу відкритого коду, а також надає нову енергію всій галузі. Дехто описує Firefox як "духовного спадкоємця" Netscape, подібно до того, як Османська імперія успадкувала залишки Візантії. Це порівняння, хоча й перебільшене, проте має глибокий зміст.

Але за кілька років до офіційного випуску Firefox, Microsoft вже випустила шість версій IE, використовуючи перевагу часу та стратегію пакетної установки системи, що змусило Firefox з самого початку опинитися в позиції наздоганяючого, що робить це змагання не рівною боротьбою на стартовій лінії.

Водночас, ще один ранній гравець тихо з'явився на сцені. У 1994 році з'явився браузер Opera, який походить з Норвегії і спочатку був лише експериментальним проектом. Але з 7.0 версії 2003 року він запровадив власний движок Presto, ставши першим, хто підтримав CSS, адаптивну верстку, голосове управління та кодування Unicode і інші передові технології. Хоча кількість користувачів була обмеженою, технологічно він завжди був попереду галузі, ставши "улюбленцем ґіків".

В тому ж році Apple випустила браузер Safari. Це стало знаковим поворотом. Тоді Microsoft інвестувала 150 мільйонів доларів у Apple, яка перебувала на межі банкрутства, щоб підтримати видимість конкуренції та уникнути антимонопольного розслідування. Хоча Google був за замовчуванням пошуковою системою Safari з моменту його створення, ця історія з Microsoft символізує складні та тонкі відносини між інтернет-гігантами: співпраця та конкуренція завжди йдуть поруч.

2007 року IE7 було випущено разом з Windows Vista, але ринковий відгук був посереднім. Натомість Firefox, завдяки швидшому темпу оновлень, більш дружній механіці розширень та природному привабленню для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово ослаблюється, напрямок змінюється.

Google - це інший підхід. Хоча з 2001 року компанія почала працювати над створенням власного браузера, їй знадобилося шість років, щоб переконати генерального директора Еріка Шмідта схвалити цей проект. Chrome з'явився у 2008 році, створений на основі відкритого проекту Chromium та рушія WebKit, який використовується в Safari. Його жартома називають "об'ємним" браузером, але завдяки глибоким знанням Google в рекламі та брендингу, він швидко став популярним.

Ключовою зброєю Chrome є не функціональність, а частота оновлень версій (кожні шість тижнів) та єдиний досвід для всіх платформ. У листопаді 2011 року Chrome вперше перевершив Firefox, досягнувши частки ринку 27%; через шість місяців він знову обігнав IE, завершивши перехід від виклику до домінування.

В той же час мобільний інтернет Китаю також формує власну екосистему. Браузер UC швидко набрав популярності на початку 2010-х років, особливо на нових ринках, таких як Індія, Індонезія та Китай, завдяки легкому дизайну та функціям стиснення даних для економії трафіку, завоювавши прихильність користувачів на бюджетних пристроях. У 2015 році його частка на глобальному ринку мобільних браузерів перевищила 17%, а в Індії досягала 46%. Але ця перемога була недовговічною. У міру посилення урядом Індії перевірки безпеки китайських додатків браузер UC був змушений покинути ключовий ринок і поступово втратив колишню славу.

У 2020-х роках домінування Chrome вже встановилося, а глобальна частка ринку стабілізувалася на рівні близько 65%. Варто зазначити, що хоча пошукова система Google і браузер Chrome належать до Alphabet, з ринкової точки зору це дві незалежні гегемонії - перша контролює близько 90% глобальних пошукових входів, а друга має більшість користувачів, які заходять в інтернет через "перше вікно".

Щоб зберегти цю подвійно монопольну структуру, Google не шкодує коштів. У 2022 році Alphabet заплатила Apple близько 20 мільярдів доларів лише для того, щоб Google зберегла статус за замовчуванням у Safari. Деякі аналітики вказують, що цей витрати становлять 36% від доходу від пошукової реклами, який Google отримує з трафіку Safari. Іншими словами, Google платить "захисний внесок" за свою "крепость".

Але вітри знову змінилися. З ростом великих мовних моделей (LLM) традиційний пошук почав зазнавати ударів. У 2024 році частка ринку пошуку Google знизилася з 93% до 89%, хоча він все ще домінує, але тріщини вже з'явилися. Ще більш руйнівною є чутка про те, що Apple може запустити власну AI пошукову систему - якщо Safari перейде на власний пошуковик, це не тільки перепише екологічну картину, але й може похитнути прибуткову основу Alphabet. Ринок швидко відреагував, акції Alphabet з 170 доларів впали до 140 доларів, що відображає не лише паніку інвесторів, а й глибокий неспокій щодо майбутнього ери пошуку.

Від Navigator до Chrome, від ідеалів з відкритим кодом до комерціалізації реклами, від легкого браузера до AI-пошукового помічника, боротьба браузерів завжди була війною за технології, платформи, контент та контроль. Поле битви постійно переміщується, але суть залишається незмінною: хто контролює вхід, той визначає майбутнє.

У очах венчурних капіталістів, спираючись на нові вимоги людей до пошукових систем в епоху LLM та AI, третя війна браузерів поступово розгортається. Нижче наведено частину відомих проектів у сфері AI-браузерів та їх фінансування.

Застаріла архітектура сучасних браузерів

Говорячи про архітектуру браузера, класична традиційна архітектура зображена на малюнку нижче:

Клієнт - фронтальний вхід

Запитайте через HTTPS найближчий Google Front End, виконайте TLS-розшифрування, вибірку QoS та гео-маршрутизацію. Якщо виявлено аномальний трафік (DDoS, автоматичне сканування), можна обмежити швидкість або кинути виклик на цьому рівні.

Розуміння запиту

Фронт-енд повинен розуміти значення слів, введених користувачем, і для цього є три етапи: нейронна перевірка орфографії, виправлення "recpie" на "recipe"; розширення синонімів, розширення "how to fix bike" до "repair bicycle". Аналіз намірів, визначення, чи є запит інформаційним, навігаційним чи торговим наміром, і розподіл запитів за вертикалями.

Кандидат на повернення

Технологія запитів, що використовується Google, називається: обернене індексування. У прямому індексуванні ми можемо отримати файл, знаючи його ID. Але користувач не може знати, під яким номером знаходиться потрібний йому контент серед тисяч мільярдів файлів, тому використовується традиційне обернене індексування, яке дозволяє шукати файли за наявними ключовими словами. Далі Google використовує векторне індексування для обробки семантичного пошуку, тобто для пошуку контенту, який є схожим за значенням на запит. Воно перетворює текст, зображення та інший контент на багатовимірні вектори (embedding) і здійснює пошук на основі схожості між цими векторами. Наприклад, навіть якщо користувач шукає "як приготувати тісто для піци", пошукова система може повернути результати, пов'язані з "посібником з приготування тіста для піци", оскільки вони семантично схожі. Після оберненого індексування та векторного індексування приблизно сто тисяч веб-сторінок буде попередньо відсортовано.

Багаторівневе сортування

Системи зазвичай відфільтровують десятки тисяч кандидатних сторінок до приблизно 1000, використовуючи тисячі легких ознак, таких як BM25, TF-IDF, оцінка якості сторінки тощо, формуючи попередній набір кандидатів. Такі системи широко відомі як рекомендаторні системи. Вони залежать від численних характерних ознак, створених різними сутностями, включаючи поведінку користувачів, властивості сторінок, наміри запиту та контекстуальні сигнали. Наприклад, Google враховує історію користувача, відгуки інших користувачів, семантику сторінки, значення запиту та іншу інформацію, а також розглядає контекстуальні фактори, такі як час (період доби, конкретні дні тижня) та актуальні новини або зовнішні події.

Глибоке навчання для основного ранжування

На етапі первинного пошуку Google використовує такі технології, як RankBrain та Neural Matching, щоб зрозуміти семантику запиту та відфільтрувати первинно релевантні результати з величезної кількості документів. RankBrain — це система машинного навчання, впроваджена Google у 2015 році, яка має на меті краще зрозуміти значення запитів користувачів, особливо нових запитів. Вона перетворює запити та документи у векторні представлення та обчислює їхню схожість, щоб знайти найбільш релевантні результати. Наприклад, для запиту "як приготувати тісто для піци", навіть якщо в документі немає точних відповідних ключових слів, RankBrain може розпізнати вміст, пов'язаний з "основою піци" або "приготуванням тіста".

Neural Matching – це ще одна технологія, яку Google впровадив у 2018 році, з метою глибшого розуміння семантичних зв'язків між запитами та документами. Вона використовує моделі нейронних мереж для виявлення неявних зв'язків між словами, допомагаючи Google краще поєднувати запити та вміст веб-сторінок. Наприклад, для запиту "чому мій ноутбук голосно працює вентилятор" Neural Matching може зрозуміти, що користувач, можливо, шукає інформацію про перегрів, накопичення пилу або високе навантаження на ЦП.

AGENT0.22%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Репост
  • Поділіться
Прокоментувати
0/400
DefiEngineerJackvip
· 2год тому
*с sigh* централізовані технологічні монополії нарешті отримують rekt від llms... базово
Переглянути оригіналвідповісти на0
CodeZeroBasisvip
· 20год тому
Писати код так само, як і закохуватись: найважливіше - це ставлення.
Переглянути оригіналвідповісти на0
RugDocDetectivevip
· 20год тому
IE помер, Safari також не варто хизуватися
Переглянути оригіналвідповісти на0
TokenomicsTrappervip
· 20год тому
передбачувано... я передбачив цю точну війну браузерів ще в третьому кварталі, коли показники LLM почали стабілізуватися, чесно кажучи.
Переглянути оригіналвідповісти на0
GateUser-74b10196vip
· 20год тому
Ця війна триває занадто довго.
Переглянути оригіналвідповісти на0
  • Закріпити