當瀏覽器成為 AI 的下一個戰場,誰會被淘汰?

AI 的未來在於能自主導航網頁的代理。各大科技公司紛紛投入瀏覽器代理的開發,旨在自動化網頁任務、提升生產力。本文探討其應用場景、當前挑戰,以及 Web3 原生方案帶來的機遇。本文源自Mario Chow、Figo,@IOSG 所著文章,由BlockBeats 整理、編譯及撰稿。 (前情提要:OpenAI Sam Altman:我有興趣收購 Google Chrome!參賽市占最大瀏覽器爭奪戰 ) (背景補充:Perplexity 開價 345 億美元收購 Chrome 瀏覽器,AI 搜尋引擎小兵戰巨人 ) 過去 12 個月,網頁瀏覽器與自動化的關係發生了劇烈變化。幾乎所有大型科技公司都在爭相建構自主的瀏覽器代理 (browser agent)。從 2024 年底開始這一趨勢愈發明顯:OpenAI 在 1 月推出了 Agent 模式,Anthropic 為 Claude 模型發布了「電腦使用」功能,Google DeepMind 推出了 Project Mariner,Opera 宣布了代理型瀏覽器 Neon,而 Perplexity AI 則推出了 Comet 瀏覽器。訊號十分明確:AI 的未來在於能夠自主導航網頁的代理。 這一趨勢並不僅僅是給瀏覽器加上更聰明的聊天機器人,而是機器與數位環境互動方式的根本轉變。瀏覽器代理是一類能夠「看」網頁並採取行動的 AI 系統:點擊連結、填寫表單、滾動頁面、輸入文字:就像人類用戶一樣。這種模式承諾將釋放巨大的生產力和經濟價值,因為它能自動化那些目前仍需要人工操作,或傳統腳本過於複雜而無法完成的任務。 ▲ GIF 演示:AI 瀏覽器代理的實際操作:遵循指令,導航到目標資料集頁面,自動截圖並提取所需資料。 誰將赢得 AI 瀏覽器之戰? 幾乎所有大型科技公司 (以及一些新創公司) 都在開發各自的瀏覽器 AI 代理方案。以下是最具代表性的幾個專案: OpenAI – Agent 模式 OpenAI 的 Agent 模式 (前身名為 Operator,2025 年 1 月推出) 是一種自帶瀏覽器的 AI 代理。Operator 能夠處理各種重複性的線上任務:例如填寫網頁表單、訂購雜貨、安排會議:全部透過人類常用的標準網頁介面完成。 ▲ AI 代理像專業助理一樣安排會議:檢查日曆、尋找可用時間段、建立活動、發送確認,並為你生成 .ics 文件。 Anthropic – Claude 的「Computer Use」 2024 年底,Anthropic 為 Claude 3.5 引入了全新的「Computer Use (電腦使用)」功能,賦予了其像人一樣操作電腦和瀏覽器的能力。Claude 可以看螢幕、移動游標、點擊按鈕、輸入文字。這是首個同類的大模型代理工具進入公開測試版,開發者可以讓 Claude 自動導航網站和應用程式。Anthropic 將其定位為一種實驗性功能,主要目標是實現網頁上的多步驟工作流自動化。 Perplexity – Comet AI 新創公司 Perplexity (以問答引擎聞名) 在 2025 年中期推出了 Comet 瀏覽器,作為 Chrome 的 AI 驅動替代品。Comet 的核心是內建在網址列 (omnibox) 中的對話式 AI 搜尋引擎,能夠提供即時問答和摘要,而不是傳統的搜尋連結。 此外,Comet 還內建 Comet Assistant,這是一個駐留在側邊欄的代理,可以跨網站自動執行日常任務。例如,它可以總結你打開的郵件、安排會議、管理瀏覽器分頁,或代表你瀏覽並抓取網頁資訊。 透過側邊欄介面讓代理能夠感知當前網頁內容,Comet 旨在將瀏覽與 AI 助手無縫融合。 瀏覽器代理的真實應用場景 在前文中,我們已經回顧了各大科技公司 (OpenAI、Anthropic、Perplexity 等) 如何透過不同的產品形態為瀏覽器代理 (browser agents) 注入功能。為了更直觀地理解它們的價值,我們可以進一步看看在真實場景中,這些能力如何被應用到日常生活和企業工作流程中。 日常網頁自動化 # 電商與個人購物 一個非常實用的場景是將購物與預訂任務委託給代理。代理可以根據固定清單自動填充你的線上購物車並下單,也可以在多個零售商之間尋找最低價,並代你完成結帳流程。 對於旅行,你可以讓 AI 執行這樣的任務:「幫我預訂下個月去東京的航班 (票價低於 800 美元),再訂一家有免費 Wi-Fi 的飯店。」代理會處理整個流程:搜索航班、比較選項、填寫乘客資訊、完成飯店預訂,全部透過航空公司與飯店網站完成。這種自動化水平遠遠超越了現有的旅遊機器人:它不僅僅是推薦,而是直接執行購買。 # 提升辦公效率 代理能夠自動化許多人們在瀏覽器中進行的重複性業務操作。例如,整理電子郵件並提取待辦事項,或在多個日曆中檢查空檔並自動安排會議。Perplexity 的 Comet 助手已經可以透過網頁介面總結你的收件匣內容,或為你新增日程。代理還可以在獲得你的授權後,登入 SaaS 工具產生常規報告、更新電子試算表,或提交表單。想像一個 HR 代理,能夠自動登入不同的招聘網站發布職位;或一個銷售代理,可以更新 CRM 系統的潛在客戶資料。這些日常瑣碎工作本來會耗費大量員工時間,但 AI 可以透過自動化網頁表單和頁面操作完成。 除了單一任務,代理還能串聯起跨多個網路系統的完整工作流程。所有這些步驟都需要在不同的網頁介面中操作,而這正是 browser agent 的強項。代理可以登入各種儀表板進行故障排除,甚至編排流程,例如為新員工完成入職操作 (在多個 SaaS 網站上創建帳號)。本質上,任何目前需要點開多個網站完成的多步驟操作,都可以交由代理執行。 當下的挑戰與局限 儘管潛力巨大,但今天的瀏覽器代理距離完美仍有很大差距。目前的實現揭示出了一些長期存在的技術和基礎設施難題: 架構不匹配 現代...

AGENT2.8%
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)