Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Các dự án AI Agent trong lĩnh vực khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án về đào tạo mô hình và tích hợp nền tảng đã trở thành xu hướng chính do vai trò quan trọng của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ trọng vốn hóa thị trường của chúng trong lĩnh vực AI lại cao tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt qua 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào các sản phẩm ứng dụng không phải cốt lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng xuất hiện dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong hai tháng ngắn ngủi đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt con số ấn tượng 20,3 triệu đô la Mỹ, trong khi OpenAI sau khi phát hành ChatGPT cũng nhanh chóng cho ra mắt các phiên bản kế tiếp như GPT-4 và GP4-4o. Với đà phát triển mạnh mẽ như vậy, các gã khổng lồ công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đều cho ra mắt mô hình và ứng dụng AI riêng của mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta cho ra mắt Llama3, trong khi các công ty Trung Quốc thì cho ra mắt các mô hình lớn như Văn Tâm Nhất Ngôn và Trí Đồ Thanh Ngôn, rõ ràng lĩnh vực AI đã trở thành một chiến trường không thể tránh khỏi.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi từ khảo sát thống kê nghiên cứu AI mã nguồn mở phát hiện, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự quan tâm của cộng đồng phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê với công nghệ AI đã được phản ánh trực tiếp trong thị trường đầu tư, thị trường đầu tư AI đang cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động cho các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI của Elon Musk đã huy động được 6 tỷ USD, có giá trị định giá là 24 tỷ USD, trở thành công ty khởi nghiệp AI có giá trị định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ sự cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, và đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư liên tục lập kỷ lục mới, và định giá cũng theo đó mà tăng cao. Tổng thể mà nói, thị trường AI đang trong một thời kỳ vàng son phát triển nhanh chóng, các mô hình ngôn ngữ lớn và công nghệ tạo sinh tăng cường tìm kiếm đã đạt được những bước tiến quan trọng trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với những thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro của việc tạo ra thông tin không chính xác và vấn đề về tính minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ mô hình ngôn ngữ thuần túy sang các hệ thống thông minh thực sự có khả năng hiểu, học hỏi và giải quyết các vấn đề thực tế. Vì vậy, chúng tôi thấy hy vọng từ sự phát triển của AI Agent, khi nó dần dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc quan hệ sản xuất của nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các nguyên lý cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ nảy sinh một loạt ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi cho rằng, AI Agent với khả năng thực hiện nhiệm vụ tự chủ của nó, đã thể hiện tiềm năng lớn trong việc đạt được ứng dụng quy mô lớn.
Để làm được điều đó, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, cấp ứng dụng, đến thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và bối cảnh ứng dụng hứa hẹn nhất, để hiểu sâu về sự tích hợp sâu sắc giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại của AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu về AI Agent, để giúp người đọc hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và lời khuyên du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như JARVIS trong phim Iron Man, có thể hiểu nhu cầu và chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện tại, trong ngành công nghiệp, định nghĩa phổ biến về AI Agent là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Nó thu thập thông tin môi trường thông qua cảm biến, sau đó xử lý và tác động đến môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có thể lập kế hoạch, phân tích nhiệm vụ và thực sự thực hiện.
Dựa trên định nghĩa và đặc điểm này, chúng ta có thể nhận ra rằng AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla, tất cả đều có thể được coi là ví dụ của AI Agent. Những hệ thống này có một đặc điểm chung là đều có khả năng cảm nhận đầu vào từ người dùng bên ngoài và từ đó đưa ra phản ứng có ảnh hưởng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành nên mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong đó GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP thì T là AI Agent tiến hóa dựa trên mô hình GPT.
Tổng quan phân loại
Hiện tại, thị trường AI Agent vẫn chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã đánh dấu 204 dự án AI Agent trong thị trường Web2+Web3 theo cách riêng, dựa trên các nhãn nổi bật tương ứng với từng dự án, đã được chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung và tương tác người dùng, sau đó được chia nhỏ dựa trên các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như dịch vụ B2B cho các ứng dụng cơ bản đã trưởng thành.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khuôn khổ hỗ trợ xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích các định dạng dữ liệu khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho đào tạo.
Lớp đào tạo mô hình: Cung cấp dịch vụ đào tạo mô hình AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, chuyên ngành và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, nhưng khác ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), đạt được sự tương tác hai chiều với người dùng.
Loại hỗ trợ tình cảm: AI Agent cung cấp hỗ trợ và đồng hành cảm xúc.
GPT loại: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau theo hướng dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 cho thấy xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba các dự án tập trung vào các loại hạ tầng, chủ yếu là các dịch vụ B2B và các công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương tự như "cái xẻng" trong lĩnh vực AI, cung cấp một nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy của nhu cầu thị trường: Một yếu tố then chốt khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp là cấp thiết hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho họ trong việc phát triển các dự án tiếp theo.
Giới hạn trong các tình huống ứng dụng: Trong khi đó, chúng tôi lưu ý rằng các AI tạo nội dung có ứng dụng trong thị trường B2B còn tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có thể tăng cường năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành về công nghệ, nhu cầu của thị trường và những cân nhắc thực tế về các tình huống ứng dụng. Khi công nghệ AI tiếp tục phát triển và nhu cầu thị trường được làm rõ hơn, chúng tôi dự đoán rằng cấu trúc này có thể có sự điều chỉnh, nhưng các loại cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án đầu ngành AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án là Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của nó cho phép người dùng tạo, huấn luyện và tương tác với các nhân vật ảo, những nhân vật có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 đạt 277 triệu, nền tảng có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng nằm trong độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, được định giá đạt 1 tỷ USD, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký kết thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, cho thấy Character AI sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp các câu trả lời chi tiết từ Internet. Bằng cách trích dẫn và tham khảo các liên kết, nó đảm bảo độ tin cậy và chính xác của thông tin, đồng thời giáo dục và hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu tìm kiếm đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập vào các ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố huy động được 62,7 triệu USD, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ các mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình phù hợp cho nghiên cứu học thuật chuyên nghiệp và chuyên sâu.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
20 thích
Phần thưởng
20
8
Chia sẻ
Bình luận
0/400
BearMarketMonk
· 07-23 17:54
Chả có tác dụng gì, bản chất chỉ là sự đổi mới Ponzi.
Xem bản gốcTrả lời0
fork_in_the_road
· 07-22 00:54
thế giới tiền điện tử thật không thể thiếu thuốc này của AI nhỉ
Xem bản gốcTrả lời0
governance_ghost
· 07-21 05:32
Hảo gia hảo, vốn hóa thị trường đã chạy lên 23% rồi.
Xem bản gốcTrả lời0
DuskSurfer
· 07-21 05:29
ai+web3 đợt này chắc chắn To da moon rồi!
Xem bản gốcTrả lời0
GasFeeSobber
· 07-21 05:28
Số liệu có tác dụng gì, chỉ là đầu cơ khái niệm mà thôi.
Xem bản gốcTrả lời0
StakeOrRegret
· 07-21 05:28
Những dữ liệu này thật quá hấp dẫn To da moon
Xem bản gốcTrả lời0
DeFi_Dad_Jokes
· 07-21 05:24
Ai quan tâm đến tỷ lệ chứ? APE必tăng lên
Xem bản gốcTrả lời0
SilentObserver
· 07-21 05:09
Cảm giác chính là được chơi cho Suckers, một chiêu trò mới.
Liệu AI Agent có thể trở thành động lực chính cho sự kết hợp giữa Web3 và AI?
Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Các dự án AI Agent trong lĩnh vực khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án về đào tạo mô hình và tích hợp nền tảng đã trở thành xu hướng chính do vai trò quan trọng của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ trọng vốn hóa thị trường của chúng trong lĩnh vực AI lại cao tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt qua 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào các sản phẩm ứng dụng không phải cốt lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng xuất hiện dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong hai tháng ngắn ngủi đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt con số ấn tượng 20,3 triệu đô la Mỹ, trong khi OpenAI sau khi phát hành ChatGPT cũng nhanh chóng cho ra mắt các phiên bản kế tiếp như GPT-4 và GP4-4o. Với đà phát triển mạnh mẽ như vậy, các gã khổng lồ công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đều cho ra mắt mô hình và ứng dụng AI riêng của mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta cho ra mắt Llama3, trong khi các công ty Trung Quốc thì cho ra mắt các mô hình lớn như Văn Tâm Nhất Ngôn và Trí Đồ Thanh Ngôn, rõ ràng lĩnh vực AI đã trở thành một chiến trường không thể tránh khỏi.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi từ khảo sát thống kê nghiên cứu AI mã nguồn mở phát hiện, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu dự án vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự quan tâm của cộng đồng phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê với công nghệ AI đã được phản ánh trực tiếp trong thị trường đầu tư, thị trường đầu tư AI đang cho thấy sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Trên toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động cho các công ty khởi nghiệp AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI của Elon Musk đã huy động được 6 tỷ USD, có giá trị định giá là 24 tỷ USD, trở thành công ty khởi nghiệp AI có giá trị định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ sự cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, và đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án liên tục xuất hiện, số tiền đầu tư liên tục lập kỷ lục mới, và định giá cũng theo đó mà tăng cao. Tổng thể mà nói, thị trường AI đang trong một thời kỳ vàng son phát triển nhanh chóng, các mô hình ngôn ngữ lớn và công nghệ tạo sinh tăng cường tìm kiếm đã đạt được những bước tiến quan trọng trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn phải đối mặt với những thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, chẳng hạn như sự không chắc chắn trong đầu ra của mô hình, rủi ro của việc tạo ra thông tin không chính xác và vấn đề về tính minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ mô hình ngôn ngữ thuần túy sang các hệ thống thông minh thực sự có khả năng hiểu, học hỏi và giải quyết các vấn đề thực tế. Vì vậy, chúng tôi thấy hy vọng từ sự phát triển của AI Agent, khi nó dần dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI liên tục định hình lại cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc quan hệ sản xuất của nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các nguyên lý cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ nảy sinh một loạt ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi cho rằng, AI Agent với khả năng thực hiện nhiệm vụ tự chủ của nó, đã thể hiện tiềm năng lớn trong việc đạt được ứng dụng quy mô lớn.
Để làm được điều đó, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, cấp ứng dụng, đến thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và bối cảnh ứng dụng hứa hẹn nhất, để hiểu sâu về sự tích hợp sâu sắc giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại của AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu về AI Agent, để giúp người đọc hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến đi. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và lời khuyên du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như JARVIS trong phim Iron Man, có thể hiểu nhu cầu và chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện tại, trong ngành công nghiệp, định nghĩa phổ biến về AI Agent là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Nó thu thập thông tin môi trường thông qua cảm biến, sau đó xử lý và tác động đến môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có thể lập kế hoạch, phân tích nhiệm vụ và thực sự thực hiện.
Dựa trên định nghĩa và đặc điểm này, chúng ta có thể nhận ra rằng AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được ứng dụng trong nhiều tình huống khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla, tất cả đều có thể được coi là ví dụ của AI Agent. Những hệ thống này có một đặc điểm chung là đều có khả năng cảm nhận đầu vào từ người dùng bên ngoài và từ đó đưa ra phản ứng có ảnh hưởng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành nên mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong đó GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP thì T là AI Agent tiến hóa dựa trên mô hình GPT.
Tổng quan phân loại
Hiện tại, thị trường AI Agent vẫn chưa hình thành tiêu chuẩn phân loại thống nhất, chúng tôi đã đánh dấu 204 dự án AI Agent trong thị trường Web2+Web3 theo cách riêng, dựa trên các nhãn nổi bật tương ứng với từng dự án, đã được chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung và tương tác người dùng, sau đó được chia nhỏ dựa trên các trường hợp sử dụng thực tế:
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như dịch vụ B2B cho các ứng dụng cơ bản đã trưởng thành.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khuôn khổ hỗ trợ xây dựng AI Agent.
Loại xử lý dữ liệu: Xử lý và phân tích các định dạng dữ liệu khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho đào tạo.
Lớp đào tạo mô hình: Cung cấp dịch vụ đào tạo mô hình AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, chuyên ngành và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, nhưng khác ở chỗ có sự tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), đạt được sự tương tác hai chiều với người dùng.
Loại hỗ trợ tình cảm: AI Agent cung cấp hỗ trợ và đồng hành cảm xúc.
GPT loại: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau theo hướng dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 cho thấy xu hướng tập trung rõ rệt. Cụ thể, khoảng hai phần ba các dự án tập trung vào các loại hạ tầng, chủ yếu là các dịch vụ B2B và các công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên các công nghệ và khung đã được kiểm nghiệm qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương tự như "cái xẻng" trong lĩnh vực AI, cung cấp một nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy của nhu cầu thị trường: Một yếu tố then chốt khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI trong thị trường doanh nghiệp là cấp thiết hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho họ trong việc phát triển các dự án tiếp theo.
Giới hạn trong các tình huống ứng dụng: Trong khi đó, chúng tôi lưu ý rằng các AI tạo nội dung có ứng dụng trong thị trường B2B còn tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưu tiên những ứng dụng có thể tăng cường năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án tương đối nhỏ.
Xu hướng này phản ánh sự trưởng thành về công nghệ, nhu cầu của thị trường và những cân nhắc thực tế về các tình huống ứng dụng. Khi công nghệ AI tiếp tục phát triển và nhu cầu thị trường được làm rõ hơn, chúng tôi dự đoán rằng cấu trúc này có thể có sự điều chỉnh, nhưng các loại cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án đầu ngành AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án là Character AI, Perplexity AI, Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của nó cho phép người dùng tạo, huấn luyện và tương tác với các nhân vật ảo, những nhân vật có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 đạt 277 triệu, nền tảng có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng nằm trong độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu USD, được định giá đạt 1 tỷ USD, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký kết thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, cho thấy Character AI sử dụng công nghệ tự phát triển. Đáng chú ý, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp các câu trả lời chi tiết từ Internet. Bằng cách trích dẫn và tham khảo các liên kết, nó đảm bảo độ tin cậy và chính xác của thông tin, đồng thời giáo dục và hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu tìm kiếm đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập vào các ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố huy động được 62,7 triệu USD, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ các mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Mô hình phù hợp cho nghiên cứu học thuật chuyên nghiệp và chuyên sâu.