現在、業界内で一般的にAIエージェントの定義は、環境を認識し、適切な行動をとることができるインテリジェントシステムを指します。センサーを介して環境情報を取得し、処理を経てアクチュエーターを通じて環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスクプランニング、ツール使用能力を統合したアシスタントであると考えています。それは単なる情報提供に留まらず、計画を立て、タスクを分解し、実際に実行することができます。
AIエージェントはWeb3とAIの融合の重要な推進力になり得るか
AIエージェントはWeb3+AIの救いの手になれるのか?
AIエージェントプロジェクトは、Web2起業において人気があり成熟したタイプが主に企業向けサービスであるのに対し、Web3分野ではエコシステム構築における重要な役割から、モデルトレーニングやプラットフォーム集約型プロジェクトが主流となっています。
現在のWeb3のAIエージェントプロジェクトの数は少なく、割合は8%ですが、それらのAI分野における時価総額の割合は23%に達しており、強力な市場競争力を示しています。技術の成熟と市場の認知度の向上に伴い、将来的には10億ドルを超える評価のプロジェクトが複数登場することが予想されます。
Web3プロジェクトにおいて、非AIコアのアプリケーション製品にAI技術を導入することは、戦略的な優位性となる可能性があります。AIエージェントプロジェクトの結合方法は、全エコシステムの構築とトークンエコノミーモデルの設計に重点を置き、分散化とネットワーク効果を促進する必要があります。
AIの波:プロジェクトの出現と評価の上昇の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月で1億人以上のユーザーを惹きつけ、2024年5月にはChatGPTの月収が驚異の2030万ドルに達しました。また、OpenAIはChatGPTを発表した後、迅速にGPT-4やGP4-4oなどのバージョンをリリースしました。このような急成長の中で、各大手テクノロジー企業はLLMなどの最先端AIモデルの重要性に気づき、自社のAIモデルやアプリケーションを次々と発表しています。例えば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3をリリースし、中国の企業は文心一言や智谱清言などの大規模モデルを発表しました。明らかにAI分野は争奪戦の場となっています。
主要なテクノロジー企業の競争は、商業アプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計からも明らかになっており、2024年のAIインデックスレポートによると、GitHub上のAI関連プロジェクトの数は2011年の845件から2023年の約180万件に急増しました。特にGPTのリリース後の2023年には、プロジェクト数が前年比で59.3%増加し、世界の開発者コミュニティのAI研究への熱意を反映しています。
AI技術に対する熱意は、投資市場に直接反映されており、AI投資市場は強力な成長を示し、2024年第2四半期には爆発的な成長を見せました。世界には合計16件の1.5億ドルを超えるAI関連の投資があり、これは第1四半期の2倍に相当します。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で倍増しました。その中で、マスクが率いるxAIは60億ドルを調達し、評価額は240億ドルに達し、OpenAIに次いで評価額が2番目に高いAIスタートアップとなりました。
AI技術の急速な発展は、前例のない速度でテクノロジー分野の地図を再構築しています。テクノロジーの巨人たちの間での激しい競争から、オープンソースコミュニティプロジェクトの盛況な発展、さらには資本市場のAI概念に対する熱烈な追い風まで、プロジェクトは次々と登場し、投資額は新たな高みを更新し、評価額も同様に高騰しています。全体的に見て、AI市場は高速成長の黄金時代にあり、大規模言語モデルと検索強化生成技術は言語処理分野で重要な進展を遂げました。それにもかかわらず、これらのモデルは技術的な優位性を実際の製品に転換する際に、モデルの出力の不確実性、生成された不正確な情報の錯覚リスク、モデルの透明性に関する問題などの課題に直面しています。これらの問題は、信頼性が非常に求められるアプリケーションシーンにおいて特に重要になります。
この背景の中で、私たちはAIエージェントの研究を始めました。なぜなら、AIエージェントは実際の問題を解決することと環境との相互作用の包括性を強調しているからです。この転換は、AI技術が純粋な言語モデルから、実際の問題を真に理解し、学習し、解決することができる知能システムへの進化を示しています。したがって、私たちはAIエージェントの発展から希望を見出しました。この技術は、AI技術と実際の問題解決との間のギャップを徐々に埋めています。AI技術の進化は、生産力の構造を絶えず再形成しており、Web3技術はデジタル経済の生産関係を再構築しています。AIの三大要素であるデータ、モデル、計算能力が、Web3の分散型、トークン経済、スマートコントラクトなどの核心理念と融合するとき、私たちは一連の革新的なアプリケーションが生まれることを予見しています。この潜在能力に満ちた交差領域において、AIエージェントは、自主的にタスクを実行する能力によって、大規模な応用を実現する巨大な可能性を示しています。
これを受けて、私たちはWeb3におけるAIエージェントの多様な応用について深く研究を始めました。Web3のインフラストラクチャ、中間層、アプリケーションレベル、データおよびモデル市場など、さまざまな次元から最も有望なプロジェクトタイプとアプリケーションシナリオを特定し評価することを目指し、AIとWeb3の深い統合を理解するために取り組んでいます。
! AIエージェントはWeb3+AIの命の恩人になれるか?
概念の明確化:AIエージェントの紹介と分類の概要
基本的な紹介
AIエージェントの紹介の前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシナリオを例に挙げて説明します:あなたが旅行を計画していると仮定しましょう。従来の大規模言語モデルは、目的地の情報や旅行の提案を提供します。情報検索を強化した生成技術は、より豊かで具体的な目的地のコンテンツを提供します。一方、AIエージェントはアイアンマン映画のジャービスのように、ニーズを理解し、一言でフライトやホテルを自動的に検索し、予約操作を実行し、スケジュールに行程を追加することができます。
現在、業界内で一般的にAIエージェントの定義は、環境を認識し、適切な行動をとることができるインテリジェントシステムを指します。センサーを介して環境情報を取得し、処理を経てアクチュエーターを通じて環境に影響を与えるものです(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスクプランニング、ツール使用能力を統合したアシスタントであると考えています。それは単なる情報提供に留まらず、計画を立て、タスクを分解し、実際に実行することができます。
この定義と特性に基づいて、私たちはAIエージェントがすでに私たちの生活に溶け込み、さまざまなシーンで応用されていることを発見できます。たとえば、AlphaGo、Siri、テスラのL5レベル以上の自動運転などは、AIエージェントの例と見なすことができます。これらのシステムの共通の特質は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を与える対応を行うことができる点です。
ChatGPTを例にして概念を明確にするために、TransformerがAIモデルを構成する技術アーキテクチャであることを明確に指摘する必要があります。GPTはこのアーキテクチャに基づいて発展したモデルシリーズであり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階のバージョンを表しています。ChatGPはGPTモデルから進化したAIエージェントです。
! AIエージェントはWeb3+AIの命の恩人になれるか?
カテゴリー概要
現在、AIエージェント市場には統一された分類基準が存在していません。私たちは、Web2とWeb3市場の204のAIエージェントプロジェクトにラベルを付けることによって、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。その中で、一次分類は基盤構築、コンテンツ生成、ユーザーインタラクションの三つのカテゴリーであり、実際のユースケースに基づいてさらに細分化されています。
基盤構築型:このタイプは、エージェント分野のより基盤的なコンテンツの構築に重点を置いており、プラットフォーム、モデル、データ、開発ツール、そしてより成熟した基盤アプリケーションのB2Bサービスを含みます。
開発ツール類:開発者にAIエージェントを構築するための補助ツールとフレームワークを提供します。
データ処理系:異なる形式のデータを処理・分析し、主に意思決定を支援し、トレーニングのための情報源を提供します。
モデル訓練クラス:AIに対するモデル訓練サービスを提供し、推論、モデルの構築、設定などを含みます。
B端サービス:主に企業ユーザーを対象とし、企業向けサービス、垂直型、オートメーションのソリューションを提供します。
プラットフォーム集合型:さまざまなAIエージェントサービスとツールを統合したプラットフォーム。
インタラクティブタイプ:コンテンツ生成タイプに似ていますが、持続的な双方向のインタラクションが違いです。インタラクティブエージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向のインタラクションを実現します。
感情的なサポート:感情的な支援と伴侶を提供するAIエージェント。
GPTタイプ:GPT(生成的事前学習トランスフォーマー)モデルに基づくAIエージェント。
検索系:検索機能に特化し、より正確な情報検索を主な目的とするエージェント。
コンテンツ生成タイプ:このタイプのプロジェクトはコンテンツの創造に特化しており、大規模モデル技術を利用してユーザーの指示に基づいてさまざまな形式のコンテンツを生成します。テキスト生成、画像生成、動画生成、音声生成の4つのカテゴリに分かれています。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によると、Web2の従来のインターネットにおけるAIエージェントの開発は、明らかなセクター集中の傾向を示しています。具体的には、約3分の2のプロジェクトがインフラストラクチャータイプに集中しており、主にB2Bサービスと開発ツールが多くなっています。この現象についてもいくつかの分析を行いました。
技術の成熟度の影響:インフラプロジェクトが主導的な地位を占める理由は、まずその技術の成熟度にあります。これらのプロジェクトは通常、時間をかけて検証された技術とフレームワークに基づいて構築されているため、開発の難易度とリスクが低減されます。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に堅固な基盤を提供しています。
市場需要の推進:もう一つの重要な要素は市場の需要です。消費者市場に比べて、企業市場はAI技術の需要がより切迫しています。特に運営効率の向上とコスト削減のソリューションを求めています。同時に、開発者にとって企業からのキャッシュフローは比較的安定しており、次のプロジェクトの開発に有利です。
アプリケーションシーンの制限:同時に、私たちはコンテンツ生成型AIのB2B市場におけるアプリケーションシーンが相対的に限られていることに注意しました。その生成物の不安定性のため、企業は生産性を安定的に向上させることができるアプリケーションを好みます。これにより、コンテンツ生成型AIのプロジェクトライブラリに占める割合は比較的小さくなっています。
このトレンドは、技術の成熟度、市場の需要、およびアプリケーションシナリオの実際の考慮を反映しています。AI技術の進歩と市場の需要がさらに明確になるにつれて、この構図は調整される可能性がありますが、インフラストラクチャタイプは依然としてAIエージェントの発展の堅固な基盤となるでしょう。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2のAIエージェントのリーダープロジェクト分析
私たちは現在のWeb2市場におけるAIエージェントプロジェクトについて深く探討し、Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例に分析を行います。
キャラクターAI:
製品紹介:Character.AIは、人工知能に基づく対話システムとバーチャルキャラクター作成ツールを提供しています。このプラットフォームでは、ユーザーがバーチャルキャラクターを作成、トレーニングし、自然言語での対話を行い、特定のタスクを実行することができます。
データ分析:Character.AIの5月の訪問者数は2.77億で、プラットフォームには350万人以上のデイリーアクティブユーザーがおり、その大部分は18歳から34歳の間で、若年層のユーザー層が特徴です。Character AIは資本市場で素晴らしいパフォーマンスを示し、1億5000万ドルの資金調達を完了し、評価額は10億ドルに達し、a16zが主導しました。
テクニカル分析:Character AIはGoogleの親会社であるAlphabetと、自社の大規模言語モデルを非独占的に使用するためのライセンス契約を結びました。これは、Character AIが自社開発の技術を採用していることを示しています。注目すべきは、同社の創業者Noam ShazeerとDaniel De FreitasがGoogleの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから詳細な回答を取得し提供することができます。引用と参照リンクを通じて情報の信頼性と正確性を確保し、同時にユーザーに教育を行い、追求質問やキーワード検索を導き、多様なクエリニーズを満たします。
データ分析:Perplexityの月間アクティブユーザー数は1000万人に達し、2月にはモバイルおよびデスクトップアプリケーションのアクセスが8.6%の成長を遂げ、約5000万人のユーザーを惹きつけました。資本市場では、Perplexity AIが最近6270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。リード投資家はダニエル・グロスで、参加者にはスタン・ドルケンミラーとNVIDIAが含まれています。
テクニカル分析:Perplexityが使用している主要なモデルは微調整されたGPT-3.5であり、オープンソースの大規模モデルを微調整した2つの大型モデル:pplx-7b-onlineおよびpplx-70b-onlineです。このモデルは専門的な学術研究や垂直に適しています。