Xu hướng phát triển mới của chỉ mục dữ liệu Web3: AI nâng cao dịch vụ dữ liệu toàn chuỗi

Từ nguồn dữ liệu đến phân tích thông minh: Phân tích sự phát triển của lĩnh vực chỉ mục dữ liệu Web3

1. Giới thiệu

Kể từ khi các ứng dụng phi tập trung đầu tiên ra đời vào năm 2017, hệ sinh thái blockchain đã phát triển mạnh mẽ, các loại dApp xuất hiện như nấm sau mưa. Khi thảo luận về những ứng dụng phi tập trung này, liệu chúng ta có bao giờ suy nghĩ về nguồn dữ liệu mà chúng phụ thuộc vào?

Năm 2024, trí tuệ nhân tạo và Web3 trở thành những chủ đề nóng. Trong lĩnh vực AI, dữ liệu giống như nguồn sống, thúc đẩy sự tiến hóa liên tục của các hệ thống thông minh. Cũng như thực vật cần ánh sáng mặt trời và độ ẩm, các hệ thống AI cũng phụ thuộc vào lượng dữ liệu khổng lồ để học hỏi và suy nghĩ. Nếu không có sự hỗ trợ của dữ liệu, ngay cả những thuật toán AI tiên tiến nhất cũng khó có thể phát huy tiềm năng của mình.

Bài viết này sẽ đi sâu vào việc khám phá quá trình phát triển của khả năng truy cập dữ liệu blockchain, so sánh sự khác biệt và tương đồng giữa giao thức chỉ mục dữ liệu truyền thống và dịch vụ dữ liệu blockchain mới nổi, đặc biệt chú trọng vào những đổi mới trong dịch vụ dữ liệu và kiến trúc sản phẩm của các giao thức mới kết hợp công nghệ AI.

Đọc, chỉ mục đến phân tích, tóm tắt lĩnh vực chỉ mục dữ liệu Web3

2. Sự tiến hóa của chỉ mục dữ liệu: từ nút blockchain đến cơ sở dữ liệu toàn chuỗi

2.1 Nguồn dữ liệu: nút blockchain

Blockchain được gọi là sổ cái phi tập trung, và các nút blockchain là nền tảng của mạng lưới này, có trách nhiệm ghi chép, lưu trữ và truyền bá dữ liệu giao dịch trên chuỗi. Mỗi nút lưu giữ một bản sao đầy đủ của dữ liệu blockchain, đảm bảo đặc tính phi tập trung của mạng lưới. Tuy nhiên, đối với người dùng thông thường, việc tự xây dựng và duy trì nút không chỉ có ngưỡng kỹ thuật cao mà còn phải chịu chi phí phần cứng và băng thông đắt đỏ. Hơn nữa, khả năng truy vấn của nút thông thường có hạn, khó đáp ứng nhu cầu của các nhà phát triển. Vì vậy, mặc dù lý thuyết ai cũng có thể vận hành nút, thực tế người dùng thường có xu hướng dựa vào dịch vụ bên thứ ba.

Để giải quyết vấn đề này, các nhà cung cấp nút RPC đã ra đời. Họ đảm nhận chi phí quản lý nút và cung cấp dịch vụ truy cập dữ liệu thông qua các điểm cuối RPC. Các điểm cuối RPC công cộng miễn phí nhưng có giới hạn tốc độ, có thể ảnh hưởng đến trải nghiệm người dùng dApp. Các điểm cuối RPC riêng hoạt động tốt hơn, nhưng hiệu suất không cao đối với các truy vấn phức tạp và khó mở rộng qua các mạng khác nhau. Tuy nhiên, giao diện API chuẩn hóa của các nhà cung cấp nút đã giảm bớt rào cản cho người dùng truy cập dữ liệu trên chuỗi, tạo nền tảng cho việc phân tích dữ liệu và ứng dụng sau này.

2.2 Phân tích dữ liệu: Từ dữ liệu thô đến thông tin có thể sử dụng

Dữ liệu gốc do nút blockchain cung cấp thường được mã hóa và xử lý, điều này mặc dù đảm bảo tính toàn vẹn và an toàn của dữ liệu, nhưng cũng làm tăng độ khó trong việc phân tích. Đối với người dùng thông thường và các nhà phát triển, việc xử lý trực tiếp những dữ liệu này yêu cầu nhiều kiến thức kỹ thuật và tài nguyên tính toán.

Quá trình phân tích dữ liệu trở nên đặc biệt quan trọng trong bối cảnh này. Bằng cách chuyển đổi các dữ liệu thô phức tạp thành định dạng dễ hiểu và thao tác, người dùng có thể sử dụng thông tin này một cách trực quan hơn. Chất lượng phân tích ảnh hưởng trực tiếp đến hiệu quả và hiệu suất của ứng dụng dữ liệu blockchain, là khâu then chốt trong toàn bộ quy trình chỉ mục dữ liệu.

2.3 Sự phát triển của bộ chỉ mục dữ liệu

Với sự bùng nổ dữ liệu blockchain, nhu cầu về bộ chỉ mục ngày càng tăng. Bộ chỉ mục có trách nhiệm tổ chức dữ liệu trên chuỗi và nhập nó vào cơ sở dữ liệu để truy vấn. Chúng lập chỉ mục dữ liệu blockchain và cung cấp giao diện API như ngôn ngữ truy vấn tương tự SQL ( như GraphQL ), giúp dữ liệu luôn sẵn có. Bộ chỉ mục cung cấp cho các nhà phát triển một giao diện truy vấn thống nhất, đơn giản hóa đáng kể quy trình truy xuất dữ liệu.

Các loại bộ chỉ mục khác nhau có những lợi thế riêng:

  1. Bộ chỉ mục nút hoàn chỉnh: Trực tiếp lấy dữ liệu từ nút hoàn chỉnh, đảm bảo tính toàn vẹn dữ liệu, nhưng cần nhiều lưu trữ và khả năng xử lý.
  2. Bộ chỉ mục nhẹ: dựa vào nút đầy đủ để lấy dữ liệu cụ thể, giảm nhu cầu lưu trữ nhưng có thể tăng thời gian truy vấn.
  3. Bộ chỉ mục chuyên dụng: Tối ưu hóa cho loại dữ liệu hoặc blockchain cụ thể, chẳng hạn như dữ liệu NFT hoặc giao dịch DeFi.
  4. Trình lập chỉ mục tổng hợp: Trích xuất dữ liệu từ nhiều blockchain và nguồn, bao gồm thông tin ngoại tuyến, cung cấp giao diện truy vấn thống nhất, phù hợp cho dApp đa chuỗi.

Hiện tại, node lưu trữ Ethereum trên các client khác nhau chiếm dung lượng từ 3TB đến 13.5TB. Đối mặt với khối lượng dữ liệu khổng lồ như vậy, các giao thức lập chỉ mục chính không chỉ hỗ trợ lập chỉ mục đa chuỗi mà còn tùy chỉnh khung phân tích dữ liệu cho các nhu cầu ứng dụng khác nhau, chẳng hạn như khung "subgraph" của The Graph.

Sự xuất hiện của bộ chỉ mục đã nâng cao đáng kể hiệu suất chỉ mục và truy vấn dữ liệu. So với các điểm cuối RPC truyền thống, bộ chỉ mục có thể xử lý hiệu quả một lượng lớn dữ liệu, hỗ trợ các truy vấn phức tạp và lọc dữ liệu. Một số bộ chỉ mục còn hỗ trợ tổng hợp dữ liệu từ nhiều blockchain, tránh vấn đề cần triển khai nhiều API cho dApp đa chuỗi. Thông qua việc vận hành phân tán, bộ chỉ mục cung cấp độ an toàn và hiệu suất mạnh mẽ hơn, giảm thiểu rủi ro gián đoạn có thể xảy ra do các nhà cung cấp RPC tập trung.

Đọc, chỉ mục đến phân tích, tóm tắt lĩnh vực chỉ mục dữ liệu Web3

2.4 Cơ sở dữ liệu toàn chuỗi: Điều chỉnh ưu tiên theo dòng chảy

Khi nhu cầu ứng dụng ngày càng phức tạp, các chỉ mục dữ liệu sơ cấp và định dạng tiêu chuẩn của chúng khó có thể đáp ứng các nhu cầu tìm kiếm đa dạng, chẳng hạn như tìm kiếm, truy cập chuỗi chéo hoặc ánh xạ dữ liệu ngoài chuỗi. Các nhà cung cấp dịch vụ dữ liệu blockchain đang phát triển theo hướng xây dựng dòng dữ liệu để đáp ứng nhu cầu phân tích thời gian thực và truy vấn toàn diện.

Các nhà cung cấp dịch vụ chỉ mục truyền thống đồng loạt ra mắt sản phẩm luồng dữ liệu, như Substreams của The Graph và Mirror của Goldsky. Đồng thời, các dịch vụ mới nổi như Chainbase và SubSquid cũng cung cấp hồ dữ liệu thời gian thực được tạo ra từ blockchain. Những dịch vụ này nhằm hỗ trợ sự phát triển của các ứng dụng thông qua các nguồn dữ liệu tiên tiến hơn và hỗ trợ phân tích dữ liệu trên chuỗi.

Xem xét dữ liệu trên chuỗi từ góc độ của các kênh dữ liệu hiện đại, chúng ta có thể tưởng tượng một tương lai nơi có thể tùy chỉnh các tập dữ liệu hiệu suất cao cho bất kỳ trường hợp sử dụng nào.

3. Sự kết hợp giữa AI và cơ sở dữ liệu: Phân tích so sánh The Graph, Chainbase và Space and Time

3.1 Biểu đồ

Mạng The Graph cung cấp dịch vụ chỉ mục và truy vấn dữ liệu đa chuỗi qua các nút phi tập trung, giúp các nhà phát triển xây dựng ứng dụng phi tập trung. Mô hình sản phẩm cốt lõi của nó bao gồm thị trường thực thi truy vấn dữ liệu và thị trường bộ nhớ đệm chỉ mục dữ liệu, phục vụ nhu cầu truy vấn của người dùng.

Mạng lưới được cấu thành từ bốn vai trò: chỉ mục, người tổ chức, người ủy quyền và nhà phát triển, đảm bảo hệ thống hoạt động thông qua các động lực kinh tế. Chỉ mục cung cấp dịch vụ chỉ mục và truy vấn, người ủy quyền hỗ trợ hoạt động của các nút chỉ mục, người tổ chức lọc các đồ thị con có giá trị, còn nhà phát triển là người sử dụng chính.

Hệ sinh thái The Graph đang tích cực áp dụng công nghệ AI. Các công cụ như AutoAgora, Allocation Optimizer và AgentC do Semiotic Labs phát triển đã tối ưu hóa giá cả chỉ mục, phân bổ tài nguyên và trải nghiệm truy vấn của người dùng, nâng cao tính thông minh và sự thân thiện với người dùng của hệ thống.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

3.2 Chainbase

Chainbase là mạng dữ liệu toàn chuỗi, tích hợp dữ liệu của các blockchain, đơn giản hóa quá trình xây dựng và duy trì ứng dụng cho các nhà phát triển. Các chức năng nổi bật của nó bao gồm:

  • Hồ dữ liệu thời gian thực: Cung cấp luồng dữ liệu blockchain truy cập ngay lập tức.
  • Kiến trúc hai chuỗi: Xây dựng lớp thực thi dựa trên Eigenlayer AVS, song song với thuật toán đồng thuận CometBFT, tăng cường khả năng xử lý dữ liệu đa chuỗi.
  • Định dạng dữ liệu đổi mới: Giới thiệu tiêu chuẩn "manuscripts", tối ưu hóa cấu trúc dữ liệu trong ngành công nghiệp tiền mã hóa.
  • Mô hình thế giới mã hóa: Kết hợp công nghệ AI, tạo ra mô hình có thể hiểu và dự đoán các giao dịch blockchain, như phiên bản cơ bản Theia.

Mô hình AI Theia của Chainbase dựa trên mô hình DORA của NVIDIA, kết hợp phân tích dữ liệu bên ngoài chuỗi theo mô hình mã hóa, thông qua suy diễn nguyên nhân để phản ứng, khai thác sâu giá trị dữ liệu trên chuỗi, cung cấp dịch vụ dữ liệu thông minh.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

3.3 Không gian và Thời gian

Space and Time (SxT) cam kết xây dựng một lớp tính toán có thể xác minh, mở rộng bằng chứng không tri thức trên kho dữ liệu phi tập trung, cung cấp xử lý dữ liệu đáng tin cậy cho hợp đồng thông minh, mô hình ngôn ngữ lớn và doanh nghiệp.

SxT đã giới thiệu công nghệ Proof of SQL đổi mới, đây là một công nghệ chứng minh không biết, đảm bảo rằng kết quả của các truy vấn SQL được thực hiện trên kho dữ liệu phi tập trung có thể xác minh và không bị giả mạo. Khác với các mạng blockchain truyền thống dựa vào cơ chế đồng thuận, SxT thu thập dữ liệu từ một nút, các nút khác sử dụng công nghệ zk để xác minh tính xác thực của dữ liệu, nâng cao hiệu suất của hệ thống.

SxT hợp tác với phòng thí nghiệm AI của Microsoft, phát triển công cụ AI sinh ra, đơn giản hóa quá trình người dùng xử lý dữ liệu blockchain thông qua ngôn ngữ tự nhiên. Trong Space and Time Studio, người dùng có thể nhập truy vấn bằng ngôn ngữ tự nhiên, AI tự động chuyển đổi thành SQL và thực hiện, trình bày kết quả cuối cùng.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

Kết luận và triển vọng

Công nghệ chỉ mục dữ liệu blockchain đã trải qua một quá trình phát triển từ nguồn dữ liệu nút ban đầu, qua sự phát triển của phân tích dữ liệu và chỉ mục, cuối cùng tiến hóa thành dịch vụ dữ liệu toàn chuỗi được AI hỗ trợ, với những cải tiến dần dần. Những tiến bộ này không chỉ nâng cao hiệu quả và độ chính xác của việc truy cập dữ liệu, mà còn mang lại cho người dùng trải nghiệm thông minh.

Trong tương lai, với sự phát triển của công nghệ AI và các công nghệ mới như chứng minh không kiến thức, dịch vụ dữ liệu blockchain sẽ ngày càng thông minh và an toàn hơn. Là một cơ sở hạ tầng, dịch vụ dữ liệu blockchain sẽ tiếp tục đóng vai trò quan trọng trong sự đổi mới của ngành.

Đọc, chỉ mục đến phân tích, tóm tắt lĩnh vực chỉ mục dữ liệu Web3

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
VCsSuckMyLiquidityvip
· 5giờ trước
Lại đang vẽ BTC, dữ liệu là dữ liệu tốt.
Xem bản gốcTrả lời0
TokenTaxonomistvip
· 5giờ trước
*điều chỉnh kính bảng tính*

nói một cách thống kê, 94.3% trong số những hybrid ai-web3 này chỉ là những ngõ cụt tiến hóa
Xem bản gốcTrả lời0
PaperHandSistervip
· 5giờ trước
Cá và tay gấu không thể có cả hai! AI không thể chơi với dữ liệu, tôi đã mua ở đỉnh rồi.
Xem bản gốcTrả lời0
MoonBoi42vip
· 5giờ trước
Dữ liệu tốt, trước tiên hãy làm AI rồi nói tiếp.
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)