DataFi: Peluang Baru di Era AI Bagaimana Web3 Memimpin Jalur Data

Melihat Potensi Perkembangan DataFi dari Jalur Data AI

Dunia saat ini berada di era persaingan global untuk membangun model dasar terbaik. Meskipun kemampuan komputasi dan arsitektur model sangat penting, namun parit sejati terletak pada data pelatihan. Artikel ini akan dimulai dengan Scale AI, membahas potensi jalur data AI.

Jalan Sukses Scale AI

Scale AI saat ini dinilai sebesar 29 miliar dolar AS, yang melayani pihak militer AS dan beberapa raksasa AI yang bersaing. Bisnis inti Scale AI adalah menyediakan data anotasi yang akurat dalam jumlah besar, dan alasan mengapa ia dapat menonjol di antara banyak unicorn adalah karena telah lebih awal menyadari pentingnya data dalam industri AI.

Kekuatan komputasi, model, dan data adalah tiga pilar utama dari model AI. Dalam proses perkembangan cepat model bahasa besar, fokus perkembangan industri telah berpindah dari model ke kekuatan komputasi. Saat ini, sebagian besar model telah menetapkan transformer sebagai kerangka model, dan para raksasa industri telah menyelesaikan masalah kekuatan komputasi dengan membangun kluster superkomputer sendiri atau menandatangani perjanjian jangka panjang dengan penyedia layanan cloud. Dalam keadaan ini, pentingnya data semakin menonjol.

Scale AI tidak hanya berfokus pada penggalian data yang ada, tetapi juga mengarahkan perhatian pada bisnis penghasil data jangka panjang. Mereka membentuk tim pelatihan AI yang terdiri dari para ahli manusia dari berbagai bidang untuk menyediakan data pelatihan yang lebih berkualitas bagi pelatihan model AI.

Dua Tahap Pelatihan Model AI

Pelatihan model AI dibagi menjadi dua bagian: pra-pelatihan dan penyetelan.

Tahap pra-pelatihan mirip dengan proses belajar berbicara manusia bayi. Kita perlu memasukkan sejumlah besar teks, kode, dan informasi lainnya yang diambil dari internet ke dalam model AI, sehingga model dapat menguasai kemampuan komunikasi dasar melalui pembelajaran mandiri.

Tahap fine-tuning mirip dengan pendidikan di sekolah, di mana ada kebenaran, jawaban, dan arah yang jelas. Melalui beberapa dataset yang telah dipersiapkan sebelumnya dan bersifat khusus, kita dapat melatih model untuk memiliki kemampuan tertentu.

Oleh karena itu, data yang diperlukan untuk pelatihan AI juga dibagi menjadi dua kategori:

  1. Data dalam jumlah besar yang tidak memerlukan banyak pengolahan, biasanya berasal dari data crawling platform UGC besar, basis data literatur publik, basis data pribadi perusahaan, dll.

  2. Data yang perlu dirancang dan dipilih dengan teliti, mirip dengan buku teks profesional, perlu dilakukan pembersihan data, pemilihan, penandaan, umpan balik manual, dan pekerjaan lainnya.

Kedua jenis dataset ini membentuk inti dari jalur data AI. Seiring dengan peningkatan kemampuan model, berbagai data pelatihan yang lebih halus dan profesional akan menjadi faktor kunci yang mempengaruhi kemampuan model.

Web3 DataFi: Tanah Subur untuk Data AI

Dibandingkan dengan metode pengolahan data tradisional, Web3 memiliki keunggulan alami di bidang data AI, yang melahirkan konsep baru DataFi. Keunggulan Web3 DataFi terutama terlihat dalam beberapa aspek berikut:

  1. Kedaulatan data, keamanan, dan privasi yang dijamin oleh kontrak pintar
  2. Keuntungan arbitrase geografis yang dihasilkan dari arsitektur terdistribusi
  3. Keuntungan insentif dan penyelesaian yang jelas dari blockchain
  4. Menguntungkan untuk membangun pasar data "one-stop" yang lebih efisien dan terbuka

Bagi pengguna biasa, DataFi adalah proyek AI terdesentralisasi yang paling mudah diikuti. Pengguna tidak perlu menandatangani kontrak yang rumit atau menginvestasikan perangkat keras yang mahal, mereka hanya perlu melakukan tugas sederhana untuk berpartisipasi, seperti menyediakan data, mengevaluasi model, dan melakukan kreasi sederhana menggunakan alat AI.

Data adalah Aset: DataFi sedang membuka lautan biru baru

Potensi Proyek DataFi Web3

Saat ini, beberapa proyek Web3 DataFi telah mendapatkan pendanaan besar, menunjukkan potensi besar di bidang ini. Berikut adalah beberapa proyek perwakilan:

  1. Sahara AI: Berkomitmen untuk membangun infrastruktur dasar dan pasar perdagangan AI terdesentralisasi.

  2. Yupp: Platform umpan balik model AI, mengumpulkan umpan balik pengguna terhadap konten keluaran model.

  3. Vana: Mengubah data pribadi pengguna menjadi aset digital yang dapat dimonetisasi.

  4. Chainbase: Fokus pada data on-chain, mencakup lebih dari 200 blockchain.

  5. Sapien: Bertujuan untuk mengubah pengetahuan manusia secara besar-besaran menjadi data pelatihan AI berkualitas tinggi.

  6. Prisma X: Berkomitmen untuk menjadi lapisan koordinasi terbuka untuk robot, pengumpulan data fisik adalah kuncinya.

  7. Masa: Proyek subnet teratas dalam ekosistem Bittensor, mengoperasikan subnet data dan subnet Agent.

  8. Irys: Fokus pada penyimpanan data dan komputasi yang dapat diprogram.

  9. ORO: Memberdayakan orang biasa untuk berpartisipasi dalam kontribusi AI.

  10. Gata: Dikenal sebagai lapisan data terdesentralisasi, menyediakan berbagai cara untuk berpartisipasi.

Data sebagai Aset: DataFi sedang membuka lautan biru baru

Pemikiran tentang proyek saat ini

Saat ini, hambatan dari proyek-proyek ini umumnya tidak tinggi, tetapi setelah mengumpulkan pengguna dan daya tarik ekosistem, keuntungan platform akan terakumulasi dengan cepat. Oleh karena itu, proyek-proyek awal harus fokus pada insentif dan pengalaman pengguna.

Pada saat yang sama, platform data ini juga perlu mempertimbangkan bagaimana mengelola tenaga kerja, memastikan kualitas data yang dihasilkan, dan menghindari fenomena di mana uang yang buruk mengusir uang yang baik. Beberapa proyek seperti Sahara dan Sapien telah mulai memperkuat manajemen dalam hal kualitas data.

Selain itu, meningkatkan transparansi juga merupakan masalah penting yang dihadapi proyek-proyek di blockchain saat ini. Banyak proyek masih kekurangan data yang cukup terbuka dan dapat dilacak, yang tidak menguntungkan bagi perkembangan jangka panjang Web3 DataFi.

Akhirnya, penerapan besar-besaran DataFi perlu menarik cukup banyak peserta individu dan mendapatkan pengakuan dari perusahaan-perusahaan besar. Beberapa proyek seperti Sahara AI dan Vana telah mencapai kemajuan yang baik dalam hal ini.

DataFi mewakili hubungan simbiosis jangka panjang antara kecerdasan manusia dan kecerdasan mesin. Bagi mereka yang penuh harapan dan kekhawatiran terhadap era AI, berpartisipasi dalam DataFi adalah pilihan yang baik untuk mengikuti arus.

Data adalah Aset: DataFi sedang membuka Laut Biru Baru

SAHARA4.77%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 4
  • Bagikan
Komentar
0/400
ReverseFOMOguyvip
· 4jam yang lalu
Mulai lagi membicarakan DataFi
Lihat AsliBalas0
CryptoCross-TalkClubvip
· 4jam yang lalu
Ah ha, akhirnya mulai bermain orang-orang yang tertipu AI, terakhir Metaverse, sekarang datang cerita baru lagi.
Lihat AsliBalas0
ParanoiaKingvip
· 4jam yang lalu
Data pelatihan juga bisa digulung?
Lihat AsliBalas0
BTCRetirementFundvip
· 4jam yang lalu
290 miliar, Dianggap Bodoh ya...
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)