Los datos son activos: DataFi está abriendo un nuevo mar azul
Este mes, el tema más grande en el círculo de IA es la contratación masiva de talento por parte de Meta, que ha formado un lujoso equipo de IA compuesto principalmente por investigadores chinos. El líder es Alexander Wang, de solo 28 años, quien fundó Scale AI. Actualmente, Scale AI tiene una valoración de 29 mil millones de dólares y proporciona servicios de datos a varias grandes empresas de IA, incluidas las fuerzas armadas de EE. UU., OpenAI, Anthropic y Meta, siendo su negocio principal la provisión de grandes cantidades de datos de etiquetado precisos.
Scale AI se destaca entre numerosos unicornios porque reconoció temprano la posición clave de los datos en la industria de la IA. La potencia de cálculo, los modelos y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, el modelo sería el cuerpo, la potencia de cálculo sería la comida, y los datos serían el conocimiento y la información.
En el rápido desarrollo de los modelos de lenguaje grande, el enfoque de la industria ha cambiado de los modelos a la potencia de cómputo. Hoy en día, la mayoría de los modelos utilizan transformers como marco básico, y a veces hay innovaciones como MoE o MoRe; las grandes empresas o construyen sus propios clústeres de supercomputación o firman acuerdos a largo plazo con proveedores de servicios en la nube para resolver problemas de potencia de cómputo. Sobre esta base, la importancia de los datos se ha vuelto cada vez más evidente.
Scale AI se centra en construir una sólida base de datos para modelos de IA, y su negocio no solo incluye la extracción de datos existentes, sino también la generación de datos. La empresa también ha formado un equipo de entrenamiento de IA compuesto por expertos de diferentes campos para proporcionar datos de entrenamiento de alta calidad a los modelos de IA.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. El preentrenamiento es similar al proceso de aprendizaje del habla de un bebé, que requiere una gran cantidad de información como textos y códigos extraídos de la web. El ajuste fino es similar a la educación escolar, con un objetivo y dirección claros, y se cultivan las capacidades específicas del modelo a través de conjuntos de datos cuidadosamente diseñados.
Por lo tanto, la pista de datos de IA incluye principalmente dos tipos de conjuntos de datos: uno es una gran cantidad de datos que no requieren demasiados procesamientos, que generalmente provienen de plataformas UGC como Reddit, Twitter, Github, bases de datos de literatura pública o bases de datos privadas de empresas; el otro necesita un diseño y selección cuidadosos, asegurando que pueda cultivar habilidades específicas del modelo, requiriendo trabajos de limpieza de datos, selección, anotación y retroalimentación manual.
A medida que las capacidades del modelo continúan mejorando, diversos conjuntos de datos de entrenamiento más finos y especializados se convertirán en factores clave que determinan la capacidad del modelo. A largo plazo, los datos de IA también representan una pista de largo plazo con un efecto bola de nieve; a medida que se acumulan los trabajos iniciales, los activos de datos tendrán la capacidad de generar intereses compuestos, aumentando continuamente su valor.
Web3 DataFi: La tierra prometida de datos AI
En comparación con los equipos de etiquetado humano a distancia de cientos de miles de personas que ha formado cierta empresa en varios países, Web3 tiene una ventaja natural en el campo de los datos de IA, lo que ha dado lugar al nuevo concepto de DataFi. Idealmente, las ventajas de Web3 DataFi incluyen:
La soberanía de los datos, la seguridad y la privacidad garantizadas por contratos inteligentes
Ventajas naturales de arbitraje geográfico: una arquitectura distribuida libre que atrae a la mano de obra más adecuada.
Ventajas claras de incentivos y liquidación en blockchain
Contribuye a construir un mercado de datos "todo en uno" más eficiente y abierto.
Para los usuarios comunes, DataFi también es el proyecto de IA descentralizada más fácil de participar. Los usuarios solo necesitan realizar operaciones sencillas para involucrarse, incluyendo proporcionar datos, evaluar modelos, utilizar herramientas de IA para creaciones simples o participar en el intercambio de datos.
Proyectos potenciales de Web3 DataFi
Actualmente, varios proyectos de DataFi han obtenido financiamiento significativo. A continuación se presentan algunos proyectos representativos:
Sahara AI: Se dedica a construir una superestructura y un mercado de intercambio de IA descentralizada.
Yupp: Plataforma de retroalimentación de modelos de IA, recopila comentarios de los usuarios sobre la salida del modelo.
Vana: Convierte los datos personales de los usuarios en activos digitales monetizables.
Chainbase: se centra en los datos en cadena, cubriendo más de 200 cadenas de bloques.
Sapien: diseñado para transformar el conocimiento humano en datos de entrenamiento de IA de alta calidad a gran escala.
Prisma X: dedicado a convertirse en la capa de coordinación abierta para robots.
Masa: Uno de los principales proyectos de subred en el ecosistema Bittensor.
Irys: enfocado en el almacenamiento de datos programables y el cálculo.
ORO: Empoderar a las personas comunes para participar en la contribución de la IA.
Gata: Posicionado como una capa de datos descentralizada.
Estos proyectos actualmente tienen barreras generalmente bajas, pero una vez que acumulan usuarios y adhesión ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, los proyectos tempranos deben centrarse en los incentivos y la experiencia del usuario. Al mismo tiempo, estas plataformas también necesitan considerar cómo gestionar a los participantes y garantizar la calidad de los datos, evitando la situación de "la mala moneda desplaza a la buena".
Además, aumentar la transparencia es también un gran desafío que enfrentan los proyectos en la cadena actualmente. Muchos proyectos aún carecen de datos suficientes que sean públicos y rastreables, lo cual es perjudicial para el desarrollo saludable a largo plazo de Web3 DataFi.
El camino de la aplicación masiva de DataFi se puede dividir en dos partes: primero, atraer a suficientes usuarios individuales para participar, formando un ejército de recolección/generación de datos y consumidores de la economía de IA; segundo, obtener el reconocimiento de las empresas principales, ya que a corto plazo son la principal fuente de grandes contratos de datos.
DataFi representa la crianza a largo plazo de la inteligencia artificial por parte de la inteligencia humana, al mismo tiempo que garantiza los beneficios del trabajo humano a través de contratos inteligentes, logrando finalmente que la inteligencia artificial devuelva algo a la humanidad. Para aquellos que se sienten inseguros sobre la era de la IA, o que todavía tienen ideales de blockchain, participar en DataFi puede ser una elección acertada.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
21 me gusta
Recompensa
21
6
Compartir
Comentar
0/400
DogeBachelor
· hace4h
Otra vez un SaaS que toma a la gente por tonta, ya estoy cansado de esto.
Ver originalesResponder0
NFTRegretful
· hace7h
ai aún se ha puesto a trabajar en los datos, otra ronda de tomar a la gente por tonta
Ver originalesResponder0
AirdropNinja
· 08-01 05:45
Otra buena oportunidad para Ser engañados, jeje.
Ver originalesResponder0
LoneValidator
· 08-01 05:42
Realmente tiene dinero, a los 28 años ya tiene 290 mil millones.
Ver originalesResponder0
quiet_lurker
· 08-01 05:40
¿Los datos de la marca valen 29 mil millones? Este dinero es demasiado fácil de ganar.
Ver originalesResponder0
NotSatoshi
· 08-01 05:22
Si al menos la mitad de la gente estuviera despierta, sería genial~
DataFi: un nuevo océano azul en la economía de datos de IA en el ámbito de Web3
Los datos son activos: DataFi está abriendo un nuevo mar azul
Este mes, el tema más grande en el círculo de IA es la contratación masiva de talento por parte de Meta, que ha formado un lujoso equipo de IA compuesto principalmente por investigadores chinos. El líder es Alexander Wang, de solo 28 años, quien fundó Scale AI. Actualmente, Scale AI tiene una valoración de 29 mil millones de dólares y proporciona servicios de datos a varias grandes empresas de IA, incluidas las fuerzas armadas de EE. UU., OpenAI, Anthropic y Meta, siendo su negocio principal la provisión de grandes cantidades de datos de etiquetado precisos.
Scale AI se destaca entre numerosos unicornios porque reconoció temprano la posición clave de los datos en la industria de la IA. La potencia de cálculo, los modelos y los datos son los tres pilares de los modelos de IA. Si comparamos un gran modelo con una persona, el modelo sería el cuerpo, la potencia de cálculo sería la comida, y los datos serían el conocimiento y la información.
En el rápido desarrollo de los modelos de lenguaje grande, el enfoque de la industria ha cambiado de los modelos a la potencia de cómputo. Hoy en día, la mayoría de los modelos utilizan transformers como marco básico, y a veces hay innovaciones como MoE o MoRe; las grandes empresas o construyen sus propios clústeres de supercomputación o firman acuerdos a largo plazo con proveedores de servicios en la nube para resolver problemas de potencia de cómputo. Sobre esta base, la importancia de los datos se ha vuelto cada vez más evidente.
Scale AI se centra en construir una sólida base de datos para modelos de IA, y su negocio no solo incluye la extracción de datos existentes, sino también la generación de datos. La empresa también ha formado un equipo de entrenamiento de IA compuesto por expertos de diferentes campos para proporcionar datos de entrenamiento de alta calidad a los modelos de IA.
El entrenamiento del modelo se divide en dos etapas: preentrenamiento y ajuste fino. El preentrenamiento es similar al proceso de aprendizaje del habla de un bebé, que requiere una gran cantidad de información como textos y códigos extraídos de la web. El ajuste fino es similar a la educación escolar, con un objetivo y dirección claros, y se cultivan las capacidades específicas del modelo a través de conjuntos de datos cuidadosamente diseñados.
Por lo tanto, la pista de datos de IA incluye principalmente dos tipos de conjuntos de datos: uno es una gran cantidad de datos que no requieren demasiados procesamientos, que generalmente provienen de plataformas UGC como Reddit, Twitter, Github, bases de datos de literatura pública o bases de datos privadas de empresas; el otro necesita un diseño y selección cuidadosos, asegurando que pueda cultivar habilidades específicas del modelo, requiriendo trabajos de limpieza de datos, selección, anotación y retroalimentación manual.
A medida que las capacidades del modelo continúan mejorando, diversos conjuntos de datos de entrenamiento más finos y especializados se convertirán en factores clave que determinan la capacidad del modelo. A largo plazo, los datos de IA también representan una pista de largo plazo con un efecto bola de nieve; a medida que se acumulan los trabajos iniciales, los activos de datos tendrán la capacidad de generar intereses compuestos, aumentando continuamente su valor.
Web3 DataFi: La tierra prometida de datos AI
En comparación con los equipos de etiquetado humano a distancia de cientos de miles de personas que ha formado cierta empresa en varios países, Web3 tiene una ventaja natural en el campo de los datos de IA, lo que ha dado lugar al nuevo concepto de DataFi. Idealmente, las ventajas de Web3 DataFi incluyen:
Para los usuarios comunes, DataFi también es el proyecto de IA descentralizada más fácil de participar. Los usuarios solo necesitan realizar operaciones sencillas para involucrarse, incluyendo proporcionar datos, evaluar modelos, utilizar herramientas de IA para creaciones simples o participar en el intercambio de datos.
Proyectos potenciales de Web3 DataFi
Actualmente, varios proyectos de DataFi han obtenido financiamiento significativo. A continuación se presentan algunos proyectos representativos:
Sahara AI: Se dedica a construir una superestructura y un mercado de intercambio de IA descentralizada.
Yupp: Plataforma de retroalimentación de modelos de IA, recopila comentarios de los usuarios sobre la salida del modelo.
Vana: Convierte los datos personales de los usuarios en activos digitales monetizables.
Chainbase: se centra en los datos en cadena, cubriendo más de 200 cadenas de bloques.
Sapien: diseñado para transformar el conocimiento humano en datos de entrenamiento de IA de alta calidad a gran escala.
Prisma X: dedicado a convertirse en la capa de coordinación abierta para robots.
Masa: Uno de los principales proyectos de subred en el ecosistema Bittensor.
Irys: enfocado en el almacenamiento de datos programables y el cálculo.
ORO: Empoderar a las personas comunes para participar en la contribución de la IA.
Gata: Posicionado como una capa de datos descentralizada.
Estos proyectos actualmente tienen barreras generalmente bajas, pero una vez que acumulan usuarios y adhesión ecológica, las ventajas de la plataforma se acumularán rápidamente. Por lo tanto, los proyectos tempranos deben centrarse en los incentivos y la experiencia del usuario. Al mismo tiempo, estas plataformas también necesitan considerar cómo gestionar a los participantes y garantizar la calidad de los datos, evitando la situación de "la mala moneda desplaza a la buena".
Además, aumentar la transparencia es también un gran desafío que enfrentan los proyectos en la cadena actualmente. Muchos proyectos aún carecen de datos suficientes que sean públicos y rastreables, lo cual es perjudicial para el desarrollo saludable a largo plazo de Web3 DataFi.
El camino de la aplicación masiva de DataFi se puede dividir en dos partes: primero, atraer a suficientes usuarios individuales para participar, formando un ejército de recolección/generación de datos y consumidores de la economía de IA; segundo, obtener el reconocimiento de las empresas principales, ya que a corto plazo son la principal fuente de grandes contratos de datos.
DataFi representa la crianza a largo plazo de la inteligencia artificial por parte de la inteligencia humana, al mismo tiempo que garantiza los beneficios del trabajo humano a través de contratos inteligentes, logrando finalmente que la inteligencia artificial devuelva algo a la humanidad. Para aquellos que se sienten inseguros sobre la era de la IA, o que todavía tienen ideales de blockchain, participar en DataFi puede ser una elección acertada.