A partir da pista de dados de IA, veja o potencial de desenvolvimento do DataFi
O mundo atual está em uma era de competição global para construir os melhores modelos fundamentais. Embora a capacidade de computação e a arquitetura do modelo sejam importantes, a verdadeira barreira de entrada é os dados de treinamento. Este artigo começará com a Scale AI e explorará o potencial da pista de dados de IA.
O caminho para o sucesso da Scale AI
A Scale AI está atualmente avaliada em 29 bilhões de dólares, atendendo ao exército dos EUA e a várias grandes empresas de IA que são concorrentes. O core business da Scale AI é fornecer grandes quantidades de dados rotulados com precisão, e a razão pela qual conseguiu se destacar entre tantas unicórnios é que identificou cedo a importância dos dados na indústria de IA.
A capacidade computacional, o modelo e os dados são os três pilares dos modelos de IA. Durante o rápido desenvolvimento dos grandes modelos de linguagem, o foco do setor passou de modelos para capacidade computacional. Hoje em dia, a maioria dos modelos estabeleceu o transformer como estrutura de modelo, e as grandes empresas resolveram o problema da capacidade computacional construindo seus próprios supercomputadores ou assinando acordos de longo prazo com provedores de serviços em nuvem. Nesse contexto, a importância dos dados tornou-se cada vez mais evidente.
A Scale AI não se dedica apenas a extrair dados existentes, mas também dirige o seu olhar para um negócio de geração de dados a longo prazo. Ela forma equipas de treinamento de IA compostas por especialistas humanos de diferentes áreas, para fornecer dados de treinamento de maior qualidade para o treinamento de modelos de IA.
Duas fases do treinamento de modelos de IA
O treinamento do modelo de IA é dividido em duas partes: pré-treinamento e ajuste fino.
A fase de pré-treinamento é semelhante ao processo de aprendizagem da fala das crianças humanas. Precisamos fornecer ao modelo de IA uma grande quantidade de textos, códigos e outras informações extraídas da internet, para que o modelo aprenda, através da autoaprendizagem, a dominar as habilidades básicas de comunicação.
A fase de ajuste fino é semelhante à educação escolar, com respostas e direções claras. Através de conjuntos de dados específicos e previamente processados, podemos treinar o modelo para ter capacidades específicas.
Portanto, os dados necessários para o treinamento de IA também são divididos em duas categorias:
Grandes volumes de dados que não requerem muito tratamento, geralmente provenientes de dados de rastreamento de grandes plataformas UGC, bancos de dados de literatura pública, bancos de dados privados de empresas, etc.
Necessita de dados com um design e seleção refinados, semelhantes a manuais profissionais, requerendo trabalho de limpeza de dados, seleção, rotulagem, feedback humano, entre outros.
Esses dois tipos de conjuntos de dados constituem o corpo principal da pista de dados de IA. À medida que a capacidade do modelo continua a melhorar, vários dados de treinamento mais detalhados e especializados se tornarão fatores-chave que influenciam a capacidade do modelo.
Web3 DataFi: O solo ideal para dados de IA
Comparado aos métodos tradicionais de processamento de dados, o Web3 tem uma vantagem natural no campo dos dados de IA, dando origem ao novo conceito de DataFi. As vantagens do Web3 DataFi manifestam-se principalmente nos seguintes aspectos:
A soberania dos dados, segurança e privacidade garantidas por contratos inteligentes
Vantagens de arbitragem geográfica proporcionadas pela arquitetura distribuída
Vantagens claras de incentivo e liquidação da blockchain
Contribui para a construção de um mercado de dados "one-stop" mais eficiente e aberto.
Para os utilizadores comuns, o DataFi é o projeto de IA descentralizado mais fácil de participar. Os utilizadores não precisam de assinar contratos complexos ou investir em hardware caro, basta que participem através de tarefas simples, como fornecer dados, avaliar modelos, ou realizar criações simples utilizando ferramentas de IA.
O potencial dos projetos DataFi em Web3
Atualmente, vários projetos Web3 DataFi obtiveram grandes financiamentos, mostrando o enorme potencial deste campo. Aqui estão alguns projetos representativos:
Sahara AI: dedicado a construir uma super infraestrutura e mercado de negociação de IA descentralizada.
Yupp: Plataforma de feedback do modelo de IA, que recolhe as opiniões dos utilizadores sobre o conteúdo gerado pelo modelo.
Vana: Transformar os dados pessoais dos usuários em ativos digitais monetizáveis.
Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains.
Sapien: Destina-se a transformar o conhecimento humano em dados de treino de IA de alta qualidade em grande escala.
Prisma X: dedicado a se tornar a camada de coordenação aberta para robôs, a coleta de dados físicos é a sua chave.
Masa: o principal projeto da sub-rede do ecossistema Bittensor, operando a sub-rede de dados e a sub-rede de Agentes.
Irys: Focado em armazenamento e computação de dados programáveis.
ORO: Capacitar pessoas comuns a participar na contribuição de IA.
Gata: posicionada como uma camada de dados descentralizada, oferece várias formas de participação.
Reflexões sobre o projeto atual
Atualmente, as barreiras para esses projetos não são muito altas, mas uma vez que acumulem usuários e adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Portanto, os projetos iniciais devem focar em incentivos e na experiência do usuário.
Ao mesmo tempo, essas plataformas de dados também precisam considerar como gerenciar a mão de obra e garantir a qualidade da produção de dados, evitando a ocorrência do fenômeno da "mau dinheiro expelindo bom dinheiro". Alguns projetos, como Sahara e Sapien, já começaram a reforçar a gestão da qualidade dos dados.
Além disso, aumentar a transparência é também um problema importante que os projetos on-chain enfrentam atualmente. Muitos projetos ainda carecem de dados públicos e rastreáveis suficientes, o que é prejudicial para o desenvolvimento saudável a longo prazo do Web3 DataFi.
Por fim, a aplicação em larga escala do DataFi precisa atrair um número suficiente de participantes individuais e obter o reconhecimento de empresas mainstream. Alguns projetos como Sahara AI e Vana já fizeram progressos consideráveis nesse sentido.
DataFi representa a relação de coexistência a longo prazo entre a inteligência humana e a inteligência das máquinas. Para aqueles que estão ansiosos e preocupados com a era da IA, participar do DataFi é uma boa escolha que se alinha com as tendências.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
14 gostos
Recompensa
14
4
Partilhar
Comentar
0/400
ReverseFOMOguy
· 3h atrás
Já estão a falar de DataFi novamente.
Ver originalResponder0
CryptoCross-TalkClub
· 3h atrás
Ahá, finalmente começou a fazer as pessoas de parvas com IA, da última vez foi no Metaverso, desta vez vem uma nova história.
DataFi: Novas oportunidades na era da IA como o Web3 lidera o setor de dados
A partir da pista de dados de IA, veja o potencial de desenvolvimento do DataFi
O mundo atual está em uma era de competição global para construir os melhores modelos fundamentais. Embora a capacidade de computação e a arquitetura do modelo sejam importantes, a verdadeira barreira de entrada é os dados de treinamento. Este artigo começará com a Scale AI e explorará o potencial da pista de dados de IA.
O caminho para o sucesso da Scale AI
A Scale AI está atualmente avaliada em 29 bilhões de dólares, atendendo ao exército dos EUA e a várias grandes empresas de IA que são concorrentes. O core business da Scale AI é fornecer grandes quantidades de dados rotulados com precisão, e a razão pela qual conseguiu se destacar entre tantas unicórnios é que identificou cedo a importância dos dados na indústria de IA.
A capacidade computacional, o modelo e os dados são os três pilares dos modelos de IA. Durante o rápido desenvolvimento dos grandes modelos de linguagem, o foco do setor passou de modelos para capacidade computacional. Hoje em dia, a maioria dos modelos estabeleceu o transformer como estrutura de modelo, e as grandes empresas resolveram o problema da capacidade computacional construindo seus próprios supercomputadores ou assinando acordos de longo prazo com provedores de serviços em nuvem. Nesse contexto, a importância dos dados tornou-se cada vez mais evidente.
A Scale AI não se dedica apenas a extrair dados existentes, mas também dirige o seu olhar para um negócio de geração de dados a longo prazo. Ela forma equipas de treinamento de IA compostas por especialistas humanos de diferentes áreas, para fornecer dados de treinamento de maior qualidade para o treinamento de modelos de IA.
Duas fases do treinamento de modelos de IA
O treinamento do modelo de IA é dividido em duas partes: pré-treinamento e ajuste fino.
A fase de pré-treinamento é semelhante ao processo de aprendizagem da fala das crianças humanas. Precisamos fornecer ao modelo de IA uma grande quantidade de textos, códigos e outras informações extraídas da internet, para que o modelo aprenda, através da autoaprendizagem, a dominar as habilidades básicas de comunicação.
A fase de ajuste fino é semelhante à educação escolar, com respostas e direções claras. Através de conjuntos de dados específicos e previamente processados, podemos treinar o modelo para ter capacidades específicas.
Portanto, os dados necessários para o treinamento de IA também são divididos em duas categorias:
Grandes volumes de dados que não requerem muito tratamento, geralmente provenientes de dados de rastreamento de grandes plataformas UGC, bancos de dados de literatura pública, bancos de dados privados de empresas, etc.
Necessita de dados com um design e seleção refinados, semelhantes a manuais profissionais, requerendo trabalho de limpeza de dados, seleção, rotulagem, feedback humano, entre outros.
Esses dois tipos de conjuntos de dados constituem o corpo principal da pista de dados de IA. À medida que a capacidade do modelo continua a melhorar, vários dados de treinamento mais detalhados e especializados se tornarão fatores-chave que influenciam a capacidade do modelo.
Web3 DataFi: O solo ideal para dados de IA
Comparado aos métodos tradicionais de processamento de dados, o Web3 tem uma vantagem natural no campo dos dados de IA, dando origem ao novo conceito de DataFi. As vantagens do Web3 DataFi manifestam-se principalmente nos seguintes aspectos:
Para os utilizadores comuns, o DataFi é o projeto de IA descentralizado mais fácil de participar. Os utilizadores não precisam de assinar contratos complexos ou investir em hardware caro, basta que participem através de tarefas simples, como fornecer dados, avaliar modelos, ou realizar criações simples utilizando ferramentas de IA.
O potencial dos projetos DataFi em Web3
Atualmente, vários projetos Web3 DataFi obtiveram grandes financiamentos, mostrando o enorme potencial deste campo. Aqui estão alguns projetos representativos:
Sahara AI: dedicado a construir uma super infraestrutura e mercado de negociação de IA descentralizada.
Yupp: Plataforma de feedback do modelo de IA, que recolhe as opiniões dos utilizadores sobre o conteúdo gerado pelo modelo.
Vana: Transformar os dados pessoais dos usuários em ativos digitais monetizáveis.
Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains.
Sapien: Destina-se a transformar o conhecimento humano em dados de treino de IA de alta qualidade em grande escala.
Prisma X: dedicado a se tornar a camada de coordenação aberta para robôs, a coleta de dados físicos é a sua chave.
Masa: o principal projeto da sub-rede do ecossistema Bittensor, operando a sub-rede de dados e a sub-rede de Agentes.
Irys: Focado em armazenamento e computação de dados programáveis.
ORO: Capacitar pessoas comuns a participar na contribuição de IA.
Gata: posicionada como uma camada de dados descentralizada, oferece várias formas de participação.
Reflexões sobre o projeto atual
Atualmente, as barreiras para esses projetos não são muito altas, mas uma vez que acumulem usuários e adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Portanto, os projetos iniciais devem focar em incentivos e na experiência do usuário.
Ao mesmo tempo, essas plataformas de dados também precisam considerar como gerenciar a mão de obra e garantir a qualidade da produção de dados, evitando a ocorrência do fenômeno da "mau dinheiro expelindo bom dinheiro". Alguns projetos, como Sahara e Sapien, já começaram a reforçar a gestão da qualidade dos dados.
Além disso, aumentar a transparência é também um problema importante que os projetos on-chain enfrentam atualmente. Muitos projetos ainda carecem de dados públicos e rastreáveis suficientes, o que é prejudicial para o desenvolvimento saudável a longo prazo do Web3 DataFi.
Por fim, a aplicação em larga escala do DataFi precisa atrair um número suficiente de participantes individuais e obter o reconhecimento de empresas mainstream. Alguns projetos como Sahara AI e Vana já fizeram progressos consideráveis nesse sentido.
DataFi representa a relação de coexistência a longo prazo entre a inteligência humana e a inteligência das máquinas. Para aqueles que estão ansiosos e preocupados com a era da IA, participar do DataFi é uma boa escolha que se alinha com as tendências.