DataFi: Новые возможности в эпоху ИИ. Как Web3 ведет в области данных.

С точки зрения AI-данных, потенциал развития DataFi

Сегодня мир находится в эпохе глобальной конкуренции за создание лучших базовых моделей. Хотя вычислительная мощность и архитектура моделей важны, настоящей защитой являются тренировочные данные. В этой статье мы начнем с Scale AI и исследуем потенциал сектора данных AI.

Путь к успеху Scale AI

Оценка Scale AI в настоящее время составляет 29 миллиардов долларов, а его клиентами являются как американские военные, так и несколько конкурирующих гигантов в области ИИ. Основной бизнес Scale AI заключается в предоставлении большого объема точных аннотированных данных, и именно благодаря раннему осознанию важности данных в индустрии ИИ, он смог выделиться среди множества единорогов.

Вычислительная мощность, модели и данные являются тремя основными столпами AI моделей. В процессе быстрого развития больших языковых моделей акцент в отрасли переместился от модели к вычислительной мощности. В настоящее время большинство моделей утвердили transformer в качестве модельной структуры, а крупные компании решили проблемы вычислительной мощности, создав собственные суперкомпьютерные кластеры или заключив долгосрочные контракты с облачными провайдерами. В этой ситуации важность данных постепенно становится все более очевидной.

Scale AI не только стремится к извлечению существующих данных, но и обращает внимание на более дальновидный бизнес по генерации данных. Она формирует команды по обучению ИИ, состоящие из экспертов в различных областях, чтобы предоставить более качественные тренировочные данные для обучения ИИ моделей.

Два этапа обучения моделей ИИ

Обучение моделей ИИ делится на две части: предобучение и дообучение.

Этап предварительной подготовки похож на процесс, когда человеческие младенцы учатся говорить. Нам нужно вводить в ИИ-модель большое количество текстов, кода и другой информации, собранной из Интернета, чтобы модель могла освоить основные навыки общения через самообучение.

Этап дообучения похож на школьное образование, есть четкие правильные и неправильные ответы и направления. С помощью заранее подготовленных специализированных наборов данных мы можем развить у модели определенные способности.

Таким образом, данные, необходимые для обучения ИИ, делятся на два типа:

  1. Большие объемы данных, которые не требуют значительной обработки, обычно поступают из крупных платформ UGC, данных веб-сканирования, открытых библиотек документов, частных баз данных предприятий и т.д.

  2. Необходимо тщательно разработать и отобрать данные, похожие на специализированные учебники, требуется провести очистку данных, отбор, маркировку, обратную связь и другие работы.

Эти два типа наборов данных составляют основу сектора AI данных. С дальнейшим повышением возможностей моделей различные более тонкие и специализированные тренировочные данные станут ключевыми факторами, влияющими на возможности моделей.

Web3 DataFi: Идеальная почва для AI-данных

По сравнению с традиционными методами обработки данных, Web3 обладает естественным преимуществом в области AI-данных, что привело к появлению новой концепции DataFi. Преимущества Web3 DataFi в основном проявляются в следующих аспектах:

  1. Умные контракты защищают суверенитет данных, безопасность и конфиденциальность
  2. Географические арбитражные преимущества, возникающие из-за распределенной архитектуры
  3. Явные преимущества стимулов и расчетов в блокчейне
  4. Способствует созданию более эффективного и открытого рынка данных "под ключ".

Для обычных пользователей DataFi является самым простым в участии децентрализованным AI проектом. Пользователям не нужно подписывать сложные контракты или инвестировать в дорогое оборудование, достаточно просто выполнять простые задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества и т.д.

Данные как актив: DataFi открывает новое голубое море

Потенциальные проекты Web3 DataFi

В настоящее время несколько проектов Web3 DataFi получили значительное финансирование, что демонстрирует огромный потенциал этой области. Вот некоторые代表项目:

  1. Sahara AI: Стремится создать суперинфраструктуру и торговую площадку для децентрализованного ИИ.

  2. Yupp: Платформа обратной связи для AI моделей, собирающая отзывы пользователей о выводах модели.

  3. Vana: Преобразование личных данных пользователей в цифровые активы, которые можно монетизировать.

  4. Chainbase: сосредоточение на данных цепочки, охватывающих более 200 блокчейнов.

  5. Sapien: предназначен для массового преобразования человеческих знаний в высококачественные данные для обучения ИИ.

  6. Prisma X: стремится стать открытым координационным уровнем для роботов, сбор физических данных является ключевым.

  7. Masa: ведущий подсетевой проект экосистемы Bittensor, управляет подсетью данных и подсетью агентов.

  8. Irys: ориентирован на программируемое хранение данных и вычисления.

  9. ORO: Дает возможность обычным людям участвовать в вкладе в ИИ.

  10. Gata: позиционируется как децентрализованный уровень данных, предлагающий множество способов участия.

Данные как актив: DataFi открывает новое голубое море

Мысли о текущем проекте

В настоящее время барьеры для этих проектов в целом не высоки, но как только накапливаются пользователи и экосистемная привязанность, преимущества платформы быстро накапливаются. Таким образом, ранние проекты должны сосредоточиться на стимулах и пользовательском опыте.

В то же время эти платформы данных должны учитывать, как управлять рабочей силой, обеспечивать качество данных и избегать явления, когда плохие деньги вытесняют хорошие. Некоторые проекты, такие как Sahara и Sapien, уже начали усиливать управление качеством данных.

Кроме того, повышение прозрачности также является важной проблемой, с которой сталкиваются современные проекты в цепочке. Многие проекты по-прежнему страдают от недостатка достаточных открытых и отслеживаемых данных, что неблагоприятно сказывается на долгосрочном здоровом развитии Web3 DataFi.

Наконец, для массового применения DataFi необходимо одновременно привлечь достаточное количество частных участников и получить признание со стороны основных компаний. Некоторые проекты, такие как Sahara AI и Vana, уже достигли неплохих успехов в этом направлении.

DataFi представляет собой долгосрочные симбиотические отношения между человеческим интеллектом и машинным интеллектом. Для тех, кто с нетерпением ждет и беспокоится о эпохе ИИ, участие в DataFi может быть хорошим выбором в соответствии с тенденцией.

Данные как актив: DataFi открывает новое голубое море

SAHARA7.37%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Поделиться
комментарий
0/400
ReverseFOMOguyvip
· 3ч назад
Снова начали говорить о DataFi.
Посмотреть ОригиналОтветить0
CryptoCross-TalkClubvip
· 3ч назад
Аха, наконец-то начали разыгрывать AI неудачников, в прошлый раз Метавселенная, а теперь снова новая история.
Посмотреть ОригиналОтветить0
ParanoiaKingvip
· 3ч назад
Могут ли тренировочные данные также сворачиваться?
Посмотреть ОригиналОтветить0
BTCRetirementFundvip
· 4ч назад
290 миллиардов, будут играть для лохов...
Посмотреть ОригиналОтветить0
  • Закрепить