Акции Nvidia снова достигли рекордного уровня, прогресс многомодальных моделей углубил технологические барьеры Web2 AI. От семантического выравнивания до визуального понимания, от высокоразмерных встраиваний до слияния признаков, сложные модели интегрируют различные способы выражения с невиданной ранее скоростью, создавая все более закрытое AI пространство. Рынок акций США также проголосовал своими действиями: как акции, связанные с криптовалютой, так и акции AI переживают небольшой бычий рынок. Тем не менее, эта волна энтузиазма почти не связана с областью криптовалют.
Недавние попытки Web3 AI, особенно исследования в направлении Agent, похоже, отклонились от курса: попытка собрать многомодульную модульную систему в стиле Web2 на основе децентрализованной структуры на самом деле является двойным несовпадением технологий и мышления. В условиях высокой взаимосвязанности модулей, высокой нестабильности распределения характеристик и растущей централизации вычислительной мощности сегодня многомодульная модульная система трудно может занять позицию в экосистеме Web3.
Будущее Web3 AI не в имитации, а в стратегическом обходе. От семантической согласованности в высокоразмерном пространстве до узких мест информации в механизмах внимания и согласования признаков в гетерогенных вычислениях — всё это требует переосмысления. Web3 AI должен применять тактическую стратегию "сельская окружение города".
Web3 AI основан на плоской многомодальной модели, трудности в согласовании семантики приводят к низкой производительности
В современных многомодальных системах Web2 AI "семантическое выравнивание" означает отображение информации из разных модальностей в одно и то же семантическое пространство, что позволяет модели понимать и сравнивать значения этих различных сигналов. Только при реализации высокоразмерного встраиваемого пространства разделение рабочего процесса на разные модули имеет смысл с точки зрения снижения затрат и повышения эффективности. Однако в протоколе Web3 Agent трудно реализовать высокоразмерное встраивание, поскольку модульность может быть иллюзией Web3 AI.
Требование к Web3 AI реализовать высокоразмерное пространство фактически равносильно требованию, чтобы протокол Агент сам разрабатывал все связанные API интерфейсы, что противоречит его модульному замыслу. Модульная многомодальная система, описанная малыми и средними предприятиями Web3 AI, не выдерживает критики. Высокоразмерная архитектура требует единого обучения от начала до конца или совместной оптимизации: от захвата сигналов до вычисления стратегий, а затем до выполнения и управления рисками; все этапы должны делить одну и ту же систему представлений и функцию потерь.
Для реализации полностью интегрированного интеллектуального агента с барьерами для входа в отрасль необходимо преодолеть такие препятствия, как совместное моделирование от конца до конца, унифицированное внедрение между модулями, а также системная инженерия совместного обучения и развертывания. Однако в текущем рынке отсутствуют такие болевые точки, и, следовательно, отсутствует соответствующий рыночный спрос.
В низкоразмерном пространстве механизм внимания трудно точно спроектировать
Высокоуровневые мультимодальные модели требуют разработки сложных механизмов внимания. Механизм внимания по сути представляет собой способ динамического распределения вычислительных ресурсов, который позволяет модели при обработке определенного модального ввода выборочно "сосредотачиваться" на наиболее релевантных частях.
Почему модульный Web3 AI трудно реализовать с единым планировщиком внимания? Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, все входные характеристики должны быть отображены в одно и то же высокоразмерное векторное пространство, чтобы можно было вычислить динамические веса с помощью скалярного произведения. Однако независимые API возвращают данные в разных форматах и с разным распределением, без единого слоя встраивания трудно сформировать набор интерактивных Q/K/V.
Во-вторых, внимание с длинной памятью позволяет одновременно и параллельно сосредоточиться на различных источниках информации на одном уровне, а затем агрегировать результаты; в то время как независимые API часто представляют собой линейные вызовы, где вывод на каждом шаге является лишь входом для следующего модуля, что не позволяет осуществлять параллельное и динамическое взвешивание.
В конце концов, настоящая механизм внимания будет динамически распределять веса для каждого элемента на основе общего контекста; в режиме API модуль может видеть только "независимый" контекст, когда он вызывается, и между ними нет централизованного контекста в реальном времени, что делает невозможным глобальную связь и фокусировку между модулями.
Дискретная модульная компоновка приводит к тому, что слияние признаков остается на поверхностной статической стыковке.
"Слияние признаков" основано на выравнивании и внимании, и представляет собой дальнейшую комбинацию векторных признаков, полученных после обработки различных модальностей, для непосредственного использования в последующих задачах. Web3 AI, конечно, находитcя на самой простой стадии соединения, поскольку динамическое слияние признаков требует высокоразмерного пространства и точного механизма внимания; когда эти предварительные условия не могут быть выполнены, естественно, на последнем этапе слияние признаков также не может продемонстрировать выдающуюся производительность.
Web2 AI склонен к совместному обучению от начала до конца: одновременно обрабатывает различные модальные признаки в одном высокоразмерном пространстве, оптимизируя совместно с задачами нижнего уровня через слои внимания и слияния. В то время как Web3 AI больше использует подход с дискретными модулями, комбинируя различные API в независимые агенты, а затем просто соединяя их выходные метки, значения или пороговые сигналы для комплексного принятия решений основной логикой или вручную. Этот подход не имеет единой обучающей цели и отсутствует градиентный поток между модулями.
Барьеры в AI-индустрии углубляются, но болевые точки еще не проявились
Мультимодальная система Web2 AI является крайне масштабным инженерным проектом. Она требует не только огромного, разнообразного и высококачественно аннотированного кросс-модального набора данных, но также значительных затрат GPU и времени на обучение; в архитектуре модели объединены различные современные концепции сетевого дизайна и технологии оптимизации; при реализации проекта необходимо создать масштабируемую распределенную платформу для обучения, систему мониторинга, управление версиями моделей и конвейер развертывания. Такая системная работа на всех уровнях и по всей цепочке требует высоких затрат на финансирование, данные, вычислительные мощности, кадры, а также организационное сотрудничество, что создает сильные барьеры для входа в отрасль.
Web3 AI или любые криптовалютные продукты, представляющиеся под флагом продуктового рынка, должны развиваться с тактикой "окружение города деревней", начиная с небольших экспериментов в пограничных сценариях, и, убедившись в прочной основе, ждать появления основных сценариев. Ядро Web3 AI заключается в децентрализации, а его путь эволюции проявляется в высокой параллельности, низкой связности и совместимости гетерогенных вычислительных мощностей. Это делает Web3 AI более выгодным в таких сценариях, как крайние вычисления, подходящих для легковесных структур, легко параллелизуемых и стимулируемых задач.
Тем не менее, на данный момент барьеры Web2 AI только начинают формироваться, это ранняя стадия конкуренции крупных компаний. Только когда выгоды Web2 AI практически исчезнут, оставшиеся болевые точки станут возможностью для входа Web3 AI. До этого момента Web3 AI должен тщательно различать протоколы с потенциалом «сельская местность окружает город», обращая внимание на то, может ли он постоянно итеративно развиваться в небольших сценариях, обладает ли достаточной гибкостью для реагирования на динамично меняющуюся рыночную среду.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
26 Лайков
Награда
26
7
Поделиться
комментарий
0/400
0xLostKey
· 07-17 11:15
Снова унесло на небеса.
Посмотреть ОригиналОтветить0
ImpermanentPhilosopher
· 07-15 22:52
Теоретически высокочастотный холд
Посмотреть ОригиналОтветить0
BrokenDAO
· 07-15 02:14
Еще одна система проектирования, лишенная равновесия игр... Веса голосования всегда являются мертвой петлей.
Посмотреть ОригиналОтветить0
CryptoHistoryClass
· 07-15 02:12
*проверяет исторические данные* ах да... тот же паттерн, который мы наблюдали с ранними нейронными сетями в 2017 году. ngmi
Посмотреть ОригиналОтветить0
RadioShackKnight
· 07-15 02:09
Снова занимаются чем-то высокопарным, с этим уже не справиться.
Проблемы развития Web3 AI: противоречия между высокоразмерными моделями и модульностью становятся очевидными
Состояние развития Web3 AI и будущие направления
Акции Nvidia снова достигли рекордного уровня, прогресс многомодальных моделей углубил технологические барьеры Web2 AI. От семантического выравнивания до визуального понимания, от высокоразмерных встраиваний до слияния признаков, сложные модели интегрируют различные способы выражения с невиданной ранее скоростью, создавая все более закрытое AI пространство. Рынок акций США также проголосовал своими действиями: как акции, связанные с криптовалютой, так и акции AI переживают небольшой бычий рынок. Тем не менее, эта волна энтузиазма почти не связана с областью криптовалют.
Недавние попытки Web3 AI, особенно исследования в направлении Agent, похоже, отклонились от курса: попытка собрать многомодульную модульную систему в стиле Web2 на основе децентрализованной структуры на самом деле является двойным несовпадением технологий и мышления. В условиях высокой взаимосвязанности модулей, высокой нестабильности распределения характеристик и растущей централизации вычислительной мощности сегодня многомодульная модульная система трудно может занять позицию в экосистеме Web3.
Будущее Web3 AI не в имитации, а в стратегическом обходе. От семантической согласованности в высокоразмерном пространстве до узких мест информации в механизмах внимания и согласования признаков в гетерогенных вычислениях — всё это требует переосмысления. Web3 AI должен применять тактическую стратегию "сельская окружение города".
Web3 AI основан на плоской многомодальной модели, трудности в согласовании семантики приводят к низкой производительности
В современных многомодальных системах Web2 AI "семантическое выравнивание" означает отображение информации из разных модальностей в одно и то же семантическое пространство, что позволяет модели понимать и сравнивать значения этих различных сигналов. Только при реализации высокоразмерного встраиваемого пространства разделение рабочего процесса на разные модули имеет смысл с точки зрения снижения затрат и повышения эффективности. Однако в протоколе Web3 Agent трудно реализовать высокоразмерное встраивание, поскольку модульность может быть иллюзией Web3 AI.
Требование к Web3 AI реализовать высокоразмерное пространство фактически равносильно требованию, чтобы протокол Агент сам разрабатывал все связанные API интерфейсы, что противоречит его модульному замыслу. Модульная многомодальная система, описанная малыми и средними предприятиями Web3 AI, не выдерживает критики. Высокоразмерная архитектура требует единого обучения от начала до конца или совместной оптимизации: от захвата сигналов до вычисления стратегий, а затем до выполнения и управления рисками; все этапы должны делить одну и ту же систему представлений и функцию потерь.
Для реализации полностью интегрированного интеллектуального агента с барьерами для входа в отрасль необходимо преодолеть такие препятствия, как совместное моделирование от конца до конца, унифицированное внедрение между модулями, а также системная инженерия совместного обучения и развертывания. Однако в текущем рынке отсутствуют такие болевые точки, и, следовательно, отсутствует соответствующий рыночный спрос.
В низкоразмерном пространстве механизм внимания трудно точно спроектировать
Высокоуровневые мультимодальные модели требуют разработки сложных механизмов внимания. Механизм внимания по сути представляет собой способ динамического распределения вычислительных ресурсов, который позволяет модели при обработке определенного модального ввода выборочно "сосредотачиваться" на наиболее релевантных частях.
Почему модульный Web3 AI трудно реализовать с единым планировщиком внимания? Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, все входные характеристики должны быть отображены в одно и то же высокоразмерное векторное пространство, чтобы можно было вычислить динамические веса с помощью скалярного произведения. Однако независимые API возвращают данные в разных форматах и с разным распределением, без единого слоя встраивания трудно сформировать набор интерактивных Q/K/V.
Во-вторых, внимание с длинной памятью позволяет одновременно и параллельно сосредоточиться на различных источниках информации на одном уровне, а затем агрегировать результаты; в то время как независимые API часто представляют собой линейные вызовы, где вывод на каждом шаге является лишь входом для следующего модуля, что не позволяет осуществлять параллельное и динамическое взвешивание.
В конце концов, настоящая механизм внимания будет динамически распределять веса для каждого элемента на основе общего контекста; в режиме API модуль может видеть только "независимый" контекст, когда он вызывается, и между ними нет централизованного контекста в реальном времени, что делает невозможным глобальную связь и фокусировку между модулями.
Дискретная модульная компоновка приводит к тому, что слияние признаков остается на поверхностной статической стыковке.
"Слияние признаков" основано на выравнивании и внимании, и представляет собой дальнейшую комбинацию векторных признаков, полученных после обработки различных модальностей, для непосредственного использования в последующих задачах. Web3 AI, конечно, находитcя на самой простой стадии соединения, поскольку динамическое слияние признаков требует высокоразмерного пространства и точного механизма внимания; когда эти предварительные условия не могут быть выполнены, естественно, на последнем этапе слияние признаков также не может продемонстрировать выдающуюся производительность.
Web2 AI склонен к совместному обучению от начала до конца: одновременно обрабатывает различные модальные признаки в одном высокоразмерном пространстве, оптимизируя совместно с задачами нижнего уровня через слои внимания и слияния. В то время как Web3 AI больше использует подход с дискретными модулями, комбинируя различные API в независимые агенты, а затем просто соединяя их выходные метки, значения или пороговые сигналы для комплексного принятия решений основной логикой или вручную. Этот подход не имеет единой обучающей цели и отсутствует градиентный поток между модулями.
Барьеры в AI-индустрии углубляются, но болевые точки еще не проявились
Мультимодальная система Web2 AI является крайне масштабным инженерным проектом. Она требует не только огромного, разнообразного и высококачественно аннотированного кросс-модального набора данных, но также значительных затрат GPU и времени на обучение; в архитектуре модели объединены различные современные концепции сетевого дизайна и технологии оптимизации; при реализации проекта необходимо создать масштабируемую распределенную платформу для обучения, систему мониторинга, управление версиями моделей и конвейер развертывания. Такая системная работа на всех уровнях и по всей цепочке требует высоких затрат на финансирование, данные, вычислительные мощности, кадры, а также организационное сотрудничество, что создает сильные барьеры для входа в отрасль.
Web3 AI или любые криптовалютные продукты, представляющиеся под флагом продуктового рынка, должны развиваться с тактикой "окружение города деревней", начиная с небольших экспериментов в пограничных сценариях, и, убедившись в прочной основе, ждать появления основных сценариев. Ядро Web3 AI заключается в децентрализации, а его путь эволюции проявляется в высокой параллельности, низкой связности и совместимости гетерогенных вычислительных мощностей. Это делает Web3 AI более выгодным в таких сценариях, как крайние вычисления, подходящих для легковесных структур, легко параллелизуемых и стимулируемых задач.
Тем не менее, на данный момент барьеры Web2 AI только начинают формироваться, это ранняя стадия конкуренции крупных компаний. Только когда выгоды Web2 AI практически исчезнут, оставшиеся болевые точки станут возможностью для входа Web3 AI. До этого момента Web3 AI должен тщательно различать протоколы с потенциалом «сельская местность окружает город», обращая внимание на то, может ли он постоянно итеративно развиваться в небольших сценариях, обладает ли достаточной гибкостью для реагирования на динамично меняющуюся рыночную среду.