В процессе использования ИИ мы задаем ему вопрос, он отвечает очень уверенно, но мы не можем знать, откуда именно эта фраза появилась: он "угадывает" её или действительно видел её в каком-то тренировочном наборе данных. Это похоже на то, как вы задаете человеку вопрос, он дает вам ответ, и каждая его фраза звучит как "я считаю, что это правильно", но никогда не приводит источник.
Простое понимание, традиционные языковые модели используют технологию n-gram. 1️⃣uni-gram - это анализ отдельного слова 2️⃣bi-gram это два слова, соединенные вместе 3️⃣tri-gram это сочетание трех слов
Вышеуказанная языковая логика предоставит часть контекста, но содержание очень ограничено, оно отвечает только на имеющиеся вопросы, основываясь на связи между короткими фразами, игнорируя при этом логику текущего вопроса в рамках всего разговора.
А Infini-gram — это еще одна идея. Он не только рассматривает существующие проблемы, но и использует подход, подобный «сопоставлению символов», чтобы сопоставить каждый фрагмент, выведенный моделью, со всеми возможными «предложениями» из обучающего набора, чтобы понять, откуда он научился и с чьим вкладом это связано.
Например, вы спрашиваете модель: "Как определить, является ли кошелек ботом?" Обычная модель скажет вам: "Этот адрес обычно совершает высокочастотные сделки на нескольких DEX-контрактах в течение очень короткого времени."
Технология, стоящая за этим, на самом деле довольно жесткая, использует основанный на suffix-array фреймворк ∞-gram — по сути, она заранее создает индексы всех фрагментов в обучающем наборе, а при выводе просто сравнивает их, не нужно повторно запускать модель и не полагается на расчет градиента. Это означает быстро, стабильно и воспроизводимо.
Для пользователей вы можете узнать, является ли ответ модели «оригинальным» или «копированным». Для поставщиков данных вы можете получить заслуженное "авторство" и даже "экономическое вознаграждение". Для регулирующих органов это предоставляет "объяснимый" интерфейс.
OpenLedger делает не то, чтобы сделать модель более "умной", а чтобы сделать ее более "ответственной" — отвечая на каждое предложение, она может четко сказать: "Почему я так говорю, откуда я это знаю".
На мой взгляд, предложенная OpenLedger система Proof of Attribution является ключевым шагом к "достоверному ИИ" и, возможно, основой для построения инфраструктуры владения данными и отслеживания их вклада.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
В процессе использования ИИ мы задаем ему вопрос, он отвечает очень уверенно, но мы не можем знать, откуда именно эта фраза появилась: он "угадывает" её или действительно видел её в каком-то тренировочном наборе данных. Это похоже на то, как вы задаете человеку вопрос, он дает вам ответ, и каждая его фраза звучит как "я считаю, что это правильно", но никогда не приводит источник.
Простое понимание, традиционные языковые модели используют технологию n-gram.
1️⃣uni-gram - это анализ отдельного слова
2️⃣bi-gram это два слова, соединенные вместе
3️⃣tri-gram это сочетание трех слов
Вышеуказанная языковая логика предоставит часть контекста, но содержание очень ограничено, оно отвечает только на имеющиеся вопросы, основываясь на связи между короткими фразами, игнорируя при этом логику текущего вопроса в рамках всего разговора.
А Infini-gram — это еще одна идея. Он не только рассматривает существующие проблемы, но и использует подход, подобный «сопоставлению символов», чтобы сопоставить каждый фрагмент, выведенный моделью, со всеми возможными «предложениями» из обучающего набора, чтобы понять, откуда он научился и с чьим вкладом это связано.
Например, вы спрашиваете модель: "Как определить, является ли кошелек ботом?"
Обычная модель скажет вам: "Этот адрес обычно совершает высокочастотные сделки на нескольких DEX-контрактах в течение очень короткого времени."
Технология, стоящая за этим, на самом деле довольно жесткая, использует основанный на suffix-array фреймворк ∞-gram — по сути, она заранее создает индексы всех фрагментов в обучающем наборе, а при выводе просто сравнивает их, не нужно повторно запускать модель и не полагается на расчет градиента. Это означает быстро, стабильно и воспроизводимо.
Для пользователей вы можете узнать, является ли ответ модели «оригинальным» или «копированным».
Для поставщиков данных вы можете получить заслуженное "авторство" и даже "экономическое вознаграждение".
Для регулирующих органов это предоставляет "объяснимый" интерфейс.
OpenLedger делает не то, чтобы сделать модель более "умной", а чтобы сделать ее более "ответственной" — отвечая на каждое предложение, она может четко сказать: "Почему я так говорю, откуда я это знаю".
На мой взгляд, предложенная OpenLedger система Proof of Attribution является ключевым шагом к "достоверному ИИ" и, возможно, основой для построения инфраструктуры владения данными и отслеживания их вклада.