2025-07-12 04:55:52

AIを使用している過程で、私たちはそれに質問をします。それは非常に適切に答えますが、その言葉がどのようにして生まれたのか、推測されたのか、それとも本当にどのトレーニングデータで見たのかはわかりません。これは、誰かに質問をしたときに、その人が答えを教えてくれ、すべての文で「私はそう思う」と言いますが、出典を決して教えてくれないのと同じです。

簡単に言うと、従来の言語モデルは n-gram 技術を使用しています。
1️⃣uni-gram は単語を単独で見ることです
2️⃣bi-gramは2つの単語が連結していることを指します。
3️⃣tri-gramは3つの単語の組み合わせです

上記の言語論理は一部の文脈を提供しますが、内容は非常に限られており、既存の問題だけを見て、小さな文の関連に基づいて回答しますが、現在の問題が会話全体の論理において無視されます。

そして、Infini-gramは別のアプローチです。それは既存の問題を見るだけでなく、「シンボルマッチング」に似た方法を用いて、モデルが出力する各セグメントをトレーニングセットに存在するすべての可能な「文」と照らし合わせ、どこから学んできたのか、誰の貢献に関連しているのかを確認します。

例えば、モデルに「ウォレットがBotであるかどうかをどう判断しますか？」と尋ねるとします。
一般的モデルはあなたに言うでしょう：「このアドレスは通常、非常に短い時間内に複数のDEX契約で高頻度取引を行います。」

その背後にある技術は実際に非常にハードコアです。suffix-array に基づく ∞-gram フレームワークを使用しており、本質的には、トレーニングセット内のすべての断片に対して事前にインデックスを作成し、出力時に直接照合するため、モデルを再実行する必要はなく、勾配計算にも依存しません。これにより、速く、安定し、再現可能になります。

ユーザーにとって、モデルの回答が「オリジナル」か「転載」かを知ることができます。
データ提供者にとって、あなたは正当な「著作権」や「経済的インセンティブ」を得ることができます。
規制当局にとって、これは「説明可能な」インターフェースを提供します。

OpenLedgerが行っているのは、モデルを「賢く」することではなく、「責任ある」ものにすることです。つまり、発言するたびに「なぜそう言うのか、どこで学んだのか」を明確に説明できるようにすることです。

私の考えでは、OpenLedgerが提案したProof of Attributionシステムは「信頼できるAI」に向けた重要なステップであり、データの所有権と貢献のトレーサビリティを構築するための核心的なインフラになる可能性があります。

UNI2.6%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

報酬
いいね
コメント
共有

0/400

コメントなし

トピック
1/3
1CandyDrop Airdrop Event 6.0
85772 人気度
2White House Crypto Report
75004 人気度
3Join Alpha RION Airdrop to Earn $40
59679 人気度
4Fed Holds Rates Decision
9911 人気度
5July Spark Program TOP 10 Creators Announced
3338 人気度

ピン

サイトマップ