Trong quá trình sử dụng AI, chúng ta đặt một câu hỏi cho nó, nó trả lời rất hợp lý, nhưng chúng ta không thể biết câu đó thực sự đến từ đâu, là "đoán" ra hay thực sự đã thấy trong một đoạn dữ liệu huấn luyện nào đó. Điều này giống như bạn hỏi một người một câu hỏi, người đó cho bạn câu trả lời, mỗi câu đều nói "tôi nghĩ là đúng", nhưng không bao giờ đưa ra nguồn gốc.



Hiểu một cách đơn giản, mô hình ngôn ngữ truyền thống sử dụng công nghệ n-gram.
1️⃣uni-gram là xem một từ đơn lẻ
2️⃣bi-gram là hai từ được nối với nhau
3️⃣tri-gram là sự kết hợp của ba từ

Ngữ logic trên sẽ cung cấp một phần bối cảnh, nhưng nội dung rất hạn chế, chỉ xem xét các vấn đề hiện có, trả lời dựa trên sự liên kết của các câu nhỏ, nhưng bỏ qua logic của vấn đề hiện tại trong toàn bộ cuộc đối thoại.

Và Infini-gram là một cách tiếp cận khác. Nó không chỉ xem xét các vấn đề hiện có, mà còn sử dụng một cách tương tự như "khớp ký hiệu", để so sánh từng đoạn đầu ra của mô hình với tất cả các "câu" có thể xuất hiện trong tập huấn luyện, xem nó thực sự học từ đâu và liên quan đến ai.

Ví dụ bạn hỏi mô hình: “Làm thế nào để xác định một ví là Bot?”
Mô hình thông thường sẽ nói với bạn: "Địa chỉ này thường giao dịch nhiều hợp đồng DEX với tần suất cao trong khoảng thời gian rất ngắn."

Công nghệ đứng sau thực ra khá cứng cáp, sử dụng khung ∞-gram dựa trên suffix-array —— Về bản chất, nó đã xây dựng chỉ mục cho tất cả các đoạn trong tập huấn luyện, khi xuất ra thì chỉ cần so sánh trực tiếp, không cần chạy lại mô hình, cũng không dựa vào tính toán gradient. Điều này có nghĩa là nhanh, ổn định và có thể tái hiện.

Đối với người dùng, bạn có thể biết câu trả lời của mô hình có phải là "nguyên bản" hay "sao chép".
Đối với những người đóng góp dữ liệu, bạn có thể nhận được "quyền ghi danh" xứng đáng hoặc thậm chí "kích thích kinh tế".
Điều này cung cấp cho các cơ quan quản lý một giao diện "có thể giải thích".

OpenLedger đang làm không phải là làm cho mô hình thông minh hơn, mà là có trách nhiệm hơn - khi trả lời mỗi câu, nó đều có thể nói rõ: "Tại sao tôi lại nói như vậy, tôi học điều này từ đâu?"

Theo tôi, hệ thống Proof of Attribution mà OpenLedger đề xuất là một bước quan trọng đối với "AI đáng tin cậy" và có thể là cơ sở hạ tầng cốt lõi để xây dựng quyền sở hữu dữ liệu và truy xuất nguồn gốc đóng góp.
UNI4.29%
Xem bản gốc
post-image
post-image
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)