Vào ngày 27 tháng 11, Zhao Changpeng đã đăng bài trên X nói rằng, các nhiệm vụ như gán nhãn dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động giá rẻ toàn cầu và thanh toán ngay lập tức bằng tiền điện tử, phá vỡ các giới hạn địa lý.
Gắn nhãn dữ liệu đề cập đến việc chú thích thủ công hoặc tự động dữ liệu thô (chẳng hạn như văn bản, hình ảnh, âm thanh, v.v.) để làm cho dữ liệu có thông tin có cấu trúc cụ thể. Dữ liệu được gắn nhãn được sử dụng để đào tạo các mô hình máy học hoặc trí tuệ nhân tạo, chẳng hạn như gắn nhãn văn bản với các danh mục cảm xúc (tích cực, tiêu cực, trung lập). Việc sử dụng blockchain để gán nhãn dữ liệu AI đặc biệt phù hợp với các tình huống gán dữ liệu đòi hỏi tính minh bạch, độ tin cậy cao và cộng tác phân tán. Điều này không chỉ cải thiện hiệu quả và chất lượng của chú thích dữ liệu mà còn tạo ra những khả năng mới cho cộng tác toàn cầu và giao dịch dữ liệu.
Hiện tại, trong lĩnh vực này có những dự án chất lượng nào? Triển vọng phát triển của lĩnh vực này ra sao?
Vai trò của blockchain trong việc đánh dấu dữ liệu AI
Công nghệ blockchain là một loại sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, tính không thể thay đổi và tính có thể truy xuất. Những đặc điểm này có thể giải quyết các vấn đề sau trong phương pháp truyền thống về đánh dấu dữ liệu:
Tính xác thực của dữ liệu và chống giả mạo: Mỗi bản ghi được đánh dấu đều được ghi vào blockchain, không thể bị thay đổi tùy tiện, đảm bảo độ tin cậy của việc đánh dấu.
Tính minh bạch trong phân bổ nhiệm vụ: Blockchain có thể ghi lại quá trình phân phối, thực hiện và kiểm tra nhiệm vụ, ngăn chặn sự phân bổ nhiệm vụ không công bằng hoặc gian lận kết quả.
Cơ chế khuyến khích: Sử dụng công nghệ hợp đồng thông minh của blockchain, nhân viên gán nhãn dữ liệu có thể tự động nhận được tiền điện tử hoặc phần thưởng khác khi hoàn thành nhiệm vụ.
Nguồn gốc dữ liệu: Thông tin về nguồn gốc của mỗi nhãn, người đánh dấu và người kiểm tra đều có thể được truy xuất.
Ứng dụng
Ghi nhãn phân tán: Sử dụng blockchain để phân phối nhiệm vụ ghi nhãn dữ liệu cho các nhân viên ghi nhãn toàn cầu, tăng hiệu quả xử lý dữ liệu.
Kiểm tra chất lượng: Kết quả gán nhãn từ nhiều người được so sánh và kiểm tra thông qua công nghệ blockchain, đảm bảo độ chính xác của việc gán nhãn.
Giao dịch dữ liệu được chú thích: Dữ liệu đã được chú thích có thể được giao dịch trên blockchain, cả bên mua và bên bán đều không cần lo lắng về tính toàn vẹn hoặc tính xác thực của dữ liệu.
Bảo vệ quyền riêng tư: Sử dụng blockchain để lưu trữ dữ liệu nhãn một cách được mã hóa, đảm bảo an toàn cho dữ liệu cá nhân.
Dự án liên quan
OORT DataHub: cung cấp dịch vụ đánh dấu dữ liệu phi tập trung dựa trên blockchain, sử dụng thuật toán Proof of Honesty để kiểm soát chất lượng. Nền tảng của nó phân phối nhiệm vụ, kiểm tra chất lượng dữ liệu và thanh toán thù lao thông qua hợp đồng thông minh, thu hút những người đánh dấu từ khắp nơi trên thế giới tham gia và đảm bảo tính minh bạch và bảo vệ quyền riêng tư của dữ liệu đánh dấu.
Mô hình kinh tế của token dự án như sau:
Phần thưởng cộng đồng*: Bằng cách tham gia vào việc gán nhãn và phân tích dữ liệu, người dùng có thể nhận được phần thưởng bằng token $OORT. Ngoài ra, còn có thể nhận được NFT độc đáo gắn liền với những đóng góp, những NFT này cung cấp quyền lợi bổ sung, như phần thưởng tăng tỷ lệ lợi suất hàng năm (APY), giảm giá thiết bị và quyền biểu quyết trong DAO.*
Ký quỹ nhiệm vụ*: Người tham gia phải ký quỹ ít nhất 210 $OORT token để thể hiện cam kết với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ được hoàn trả token và phát thưởng.
Chia sẻ doanh thu bán hàng*: Một số người nắm giữ NFT còn có thể nhận được cổ tức từ doanh thu bán dữ liệu trong tương lai, làm tăng thêm lợi nhuận lâu dài.
**PublicAI:**Dự án AI trên chuỗi Solana, nhằm kết nối các bên có nhu cầu dữ liệu và những người gán nhãn toàn cầu, thông qua cơ chế thưởng bằng mã token để khuyến khích người tham gia, đồng thời sử dụng công nghệ blockchain để ghi lại chi tiết quá trình gán nhãn, đảm bảo an toàn và quyền riêng tư dữ liệu.
Mô hình kinh tế của token dự án như sau:
***Phần thưởng cộng đồng:10% token Public sẽ được sử dụng cho phần thưởng airdrop cho người dùng trong giai đoạn tương tác đầu tiên, cụ thể cóba cách để nhận airdrop,****trở thành AI Builder: thu thập nội dung chất lượng cao từ Internet;*trở thành AI Validator: xác thực nội dung đã thu thập; trở thành AI Developer: sử dụng bộ dữ liệu đã được xác thực để huấn luyện đại lý AI.
Phân phối token***:***Dự án đã hoàn thành vòng gọi vốn hạt giống 2 triệu USD vào tháng 1 năm 2024, các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo, hiện các chi tiết cụ thể về phân phối token PublicAI vẫn chưa được xác định.
Những thách thức phải đối mặt
Hiện tại, có một số yếu tố hạn chế sự phát triển của lĩnh vực này: thứ nhất là việc đánh dấu dữ liệu AI cần tài nguyên tính toán và lưu trữ cao; thứ hai là hiệu suất của dự án bị hạn chế bởi khả năng mở rộng của blockchain; thứ ba là tiêu chuẩn hóa công nghệ và quản lý còn chưa hoàn thiện.
Trong đó, điểm thứ hai có lẽ là thách thức lớn nhất mà hiện tại chúng ta đang phải đối mặt. Bởi vì việc gán nhãn dữ liệu AI và đào tạo mô hình thường cần một khối lượng lớn tài nguyên tính toán, trong khi khả năng tính toán của các nút trong mạng blockchain là hạn chế. Cách hiệu quả để tích hợp và tận dụng tài nguyên tính toán phân tán nhằm đáp ứng nhu cầu tính toán của các dự án gán nhãn dữ liệu AI mà vẫn đảm bảo tính phi tập trung của blockchain là một vấn đề cần phải giải quyết. Theo thông tin, Greenfield thuộc Binance đang cung cấp hỗ trợ lưu trữ cho lĩnh vực này, hy vọng sẽ có nhiều hơn tài nguyên lưu trữ và tính toán được thực hành trong lĩnh vực này.
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Đường đua đánh dấu dữ liệu AI của Zhao Changpeng advocate hiện đang phát triển ra sao?
Rachel, Kinh tế vàng
Vào ngày 27 tháng 11, Zhao Changpeng đã đăng bài trên X nói rằng, các nhiệm vụ như gán nhãn dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động giá rẻ toàn cầu và thanh toán ngay lập tức bằng tiền điện tử, phá vỡ các giới hạn địa lý.
Gắn nhãn dữ liệu đề cập đến việc chú thích thủ công hoặc tự động dữ liệu thô (chẳng hạn như văn bản, hình ảnh, âm thanh, v.v.) để làm cho dữ liệu có thông tin có cấu trúc cụ thể. Dữ liệu được gắn nhãn được sử dụng để đào tạo các mô hình máy học hoặc trí tuệ nhân tạo, chẳng hạn như gắn nhãn văn bản với các danh mục cảm xúc (tích cực, tiêu cực, trung lập). Việc sử dụng blockchain để gán nhãn dữ liệu AI đặc biệt phù hợp với các tình huống gán dữ liệu đòi hỏi tính minh bạch, độ tin cậy cao và cộng tác phân tán. Điều này không chỉ cải thiện hiệu quả và chất lượng của chú thích dữ liệu mà còn tạo ra những khả năng mới cho cộng tác toàn cầu và giao dịch dữ liệu.
Hiện tại, trong lĩnh vực này có những dự án chất lượng nào? Triển vọng phát triển của lĩnh vực này ra sao?
Vai trò của blockchain trong việc đánh dấu dữ liệu AI
Công nghệ blockchain là một loại sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, tính không thể thay đổi và tính có thể truy xuất. Những đặc điểm này có thể giải quyết các vấn đề sau trong phương pháp truyền thống về đánh dấu dữ liệu:
Ứng dụng
Dự án liên quan
Mô hình kinh tế của token dự án như sau:
Phần thưởng cộng đồng*: Bằng cách tham gia vào việc gán nhãn và phân tích dữ liệu, người dùng có thể nhận được phần thưởng bằng token $OORT. Ngoài ra, còn có thể nhận được NFT độc đáo gắn liền với những đóng góp, những NFT này cung cấp quyền lợi bổ sung, như phần thưởng tăng tỷ lệ lợi suất hàng năm (APY), giảm giá thiết bị và quyền biểu quyết trong DAO.*
Ký quỹ nhiệm vụ*: Người tham gia phải ký quỹ ít nhất 210 $OORT token để thể hiện cam kết với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ được hoàn trả token và phát thưởng.
Chia sẻ doanh thu bán hàng*: Một số người nắm giữ NFT còn có thể nhận được cổ tức từ doanh thu bán dữ liệu trong tương lai, làm tăng thêm lợi nhuận lâu dài.
Mô hình kinh tế của token dự án như sau:
***Phần thưởng cộng đồng:10% token Public sẽ được sử dụng cho phần thưởng airdrop cho người dùng trong giai đoạn tương tác đầu tiên, cụ thể cóba cách để nhận airdrop,****trở thành AI Builder: thu thập nội dung chất lượng cao từ Internet;*trở thành AI Validator: xác thực nội dung đã thu thập; trở thành AI Developer: sử dụng bộ dữ liệu đã được xác thực để huấn luyện đại lý AI.
Phân phối token***:***Dự án đã hoàn thành vòng gọi vốn hạt giống 2 triệu USD vào tháng 1 năm 2024, các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo, hiện các chi tiết cụ thể về phân phối token PublicAI vẫn chưa được xác định.
Những thách thức phải đối mặt
Hiện tại, có một số yếu tố hạn chế sự phát triển của lĩnh vực này: thứ nhất là việc đánh dấu dữ liệu AI cần tài nguyên tính toán và lưu trữ cao; thứ hai là hiệu suất của dự án bị hạn chế bởi khả năng mở rộng của blockchain; thứ ba là tiêu chuẩn hóa công nghệ và quản lý còn chưa hoàn thiện.
Trong đó, điểm thứ hai có lẽ là thách thức lớn nhất mà hiện tại chúng ta đang phải đối mặt. Bởi vì việc gán nhãn dữ liệu AI và đào tạo mô hình thường cần một khối lượng lớn tài nguyên tính toán, trong khi khả năng tính toán của các nút trong mạng blockchain là hạn chế. Cách hiệu quả để tích hợp và tận dụng tài nguyên tính toán phân tán nhằm đáp ứng nhu cầu tính toán của các dự án gán nhãn dữ liệu AI mà vẫn đảm bảo tính phi tập trung của blockchain là một vấn đề cần phải giải quyết. Theo thông tin, Greenfield thuộc Binance đang cung cấp hỗ trợ lưu trữ cho lĩnh vực này, hy vọng sẽ có nhiều hơn tài nguyên lưu trữ và tính toán được thực hành trong lĩnh vực này.