Merkeziyetsizlik AI eğitim keşfi: Prime Intellect ve Pluralis'in öncü atılımları

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları

AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen, en yüksek teknik engellere sahip aşamadır ve doğrudan modelin yetenek sınırını ve gerçek uygulama etkisini belirler. Çıkarım aşamasının hafif çağrısının aksine, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sistemlerinin inşası için gerçek "ağır sanayi"dir. Mimari paradigmayı dikkate alarak, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminin öncü keşfi

Merkeziyetsiz eğitim, tek bir kuruluşun yerel yüksek performanslı küme içinde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanımdan, alt yazılımlardan, küme zamanlama sisteminden, eğitim çerçevesinin tüm bileşenleri tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımını, gradyan senkronizasyonunu ve hata toleransı mekanizmalarının verimliliğini en üst düzeye çıkarır; GPT, Gemini gibi büyük ölçekli modellerin eğitimi için oldukça uygundur, yüksek verimlilik ve kontrol edilebilir kaynaklar avantajına sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da vardır.

Dağıtık eğitim, günümüzde büyük model eğitiminde ana akım bir yöntemdir. Temelinde model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılarak işbirliği içinde yürütülmesi yatmaktadır. Bu, tek bir makinenin hesaplama ve depolama darboğazlarını aşmayı sağlamaktadır. Fiziksel olarak "dağıtık" özelliklere sahip olsa da, genel olarak merkezi bir kuruluş tarafından kontrol edilmekte, yönlendirilmekte ve senkronize edilmektedir. Genellikle yüksek hızlı yerel ağ ortamında çalışmakta ve NVLink yüksek hızlı bağlantı otobüs teknolojisi ile ana düğüm, alt görevleri koordine etmektedir. Ana akım yöntemler şunları içermektedir:

  • Veri paralelliği: Her bir düğüm farklı veri parametrelerini paylaşarak eğitilir, model ağırlıklarının eşleşmesi gerekir.
  • Model paralelliği: Modelin farklı kısımlarını farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak
  • Boru hattı paralelliği: Aşamalı seri yürütme, verimliliği artırır
  • Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel granulariteyi artırmak

Dağıtık eğitim, "merkezî kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun birden fazla "ofis" çalışanını uzaktan yönlendirmesiyle görevleri tamamlamasıyla benzerlik göstermektedir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim almaktadır.

Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Bunun temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinator olmadan eğitim görevlerini işbirliği içinde tamamlar, genellikle protokoller aracılığıyla görev dağıtımı ve işbirliği sağlanır ve katkıların dürüstlüğünü güvence altına almak için kripto teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:

  • Cihaz heterojenliği ve parçalama zorluğu: Heterojen cihazların koordinasyonu zordur, görev parçalama verimliliği düşüktür.
  • İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin
  • Güvenilir yürütme eksikliği: Güvenilir bir yürütme ortamının olmaması, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırır.
  • Tek bir koordinasyon eksikliği: Merkezi bir kontrol cihazı yok, görev dağıtımı ve hata geri alma mekanizmaları karmaşık.

Merkeziyetsizlik eğitimi, dünyanın dört bir yanındaki gönüllülerin, kendi hesaplama güçlerini birleştirerek model eğitimi yapması olarak anlaşılabilir. Ancak "gerçek anlamda uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğudur; bu, sistem mimarisi, iletişim protokolü, kripto güvenliği, ekonomik mekanizma, model doğrulama gibi birçok seviyeyi kapsamaktadır. Ancak "etkili iş birliği + dürüstlüğü teşvik etme + doğru sonuçlar" sağlanabilir mi, hala erken prototip keşif aşamasındadır.

Federal öğrenme, dağıtık ve Merkeziyetsizlik arasında bir geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular; gizlilik uyumuna odaklanan senaryolar için uygundur. Federal öğrenme, dağıtık eğitim mühendislik yapısına ve yerel iş birliği yeteneğine sahiptir, aynı zamanda Merkeziyetsizlik eğitimindeki veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında "kontrollü Merkeziyetsizlik" çözümü olarak görülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından oldukça ılımlıdır ve sanayi alanında geçiş aşamasındaki dağıtım yapısı olarak daha uygundur.

Kripto AI'nin Kutsal Kadehi: Merkeziyetsizlikle Eğitimdeki Sınırların Keşfi

Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları

Eğitim paradigması açısından, merkeziyetsiz eğitim tüm görev türlerine uygun değildir. Bazı durumlarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, heterojen, güvensiz düğümler arasında etkili bir şekilde tamamlanması doğal olarak uygun değildir. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, açık ağlarda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlaması olan görevler, hukuki uyum ve etik sınırlamalar nedeniyle açıkça paylaşılamaz; ve işbirliği teşviği eksik olan görevler dışsal katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitimin gerçek sınırlamalarını oluşturmaktadır.

Ancak bu, merkeziyetsizlik eğitiminin bir sahte kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, paralel olarak kolayca uygulanabilen ve teşvik edici görev türlerinde merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış uyumu sonrası eğitim görevleri, veri topluluğu eğitimi ve etiketleme görevleri, kaynak kontrolü altında küçük temel modellerin eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler, genel olarak yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özelliklere sahiptir; bu nedenle P2P ağları, Swarm protokolü, dağıtık optimizasyoncular gibi yöntemlerle işbirlikçi eğitim için oldukça uygundur.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminin öncü keşfi

Merkeziyetsizlik Eğitim Klasik Proje Analizi

Şu anda merkeziyetsizlik eğitimi ve federatif öğrenme öncülük alanında, temsilci blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif sunmaktadır ve mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise görece daha net olup, ilk mühendislik ilerlemeleri gözlemlenmektedir. Bu makalede, bu beş projenin arkasındaki temel teknoloji ve mühendislik mimarisi sırayla analiz edilecek ve merkeziyetsiz AI eğitim sistemi içindeki farklılıkları ve tamamlayıcı ilişkileri daha fazla tartışılacaktır.

Prime Intellect: Eğitim izleri doğrulanabilir pekiştirmeli öğrenme işbirlikçi ağı öncüsü

Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır; böylece herkes eğitim sürecine katılabilir ve hesaplamaya yaptıkları katkılara güvenilir ödüller alabilir. Prime Intellect, doğrulanabilir, açık ve ödüllendirme mekanizması tam olan AI merkeziyetsiz eğitim sistemini inşa etmek için PRIME-RL + TOPLOC + SHARDCAST üç ana modülünü kullanmayı hedeflemektedir.

Prime Intellect protokol yığını yapısı ve ana modül değeri

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik eğitiminin öncü keşfi

Prime Intellect eğitim ana mekanizmalarının detaylı açıklaması

PRIME-RL: Ayrık Asenkron Güçlendirme Öğrenimi Görev Mimarisi

PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özel olarak tasarlanmış bir görev modelleme ve uygulama çerçevesidir. Heterojen ağlar ve asenkron katılım için tasarlanmıştır. Renforç edilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanarak, eğitim, akıl yürütme ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız olarak görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve birleştirme mekanizmalarıyla işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir zamanlama olmadan esnek eğitimi gerçekleştirmek için daha uygundur, bu da sistem karmaşıklığını azaltır ve çoklu görev paralelliği ve strateji evrimi desteklemek için bir temel oluşturur.

TOPLOC:Ağırlığı az olan eğitim davranış doğrulama mekanizması

TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gerçekten gözlem verilerine dayanarak etkili bir strateji öğrenip öğrenmediğini belirlemek için kullanılan doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tüm model yeniden hesaplamasına bağımlı olmadan, "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk uygulamadır; bu, güvenmesiz eğitim ödül dağıtımını gerçekleştirmek için kritik bir yeniliktir ve denetlenebilir, teşvik edici merkeziyetsiz işbirliği eğitim ağı kurmak için uygulanabilir bir yol sunar.

SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü

SHARDCAST, Prime Intellect tarafından tasarlanmış bir ağırlık yayılımı ve birleştirme protokolüdür, asenkron, bant genişliği kısıtlı ve düğüm durumu değişken olan gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejilerini birleştirir, bu da farklı senkronizasyon durumlarındaki çoklu düğümlerin sürekli olarak kısmi güncellemeler göndermesine olanak tanır ve ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemleriyle karşılaştırıldığında, SHARDCAST, merkeziyetsizlik eğitiminin ölçeklenebilirliğini ve hata toleransını önemli ölçüde artırır ve istikrarlı bir ağırlık konsensüsü ile sürekli eğitim döngülerinin inşası için temel bir temeldir.

OpenDiLoCo:Seyrek Asenkron İletişim Çerçevesi

OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak uygulayıp açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsiz eğitimde sıkça karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta, sadece yerel komşu düğümlere dayanarak model işbirlikçi eğitimini tamamlamaktadır. Asenkron güncellemeler ve kesinti toleransı mekanizması ile OpenDiLoCo, tüketici seviyesindeki GPU'lar ve kenar cihazlarının da eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamakta, küresel işbirliği eğitimine katılabilirliği önemli ölçüde artırmakta ve merkeziyetsiz eğitim ağlarının temel iletişim altyapılarından biri olmaktadır.

PCCL: İşbirliği İletişim Kütüphanesi

PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak geliştirilmiş hafif iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlarda ve düşük bant genişliğine sahip ağlarda uyum sağlama sıkıntılarını çözmeyi amaçlamaktadır. PCCL, seyrek topolojileri, gradyan sıkıştırmasını, düşük hassasiyetli senkronizasyonu ve kesintiden kurtarmayı destekler, tüketici sınıfı GPU'lar ve istikrarsız düğümler üzerinde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen altyapı bileşenidir. Eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık, güvene ihtiyaç duymayan işbirlikçi eğitim ağlarının "son bir mil" iletişim altyapısını sağlamaktadır.

Prime Intellect teşvik ağı ve rol dağılımı

Prime Intellect, herkesin görevlere katılmasını ve gerçek katkılara dayalı ödüller kazanmasını sağlayan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı inşa etti. Protokol, üç ana rol türüne dayanarak çalışır:

  • Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlama
  • Eğitim düğümü: Yerel eğitimi yürütme, ağırlık güncellemelerini gönderme ve gözlem izini.
  • Doğrulama Düğümleri: Eğitim davranışının gerçekliğini TOPLOC mekanizması ile doğrulamak ve ödül hesaplaması ve strateji birleştirmeye katılmak

Protokolün temel süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içermektedir ve bu, "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngü oluşturmaktadır.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek

INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin piyasaya sürülmesi

Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü; bu, dünyanın ilk asenkron, güvene dayanmayan Merkeziyetsizlik düğümü işbirliği ile eğitilmiş güçlendirilmiş öğrenme büyük modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğüm tarafından işbirliği ile eğitilmiştir ve tamamen asenkron bir mimari kullanarak, eğitim süresi 400 saati aşmış ve asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermiştir. Bu model yalnızca bir performans atılımı değil, aynı zamanda Prime Intellect'in "eğitim, konsensüs demektir" paradigmalarının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, Merkeziyetsizlik eğitim ağının eğitim sürecinin açık, doğrulanabilir ve ekonomik hale getirildiğini işaret etmektedir.

PRIME-3.45%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 6
  • Share
Comment
0/400
MetaDreamervip
· 20h ago
Merkeziyetsizleştirme eğitimi yeniden dalga yaratıyor!
View OriginalReply0
CryptoMomvip
· 20h ago
Yine bilgi işlem gücü ile oynuyor.
View OriginalReply0
CryptoAdventurervip
· 20h ago
Yine BTC çiziyorlar. Bu tat çok keskin.
View OriginalReply0
HappyMinerUnclevip
· 20h ago
Bilgi İşlem Gücü çok pahalı, bu böyle.
View OriginalReply0
retroactive_airdropvip
· 20h ago
Biraz yorgun geliyor.
View OriginalReply0
BearMarketSurvivorvip
· 20h ago
Yine Bilgi İşlem Gücü olunca çevreye çıkılabiliyor mu? Oynamaya gücüm yetmiyor.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)