OpenAI, Yerel Cihazlara Son Teknoloji Modelleri Getiren Gpt-oss-120b ve Gpt-oss-20b'yi Piyasaya Sürüyor

Kısaca

OpenAI, internet erişimi olmadan gelişmiş yerel AI performansı sağlayan iki güçlü açık ağırlıklı model olan gpt-oss-120b ve gpt-oss-20b'yi piyasaya sürdü ve bu, geliştirici erişilebilirliğinde önemli bir adım anlamına geliyor.

OpenAI, Gpt-oss-120b ve Gpt-oss-20b'yi Tanıttı, En İyi Modelleri Yerel Cihazlara Getiriyor

Yapay zeka araştırma kuruluşu OpenAI, gpt-oss-120b ve gpt-oss-20b adlı iki gelişmiş açık ağırlıklı dil modelinin piyasaya sürüldüğünü duyurdu. Bu modeller, pratik uygulamalarda güçlü performans sunarken düşük işletim maliyetlerini koruyor. Esnek Apache 2.0 lisansı altında yayımlanan bu modeller, benzer boyuttaki diğer açık modelleri akıl yürütme görevlerinde geride bırakmakta, sağlam araç kullanma yetenekleri sergilemekte ve tüketici sınıfı donanımda verimli bir şekilde çalışacak şekilde optimize edilmektedir. Eğitim süreci, OpenAI’nin en ileri iç modellerinden, o3 ve diğer son teknoloji sistemlerden elde edilen içgörülerle birleştirilmiş pekiştirmeli öğrenme tekniklerini içermektedir.

gpt-oss-120b modeli, temel akıl yürütme benchmark'larında OpenAI'nin o4-mini modeli ile neredeyse eşit performans sergilemekte ve tek bir 80 GB GPU üzerinde verimli bir şekilde çalışmaktadır. Bu arada, gpt-oss-20b modeli, yaygın benchmark'larda OpenAI'nin o3-mini modeli ile karşılaştırılabilir sonuçlar elde etmekte ve yalnızca 16 GB bellek ile kenar cihazlarda çalışabilme kapasitesine sahip olduğu için cihaz içi uygulamalar, yerel çıkarım veya pahalı altyapı gerektirmeden hızlı testler için uygun hale gelmektedir. Her iki model de, Tau-Bench ajans değerlendirmesi ve HealthBench'te gösterildiği gibi, araç kullanma, az sayıda örnekle işlev çağırma, düşünce zinciri (CoT) akıl yürütme konularında güçlü yetenekler sergilemektedir ve bazı durumlarda OpenAI o1 ve GPT-4o gibi özel modellere göre daha iyi performans göstermektedir.

Bu modeller, Yanıtlar API'si ile uyumludur ve ajan iş akışları içinde entegre edilmek üzere tasarlanmıştır. Gelişmiş talimat takibi, web araması ve Python kodu yürütme gibi araç kullanımı ve akıl yürütme yetenekleri sunar. Bu, karmaşık akıl yürütme gerektirmeyen veya nihai çıktılarda düşük gecikmeyi önceliklendiren görevler için optimize etmek üzere ayarlanabilir akıl yürütme çabasını içerir. Her iki model de tamamen özelleştirilebilir, tam düşünce zinciri akıl yürütmesini destekler ve yapılandırılmış çıktı formatlarını barındırır.

Bu modellerin piyasaya sürülmesinde güvenlik dikkate alınması gereken en önemli unsurlardandır, özellikle açık doğaları göz önüne alındığında. Kapsamlı güvenlik eğitimi ve değerlendirmelerinin yanı sıra, OpenAI'nin Hazırlık Çerçevesi altında gpt-oss-120b'nin düşmanca bir şekilde ince ayar yapılmış versiyonu aracılığıyla ek bir test katmanı uygulanmıştır. gpt-oss modelleri, geliştiricilere benzer güvenlik güvenceleri sunarak, OpenAI'nin en son özel modelleri ile karşılaştırılabilir güvenlik standartları performansı elde etmektedir. Detaylı sonuçlar ve daha fazla bilgi, dış uzmanlar tarafından gözden geçirilen metodolojiyi içeren bir araştırma makalesi ve model kartında mevcuttur ve açık ağırlıklı modeller için yeni güvenlik standartlarının belirlenmesinde ilerlemeyi temsil etmektedir.

OpenAI, veri güvenliği için yerinde barındırma ve özel veri setlerinde ince ayar yapma da dahil olmak üzere bu açık modellerin gerçek dünya kullanımını keşfetmek için AI Sweden, Orange ve Snowflake gibi erken ortaklarla işbirliği yaptı. Bu açık modellerin mevcudiyeti, bireysel geliştiricilerden büyük işletmelere ve hükümet kuruluşlarına kadar geniş bir kullanıcı yelpazesini, kendi altyapılarında AI'yi çalıştırma ve özelleştirme konusunda güçlendirmeyi amaçlamaktadır. OpenAI’nin API'si aracılığıyla erişilebilen diğer modellerle birleştirildiğinde, geliştiriciler çeşitli AI iş akışlarını desteklemek için performans, maliyet ve gecikme arasında dengeli seçenekler seçebilirler.

Gpt-oss-120b ve Gpt-oss-20b Artık Geniş Platform ve Donanım Desteği ile Ücretsiz Olarak Mevcuttur

gpt-oss-120b ve gpt-oss-20b için ağırlıklar, Hugging Face'te indirmek için açıkça erişilebilir ve MXFP4 formatında yerel kuantizasyon ile sağlanmaktadır. Bu, gpt-oss-120b modelinin 80GB bellek kapasitesinde çalışmasını sağlarken, gpt-oss-20b modelinin yalnızca 16GB'a ihtiyacı vardır. Her iki model de harmony prompt formatı kullanılarak eğitim sonrası işlemlerden geçirilmiştir ve benimsenmeyi kolaylaştırmak için Python ve Rust'ta açık kaynaklı bir harmony render'ı mevcuttur. Ayrıca, PyTorch ve Apple'ın Metal platformu ile çıkarım yapmak için referans uygulamaları sağlanmakta ve pratik uygulama için bir dizi örnek aracı sunulmaktadır.

Bu modeller, yerel olarak, cihazda veya üçüncü taraf çıkarım sağlayıcıları aracılığıyla dağıtım desteği sunarak esneklik ve kullanım kolaylığı için tasarlanmıştır. Erişilebilirliği artırmak için, Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare ve OpenRouter gibi büyük dağıtım platformlarıyla lansmandan önce ortaklıklar kurulmuştur. Ayrıca, çeşitli sistemler arasında optimal performansı sağlamak için NVIDIA, AMD, Cerebras ve Groq gibi donanım üreticileriyle işbirliği yapılmıştır.

Bu sürümle birlikte, Microsoft Windows cihazları için gpt-oss-20b modelinin GPU optimizasyonlu sürümlerini sunuyor. ONNX Runtime ile desteklenen bu sürümler, yerel çıkarımı destekler ve Foundry Local ile VS Code için AI Toolkit aracılığıyla erişilebilir, bu da Windows platformlarındaki geliştiriciler için entegrasyon sürecini basitleştirir.

Tamamen özelleştirilebilir, ince ayar yapabilen ve kendi ortamlarında dağıtım için uygun modeller arayan geliştiriciler için gpt-oss modelleri uygun bir çözüm sunmaktadır. Bununla birlikte, çok modlu yetenekler, yerleşik araçlar ve sorunsuz platform entegrasyonu gerektirenler için API platformu aracılığıyla sunulan modeller tercih edilen seçenektir. Geliştirici geri bildirimleri izlenmeye devam etmekte olup, gpt-oss modellerinin gelecekteki API desteği için potansiyel olarak değerlendirilecektir.

gpt-oss-120b ve gpt-oss-20b'nin tanıtımı, açık ağırlık modelleri alanında önemli bir ilerlemeyi temsil ederek, ölçeklerinde akıl yürütme yetenekleri ve güvenlikte önemli iyileştirmeler sunmaktadır. Bu açık modeller, geliştiricilere keskin araştırmaları kolaylaştırmak, yeniliği teşvik etmek ve çeşitli uygulamalar boyunca daha güvenli, daha şeffaf AI geliştirmeyi desteklemek için daha geniş bir araç seçkisi sunarak, özel barındırılan modellere tamamlayıcı bir nitelik taşımaktadır.

Ayrıca, bu açık modeller, özel çözümleri benimsemede kısıtlamalarla karşılaşabilecek gelişen pazarlar, kaynak sınırlı sektörler ve daha küçük organizasyonlar için giriş engellerini azaltmaya yardımcı olur. Erişilebilir ve güçlü araçlar sunarak, dünya genelindeki kullanıcılar geliştirme, yenilik yapma ve yeni fırsatlar yaratma konusunda güçlendirilir. Amerika Birleşik Devletleri'nde üretilen bu yetenekli açık ağırlıklı modellerin yaygın olarak mevcut olması, adil AI erişiminin genişlemesine katkıda bulunur.

Açık modellerin güvenilir bir ekosistemi, geniş ve kapsayıcı AI erişimini teşvik etmede önemli bir bileşendir. Geliştiriciler ve araştırmacılar, bu modelleri deneme, iş birliği yapma ve ulaşılabilirliğin sınırlarını zorlama amacıyla kullanmaları teşvik edilmektedir. Bu alandaki devam eden ilerleme ilgiyle beklenmektedir.

GPT-0.95%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)