OpenAI telah merilis dua model open-weight yang kuat, gpt-oss-120b dan gpt-oss-20b, memungkinkan kinerja AI lokal yang canggih tanpa akses internet, menandai langkah besar dalam aksesibilitas pengembang.
Organisasi penelitian kecerdasan buatan OpenAI mengumumkan peluncuran dua model bahasa open-weight canggih bernama gpt-oss-120b dan gpt-oss-20b. Model-model ini menawarkan kinerja yang kuat dalam aplikasi praktis sambil mempertahankan biaya operasional yang rendah. Diluncurkan di bawah lisensi Apache 2.0 yang fleksibel, mereka melampaui model open lainnya dengan ukuran serupa dalam tugas penalaran, menunjukkan kemampuan penggunaan alat yang kuat, dan dioptimalkan untuk operasi yang efisien pada perangkat keras kelas konsumen. Proses pelatihan melibatkan teknik pembelajaran penguatan yang dikombinasikan dengan wawasan yang diperoleh dari model internal OpenAI yang paling maju, termasuk o3 dan sistem mutakhir lainnya.
Model gpt-oss-120b hampir setara dengan model o4-mini dari OpenAI dalam tolok ukur penalaran dasar dan berjalan efisien di satu GPU 80 GB. Sementara itu, model gpt-oss-20b mencapai hasil yang sebanding dengan o3-mini dari OpenAI pada tolok ukur umum dan mampu beroperasi pada perangkat edge dengan hanya 16 GB memori, menjadikannya cocok untuk aplikasi di perangkat, inferensi lokal, atau pengujian cepat tanpa memerlukan infrastruktur yang mahal. Kedua model menunjukkan kemampuan yang kuat dalam penggunaan alat, pemanggilan fungsi few-shot, penalaran chain-of-thought (CoT) seperti yang ditunjukkan dalam evaluasi agen Tau-Bench, dan HealthBench, terkadang mengungguli model proprietary seperti OpenAI o1 dan GPT-4o.
Model-model ini kompatibel dengan Responses API dan dirancang untuk terintegrasi dalam alur kerja agen, menawarkan kemampuan mengikuti instruksi yang canggih, penggunaan alat termasuk pencarian web dan eksekusi kode Python, serta kemampuan penalaran. Ini termasuk upaya penalaran yang bisa disesuaikan untuk mengoptimalkan tugas yang tidak memerlukan penalaran kompleks atau yang memprioritaskan latensi rendah dalam output akhir. Kedua model sepenuhnya dapat disesuaikan, mendukung penalaran penuh berdasarkan rantai pemikiran, dan mengakomodasi format output terstruktur.
Pertimbangan keselamatan adalah hal utama dalam rilis model-model ini, terutama mengingat sifatnya yang terbuka. Bersamaan dengan pelatihan dan evaluasi keselamatan yang komprehensif, lapisan tambahan pengujian diterapkan melalui versi gpt-oss-120b yang disempurnakan secara adversarial di bawah Kerangka Kesiapan OpenAI. Model gpt-oss mencapai kinerja tolok ukur keselamatan yang sebanding dengan model-proprietari terbaru OpenAI, memberikan jaminan keselamatan yang serupa kepada para pengembang. Hasil terperinci dan informasi lebih lanjut tersedia dalam makalah penelitian dan kartu model, dengan metodologi yang ditinjau oleh para ahli eksternal, mewakili kemajuan dalam menetapkan standar keselamatan baru untuk model dengan bobot terbuka.
OpenAI telah bekerja sama dengan mitra awal seperti AI Sweden, Orange, dan Snowflake untuk mengeksplorasi penggunaan nyata dari model-model terbuka ini, termasuk hosting di tempat untuk keamanan data dan penyesuaian pada dataset khusus. Ketersediaan model-model terbuka ini bertujuan untuk memberdayakan berbagai pengguna—dari pengembang individu hingga perusahaan besar dan entitas pemerintah—untuk menjalankan dan menyesuaikan AI di infrastruktur mereka sendiri. Ketika digabungkan dengan model-model lain yang dapat diakses melalui API OpenAI, pengembang dapat memilih dari berbagai opsi yang menyeimbangkan kinerja, biaya, dan latensi untuk mendukung alur kerja AI yang beragam.
Gpt-oss-120b Dan Gpt-oss-20b Sekarang Tersedia Secara Gratis Dengan Dukungan Platform Dan Perangkat Keras Yang Luas
Bobot untuk gpt-oss-120b dan gpt-oss-20b dapat diunduh secara terbuka di Hugging Face dan disediakan dengan kuantisasi asli dalam format MXFP4. Ini memungkinkan model gpt-oss-120b beroperasi dalam kapasitas memori 80GB, sementara model gpt-oss-20b hanya memerlukan 16GB. Kedua model telah menjalani pelatihan pasca menggunakan format prompt harmoni, dan renderer harmoni sumber terbuka tersedia dalam Python dan Rust untuk memfasilitasi adopsi. Selain itu, implementasi referensi disediakan untuk menjalankan inferensi menggunakan PyTorch dan platform Metal dari Apple, bersama dengan seperangkat alat contoh untuk aplikasi praktis.
Model-model ini dirancang untuk fleksibilitas dan kemudahan penggunaan, mendukung penerapan secara lokal, di perangkat, atau melalui penyedia inferensi pihak ketiga. Untuk meningkatkan aksesibilitas, kemitraan dibentuk sebelum peluncuran dengan platform penerapan utama termasuk Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, dan OpenRouter. Kolaborasi dengan produsen perangkat keras seperti NVIDIA, AMD, Cerebras, dan Groq juga dilakukan untuk memastikan kinerja optimal di berbagai sistem.
Seiring dengan rilis ini, Microsoft menghadirkan versi yang dioptimalkan GPU dari model gpt-oss-20b untuk perangkat Windows. Didukung oleh ONNX Runtime, versi ini mendukung inferensi lokal dan dapat diakses melalui Foundry Local dan AI Toolkit untuk VS Code, menyederhanakan proses integrasi bagi pengembang di platform Windows.
Untuk pengembang yang mencari model yang sepenuhnya dapat disesuaikan yang mampu disesuaikan dan diterapkan dalam lingkungan mereka sendiri, model gpt-oss menyediakan solusi yang sesuai. Sebaliknya, bagi mereka yang memerlukan kemampuan multimodal, alat bawaan, dan integrasi platform yang mulus, model yang ditawarkan melalui platform API tetap menjadi pilihan yang diutamakan. Umpan balik pengembang terus dipantau, dengan kemungkinan pertimbangan untuk dukungan API di masa depan untuk model gpt-oss.
Pengenalan gpt-oss-120b dan gpt-oss-20b merupakan kemajuan yang signifikan di bidang model berat terbuka, memberikan peningkatan yang berarti dalam kemampuan penalaran dan keamanan pada skala mereka. Model terbuka ini melengkapi model berlisensi yang dihosting dengan menawarkan pengembang pilihan alat yang lebih luas untuk memfasilitasi penelitian mutakhir, merangsang inovasi, dan mempromosikan pengembangan AI yang lebih aman dan transparan di berbagai aplikasi.
Selain itu, model terbuka ini membantu mengurangi hambatan masuk bagi pasar yang sedang berkembang, sektor yang terbatas sumber daya, dan organisasi yang lebih kecil yang mungkin menghadapi kendala dalam mengadopsi solusi kepemilikan. Dengan menyediakan alat yang dapat diakses dan kuat, pengguna di seluruh dunia diberdayakan untuk mengembangkan, berinovasi, dan menciptakan peluang baru. Ketersediaan luas model berbobot terbuka yang mampu yang diproduksi di Amerika Serikat berkontribusi pada perluasan akses AI yang adil.
Ekosistem model terbuka yang andal adalah komponen penting dalam mempromosikan aksesibilitas AI yang luas dan inklusif. Para pengembang dan peneliti didorong untuk memanfaatkan model-model ini untuk eksperimen, kolaborasi, dan mendorong batasan dari apa yang dapat dicapai. Kemajuan yang terus berlangsung di bidang ini diharapkan dengan minat.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
OpenAI Meluncurkan Gpt-oss-120b Dan Gpt-oss-20b, Membawa Model Terdepan Ke Perangkat Lokal
Secara Singkat
OpenAI telah merilis dua model open-weight yang kuat, gpt-oss-120b dan gpt-oss-20b, memungkinkan kinerja AI lokal yang canggih tanpa akses internet, menandai langkah besar dalam aksesibilitas pengembang.
Organisasi penelitian kecerdasan buatan OpenAI mengumumkan peluncuran dua model bahasa open-weight canggih bernama gpt-oss-120b dan gpt-oss-20b. Model-model ini menawarkan kinerja yang kuat dalam aplikasi praktis sambil mempertahankan biaya operasional yang rendah. Diluncurkan di bawah lisensi Apache 2.0 yang fleksibel, mereka melampaui model open lainnya dengan ukuran serupa dalam tugas penalaran, menunjukkan kemampuan penggunaan alat yang kuat, dan dioptimalkan untuk operasi yang efisien pada perangkat keras kelas konsumen. Proses pelatihan melibatkan teknik pembelajaran penguatan yang dikombinasikan dengan wawasan yang diperoleh dari model internal OpenAI yang paling maju, termasuk o3 dan sistem mutakhir lainnya.
Model gpt-oss-120b hampir setara dengan model o4-mini dari OpenAI dalam tolok ukur penalaran dasar dan berjalan efisien di satu GPU 80 GB. Sementara itu, model gpt-oss-20b mencapai hasil yang sebanding dengan o3-mini dari OpenAI pada tolok ukur umum dan mampu beroperasi pada perangkat edge dengan hanya 16 GB memori, menjadikannya cocok untuk aplikasi di perangkat, inferensi lokal, atau pengujian cepat tanpa memerlukan infrastruktur yang mahal. Kedua model menunjukkan kemampuan yang kuat dalam penggunaan alat, pemanggilan fungsi few-shot, penalaran chain-of-thought (CoT) seperti yang ditunjukkan dalam evaluasi agen Tau-Bench, dan HealthBench, terkadang mengungguli model proprietary seperti OpenAI o1 dan GPT-4o.
Model-model ini kompatibel dengan Responses API dan dirancang untuk terintegrasi dalam alur kerja agen, menawarkan kemampuan mengikuti instruksi yang canggih, penggunaan alat termasuk pencarian web dan eksekusi kode Python, serta kemampuan penalaran. Ini termasuk upaya penalaran yang bisa disesuaikan untuk mengoptimalkan tugas yang tidak memerlukan penalaran kompleks atau yang memprioritaskan latensi rendah dalam output akhir. Kedua model sepenuhnya dapat disesuaikan, mendukung penalaran penuh berdasarkan rantai pemikiran, dan mengakomodasi format output terstruktur.
Pertimbangan keselamatan adalah hal utama dalam rilis model-model ini, terutama mengingat sifatnya yang terbuka. Bersamaan dengan pelatihan dan evaluasi keselamatan yang komprehensif, lapisan tambahan pengujian diterapkan melalui versi gpt-oss-120b yang disempurnakan secara adversarial di bawah Kerangka Kesiapan OpenAI. Model gpt-oss mencapai kinerja tolok ukur keselamatan yang sebanding dengan model-proprietari terbaru OpenAI, memberikan jaminan keselamatan yang serupa kepada para pengembang. Hasil terperinci dan informasi lebih lanjut tersedia dalam makalah penelitian dan kartu model, dengan metodologi yang ditinjau oleh para ahli eksternal, mewakili kemajuan dalam menetapkan standar keselamatan baru untuk model dengan bobot terbuka.
OpenAI telah bekerja sama dengan mitra awal seperti AI Sweden, Orange, dan Snowflake untuk mengeksplorasi penggunaan nyata dari model-model terbuka ini, termasuk hosting di tempat untuk keamanan data dan penyesuaian pada dataset khusus. Ketersediaan model-model terbuka ini bertujuan untuk memberdayakan berbagai pengguna—dari pengembang individu hingga perusahaan besar dan entitas pemerintah—untuk menjalankan dan menyesuaikan AI di infrastruktur mereka sendiri. Ketika digabungkan dengan model-model lain yang dapat diakses melalui API OpenAI, pengembang dapat memilih dari berbagai opsi yang menyeimbangkan kinerja, biaya, dan latensi untuk mendukung alur kerja AI yang beragam.
Gpt-oss-120b Dan Gpt-oss-20b Sekarang Tersedia Secara Gratis Dengan Dukungan Platform Dan Perangkat Keras Yang Luas
Bobot untuk gpt-oss-120b dan gpt-oss-20b dapat diunduh secara terbuka di Hugging Face dan disediakan dengan kuantisasi asli dalam format MXFP4. Ini memungkinkan model gpt-oss-120b beroperasi dalam kapasitas memori 80GB, sementara model gpt-oss-20b hanya memerlukan 16GB. Kedua model telah menjalani pelatihan pasca menggunakan format prompt harmoni, dan renderer harmoni sumber terbuka tersedia dalam Python dan Rust untuk memfasilitasi adopsi. Selain itu, implementasi referensi disediakan untuk menjalankan inferensi menggunakan PyTorch dan platform Metal dari Apple, bersama dengan seperangkat alat contoh untuk aplikasi praktis.
Model-model ini dirancang untuk fleksibilitas dan kemudahan penggunaan, mendukung penerapan secara lokal, di perangkat, atau melalui penyedia inferensi pihak ketiga. Untuk meningkatkan aksesibilitas, kemitraan dibentuk sebelum peluncuran dengan platform penerapan utama termasuk Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare, dan OpenRouter. Kolaborasi dengan produsen perangkat keras seperti NVIDIA, AMD, Cerebras, dan Groq juga dilakukan untuk memastikan kinerja optimal di berbagai sistem.
Seiring dengan rilis ini, Microsoft menghadirkan versi yang dioptimalkan GPU dari model gpt-oss-20b untuk perangkat Windows. Didukung oleh ONNX Runtime, versi ini mendukung inferensi lokal dan dapat diakses melalui Foundry Local dan AI Toolkit untuk VS Code, menyederhanakan proses integrasi bagi pengembang di platform Windows.
Untuk pengembang yang mencari model yang sepenuhnya dapat disesuaikan yang mampu disesuaikan dan diterapkan dalam lingkungan mereka sendiri, model gpt-oss menyediakan solusi yang sesuai. Sebaliknya, bagi mereka yang memerlukan kemampuan multimodal, alat bawaan, dan integrasi platform yang mulus, model yang ditawarkan melalui platform API tetap menjadi pilihan yang diutamakan. Umpan balik pengembang terus dipantau, dengan kemungkinan pertimbangan untuk dukungan API di masa depan untuk model gpt-oss.
Pengenalan gpt-oss-120b dan gpt-oss-20b merupakan kemajuan yang signifikan di bidang model berat terbuka, memberikan peningkatan yang berarti dalam kemampuan penalaran dan keamanan pada skala mereka. Model terbuka ini melengkapi model berlisensi yang dihosting dengan menawarkan pengembang pilihan alat yang lebih luas untuk memfasilitasi penelitian mutakhir, merangsang inovasi, dan mempromosikan pengembangan AI yang lebih aman dan transparan di berbagai aplikasi.
Selain itu, model terbuka ini membantu mengurangi hambatan masuk bagi pasar yang sedang berkembang, sektor yang terbatas sumber daya, dan organisasi yang lebih kecil yang mungkin menghadapi kendala dalam mengadopsi solusi kepemilikan. Dengan menyediakan alat yang dapat diakses dan kuat, pengguna di seluruh dunia diberdayakan untuk mengembangkan, berinovasi, dan menciptakan peluang baru. Ketersediaan luas model berbobot terbuka yang mampu yang diproduksi di Amerika Serikat berkontribusi pada perluasan akses AI yang adil.
Ekosistem model terbuka yang andal adalah komponen penting dalam mempromosikan aksesibilitas AI yang luas dan inklusif. Para pengembang dan peneliti didorong untuk memanfaatkan model-model ini untuk eksperimen, kolaborasi, dan mendorong batasan dari apa yang dapat dicapai. Kemajuan yang terus berlangsung di bidang ini diharapkan dengan minat.