OpenAI запускає Gpt-oss-120b та Gpt-oss-20b, приносячи найсучасніші моделі на локальні пристрої

Коротко

OpenAI випустила дві потужні моделі з відкритими вагами, gpt-oss-120b та gpt-oss-20b, що забезпечують передову локальну продуктивність ШІ без доступу до Інтернету, що є великим кроком у доступності для розробників.

OpenAI запускає Gpt-oss-120b та Gpt-oss-20b, приносячи найсучасніші моделі на локальні пристрої

Організація досліджень штучного інтелекту OpenAI оголосила про випуск двох розвинених мовних моделей з відкритими вагами, які називаються gpt-oss-120b та gpt-oss-20b. Ці моделі демонструють високу продуктивність у практичних застосуваннях, зберігаючи при цьому низькі експлуатаційні витрати. Випущені під гнучкою ліцензією Apache 2.0, вони перевершують інші відкриті моделі подібного розміру в завданнях на міркування, проявляють надійні можливості використання інструментів і оптимізовані для ефективної роботи на обладнанні споживчого класу. Процес навчання включав техніки навчання з підкріпленням у поєднанні з ідеями, отриманими з найсучасніших внутрішніх моделей OpenAI, включаючи o3 та інші передові системи.

Модель gpt-oss-120b працює майже на одному рівні з моделлю o4-mini від OpenAI за основними стандартами мислення та ефективно працює на одному 80 ГБ графічному процесорі. Тим часом модель gpt-oss-20b досягає результатів, порівнянних з o3-mini від OpenAI за загальними стандартами, і здатна працювати на крайових пристроях з лише 16 ГБ пам'яті, що робить її придатною для застосувань на пристрої, локального висновку або швидкого тестування без необхідності дорогих інфраструктур. Обидві моделі демонструють сильні можливості у використанні інструментів, викликах функцій у кількох прикладах, міркуваннях у ланцюзі думок (CoT), як показано в оцінці агентів Tau-Bench, та HealthBench, іноді перевершуючи власницькі моделі, такі як OpenAI o1 та GPT-4o.

Ці моделі сумісні з API відповідей і розроблені для інтеграції в агентні робочі процеси, пропонуючи розширене виконання інструкцій, використання інструментів, включаючи веб-пошук і виконання коду Python, а також можливості міркування. Це включає в себе регульовані зусилля міркування для оптимізації завдань, які не потребують складного міркування або які надають пріоритет низькій затримці у фінальних виходах. Обидві моделі повністю налаштовуються, підтримують повне міркування в ланцюгу думок і приймають структуровані формати виходу.

Безпекові міркування є центральними для випуску цих моделей, особливо зважаючи на їх відкриту природу. Поряд із всебічним навчанням з безпеки та оцінками, додатковий рівень тестування був застосований через суперечливо налаштовану версію gpt-oss-120b відповідно до Рамки готовності OpenAI. Моделі gpt-oss досягають показників безпеки, які порівнянні з останніми власницькими моделями OpenAI, надаючи розробникам подібні запевнення в безпеці. Докладні результати та додаткова інформація доступні в науковій статті та картці моделі, з методологією, перевіреною зовнішніми експертами, що представляє прогрес у встановленні нових стандартів безпеки для моделей з відкритою вагою.

OpenAI співпрацювала з ранніми партнерами, такими як AI Sweden, Orange і Snowflake, щоб дослідити реальні варіанти використання цих відкритих моделей, включаючи локальне розміщення для безпеки даних та тонке налаштування на спеціалізованих наборах даних. Доступність цих відкритих моделей має на меті надати можливості широкому спектру користувачів — від окремих розробників до великих підприємств та державних установ — запускати та налаштовувати ШІ на своїй власній інфраструктурі. У поєднанні з іншими моделями, доступними через API OpenAI, розробники можуть вибрати з ряду варіантів, які забезпечують баланс між продуктивністю, вартістю та затримкою для підтримки різноманітних робочих процесів ШІ.

Gpt-oss-120b та Gpt-oss-20b тепер вільно доступні з широкою підтримкою платформи та апаратних засобів

Ваги для обох моделей gpt-oss-120b та gpt-oss-20b відкрито доступні для завантаження на Hugging Face та надаються з рідною квантизацією у форматі MXFP4. Це дозволяє моделі gpt-oss-120b працювати в межах 80 ГБ оперативної пам'яті, тоді як моделі gpt-oss-20b потрібно лише 16 ГБ. Обидві моделі пройшли посттренування з використанням формату підказок harmony, і доступний відкритий рендерер harmony на Python та Rust для сприяння впровадженню. Крім того, надано референсні реалізації для виконання інференції з використанням PyTorch та платформи Metal від Apple, разом із набором прикладних інструментів для практичного застосування.

Ці моделі розроблені для гнучкості та простоти використання, підтримуючи розгортання локально, на пристрої або через сторонні постачальники інференції. Для покращення доступності партнерства були встановлені перед запуском з основними платформами розгортання, включаючи Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare та OpenRouter. Також було проведено співпрацю з виробниками апаратного забезпечення, такими як NVIDIA, AMD, Cerebras і Groq, щоб забезпечити оптимальну продуктивність на різних системах.

У зв'язку з цим випуском Microsoft випускає оптимізовані для GPU версії моделі gpt-oss-20b для пристроїв Windows. Працюючи на ONNX Runtime, ці версії підтримують локальну інференцію і доступні через Foundry Local та AI Toolkit для VS Code, спрощуючи процес інтеграції для розробників на платформах Windows.

Для розробників, які шукають повністю налаштовувані моделі, здатні до тонкої настройки та розгортання у власних середовищах, моделі gpt-oss є відповідним рішенням. З іншого боку, для тих, хто потребує мультимодальних можливостей, вбудованих інструментів і безшовної інтеграції платформи, моделі, які пропонуються через API платформу, залишаються переважним вибором. Зворотний зв'язок від розробників продовжує моніторитися, з можливим розглядом підтримки моделей gpt-oss через API у майбутньому.

Введення gpt-oss-120b та gpt-oss-20b є помітним досягненням у сфері моделей з відкритою вагою, забезпечуючи значні покращення в здатностях до міркування та безпеки на їхньому масштабі. Ці відкриті моделі доповнюють власні моделі, що розміщуються, пропонуючи розробникам ширший вибір інструментів для сприяння передовим дослідженням, стимулювання інновацій та просування безпечнішого, більш прозорого розвитку штучного інтелекту в різних застосуваннях.

Крім того, ці відкриті моделі допомагають знизити бар'єри входу для ринків, що розвиваються, секторів з обмеженими ресурсами та менших організацій, які можуть стикатися з обмеженнями у впровадженні власницьких рішень. Забезпечуючи доступні та потужні інструменти, користувачі по всьому світу отримують можливість розвивати, інновувати та створювати нові можливості. Широка доступність цих здатних відкритих моделей ваги, вироблених у Сполучених Штатах, сприяє розширенню справедливого доступу до штучного інтелекту.

Надійна екосистема відкритих моделей є важливим компонентом у сприянні широкій та інклюзивній доступності штучного інтелекту. Розробників і дослідників заохочують використовувати ці моделі для експериментів, співпраці та розширення меж досяжного. Постійний прогрес у цій галузі викликає інтерес.

GPT-1.42%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити