OpenAI o1

o1
Тип Генеративная предварительно обученная трансформерная модель
Разработчик OpenAI
Дата выпуска 12 сентября 2024
Тестовая версия (12 сентября 2024; 20 месяцев назад (2024-09-12))
Сайт openai.com/o1/ (англ.)

OpenAI o1 — это генеративная предварительно обученная трансформерная модель (GPT). Превью o1 было выпущено компанией OpenAI 12 сентября 2024 года. o1 затрачивает время на «размышления» перед ответом, что делает его более способным к сложным задачам рассуждения, научным и программным задачам по сравнению с GPT-4o[1]. Полная версия была выпущена для пользователей ChatGPT 5 декабря 2024 года[2].

История

Предыстория

Согласно утечкам информации, o1 ранее был известен внутри OpenAI как «Q*», а затем как «Strawberry»[3]. Кодовое название «Q*» впервые появилось в ноябре 2023 года, во время отстранения и последующего восстановления Сэма Альтмана, когда появились слухи, что эта экспериментальная модель показала многообещающие результаты в математических тестах[4]. В июле 2024 года Reuters сообщил, что OpenAI разрабатывает генеративную предварительно обученную трансформерную модель, известную как «Strawberry»[3], которая позже стала o1.

Выпуск

«o1-preview» и «o1-mini» были выпущены 12 сентября 2024 года для пользователей ChatGPT Plus и Team[1]. GitHub начал тестировать интеграцию o1-preview в своей службе Copilot в тот же день[5]. 5 декабря 2024 года была выпущена полная версия o1[6].

Возможности

OpenAI утверждает, что o1 был обучен с использованием нового алгоритма оптимизации и специально подобранного набора данных, а также интеграции обучения с подкреплением в процесс обучения[7]. С января 2025 года, использование API для полной модели o1 будет ограничено для разработчиков и будет тарифицироваться пользователям по ценам уровня 5[8]. По словам OpenAI, o1 не заменяет GPT-4o, а дополняет его[9][10].

o1 затрачивает дополнительное время на размышления (генерацию цепочки рассуждений), что делает его лучше при решении сложных задач, особенно в науке и математике[1].

Ограничения

o1 требует больше вычислительных ресурсов, чем другие модели GPT от OpenAI, так как генерирует длинные цепочки рассуждений перед выдачей ответа[11].

См. также

Примечания

  1. 1 2 3 Metz, Cade. OpenAI Unveils New ChatGPT That Can Reason Through Math and Science. The New York Times (12 сентября 2024). Дата обращения: 12 сентября 2024.
  2. Introducing OpenAI o1. OpenAI. Дата обращения: 6 декабря 2024.
  3. 1 2 Tong, Anna; Paul, Katie. Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry'. Reuters (15 июля 2024). Дата обращения: 12 сентября 2024.
  4. OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say. Reuters. 23 ноября 2023.
  5. Peters, Jay. GitHub has started testing OpenAI's o1-preview in GitHub Copilot. The Verge (12 сентября 2024). Дата обращения: 12 сентября 2024.
  6. Robison, Kylie (5 декабря 2024). OpenAI is charging $200 a month for an exclusive version of its o1 'reasoning' model. The Verge. Дата обращения: 5 декабря 2024.
  7. Robison, Kylie. OpenAI releases o1, its first model with 'reasoning' abilities (англ.). The Verge (12 сентября 2024). Дата обращения: 15 сентября 2024.
  8. OpenAI o1 and new tools for developers (амер. англ.). openai.com. Дата обращения: 26 января 2025.
  9. Knight, Will. OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step. Wired (амер. англ.). ISSN 1059-1028. Дата обращения: 15 сентября 2024.
  10. New reasoning models: OpenAI o1-preview and o1-mini (англ.). OpenAI Developer Forum (12 сентября 2024). Дата обращения: 17 октября 2024.
  11. Learning to Reason with LLMs. OpenAI. Дата обращения: 13 сентября 2024. Архивировано 12 сентября 2024 года.

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.