OpenAI выпустила o1 — свою первую модель со способностью рассуждать
- 13.09.2024, 07:08,
- Интересное
- 0
Она сама может проверять факты и исправлять ошибки.
Макс Вильтовский Автор Лайфхакера
Избранное
сообщалось, был засекречен даже внутри компании.
Изображение: OpenAIЭто очередной шаг создателей ChatGPT к своей ключевой цели — созданию искусственного интеллекта, сравнимого с человеческим разумом. Если говорить о практических новшествах, то новинка лучше справляется с написанием кода и решением многошаговых задач по сравнению с предшественниками. Но она также дороже и медленнее. Поэтому для повседневных дел лучше использовать старые инструменты. Модель также способна самостоятельно исправлять ошибки, используя технику обучение с подкреплением (Reinforcement Learning, RL) — систему поощрений и штрафов. Ещё она умеет запускать «цепочку мыслей» для обработки запросов, подобно тому, как люди справляются с трудностями — шаг за шагом. Другими словами, она сама может проверять себя и делать определённые выводы на будущее, сохраняя их в своей памяти. При всём этом полностью избавиться от галлюцинаций ещё не удалось, признались разработчики. Проблема остаётся, но уже в гораздо меньшей степени. Зато в математике она уже почти как рыба в воде. Для сравнения: GPT-4o правильно решила только 13% задач из программы Международной математической олимпиады, а o1 набрала 83%. Она определённо лучше справляется с тестом по математике AP, чем я, а я изучал математику в колледже. Боб МакГрю Главный научный сотрудник OpenAIОбучение, лежащее в основе o1, принципиально отличается от предыдущих методов, рассказал руководитель исследований в компании Джерри Творек. С ней использовали другие алгоритмы и новый набор данных. Компания называет релиз «предварительным просмотром», чтобы подчеркнуть, что она ещё молода.Пользователи ChatGPT Plus и Team получают o1 и o1-mini уже сегодня. Клиенты Enterprise и Edu смогут начать испытывать их в начале следующей недели. Позже OpenAI обещает сделать «мини» общедоступной.
Лайфхакер
рейтинг:
- +430