OpenAI представила GPT-5.6 Sol, Terra и Luna, но с ограниченным доступом
OpenAI запустила свою новую языковую модель GPT-5.6, однако её использование пока практически недоступно. Причина в том, что по распоряжению правительства США модель распространяется только среди нескольких специально авторизованных организаций. Тем не менее, лаборатория ИИ уже представила обзор возможностей этой модели, которая станет конкурентом Mythos.
GPT-5.6 стала доступна через два месяца после предыдущей версии большой языковой модели OpenAI. Впрочем, "доступна" — это громко сказано. В соответствии с указом президента Трампа, компания ограничивает развертывание избранными организациями и предприятиями. OpenAI надеется, что сможет распространить модель как можно шире «в ближайшие недели».
GPT-5.6 за барьерами безопасности
Эта ситуация далека от идеальной и невыгодна для OpenAI. «Мы не считаем, что подобный процесс государственного контроля доступа должен стать нормой в долгосрочной перспективе», — заявляет компания. «Он лишает лучших инструментов пользователей, разработчиков, компании, специалистов по кибербезопасности и международных партнеров, которые в них нуждаются», — добавляет она. OpenAI продолжает работать с администрацией Трампа над улучшением условий президентского указа по кибербезопасности.
GPT-5.6: Модель, которую пока можно наблюдать издалека
Таким образом, пока придётся довольствоваться GPT-5.5, прежде чем появится возможность оценить его преемников на практике. Или, точнее, его преемников, поскольку OpenAI выбрала три версии своей модели:
- GPT-5.6 Sol – позиционируется как самая мощная модель в линейке. OpenAI утверждает, что она лучше всего подходит для самых сложных задач, таких как кодирование, длительные рассуждения, биология, кибербезопасность и агентские применения. Sol также оснащена самыми строгими защитными механизмами.
- GPT-5.6 Terra – промежуточная модель, разработанная для повседневного использования с балансом производительности и стоимости. Ожидается, что её производительность будет на уровне GPT-5.5, при этом она будет вдвое дешевле, обещает OpenAI.
- GPT-5.6 Luna – быстрая и доступная модель в линейке. Она предназначена для сценариев, где скорость и цена важнее чистой производительности.
Эту линейку можно рассматривать как своего рода аналог моделей Anthropic: Haiku, Sonnet и Opus.
Предлагается два режима использования: «max», который дает GPT-5.6 Sol больше времени для рассуждений над сложными задачами, и «ultra», который задействует несколько агентов, способных работать параллельно над более масштабными задачами.
GPT-5.6 Sol, таким образом, демонстрирует особую эффективность в задачах, связанных с кодированием. В бенчмарке Terminal‑Bench 2.1 стандартная и Ultra-версии показывают результаты немного выше, чем у Mythos 5. Однако OpenAI особо подчеркивает возможности модели в области кибербезопасности (поиск уязвимостей и их эксплуатация). Sol конкурирует с Mythos Preview на ExploitBench, используя при этом лишь треть токенов на выходе.
Безопасность во главе угла
OpenAI заверяет, что эти мощные возможности строго регулируются. Вся система безопасности вокруг GPT-5.6 Sol была усилена: защитные механизмы интегрированы непосредственно в модель, внедрены системы обнаружения в реальном времени, контроль на уровне учетных записей и дифференцированный доступ в зависимости от использования.
Цель состоит в том, чтобы усложнить жизнь злоумышленникам, которые хотели бы использовать эти возможности для взлома чувствительных инфраструктур. При этом не блокируются законные работы по исследованию и исправлению уязвимостей, отладке или обучению. OpenAI добавляет, что некоторые действия могут повлечь за собой проверку учетной записи для отличия законного защитного использования от повторяющегося вредоносного поведения.
«В ходе оценки Chromium и Firefox [GPT-5.6 Sol] выявила ошибки и элементы, которые могли бы послужить основой для эксплойта, но не смогла самостоятельно создать полную и функциональную цепочку эксплуатации в условиях тестирования.»
OpenAI особо подчеркивает работу, проделанную для противодействия попыткам «джейлбрейка», которые заставляют модели обходить свои меры безопасности. Более 700 000 часов вычислений (в эквиваленте GPU A100) были потрачены на автоматизированное тестирование "красной командой": собственные модели OpenAI пытались найти уязвимости в защитных механизмах.
Цель заключалась в обнаружении «универсальных» джейлбрейков, которые могут работать в различных контекстах, а не только для конкретного запроса. Привлекаются также эксперты-люди, и тестирование продолжается на этапе предварительного просмотра. Первые тестировщики могут столкнуться с ограничениями, блокирующими или отклоняющими определенные запросы. Другие запросы могут занимать больше времени на обработку для проведения дополнительных проверок безопасности.
Разумные тарифы
Тарифы заинтересуют компании, которые используют ИИ-агентов для генерации кода и видят, как их счета неизменно растут. Ценовая сетка GPT-5.6 следующая:
- GPT-5.6 Sol: 5 долларов за 1 миллион входных токенов; 30 долларов за 1 миллион выходных токенов;
- GPT-5.6 Terra: 2,50 доллара за 1 миллион входных токенов; 15 долларов за 1 миллион выходных токенов;
- GPT-5.6 Luna: 1 доллар за 1 миллион входных токенов; 6 долларов за 1 миллион выходных токенов.
Интересно, что цены на Sol идентичны ценам GPT-5.5. Что касается Terra, они вдвое ниже при заявленной аналогичной производительности. Это явный вызов для Anthropic, чьи последние модели отличаются высокой стоимостью.
OpenAI добавляет, что GPT-5.6 Sol сможет работать на инфраструктуре Cerebras со скоростью до 750 токенов в секунду, что обеспечит значительно более быстрое время ответа для требовательных корпоративных клиентов, располагающих необходимыми финансовыми ресурсами.
GPT-5.6 также улучшает «кэш запросов», механизм, существующий в OpenAI с октября 2024 года, который позволяет сократить расходы, когда разработчик многократно использует один и тот же контекст в своих запросах. Новая модель сохраняет многократно используемые элементы запроса как минимум на 30 минут; запись в кэш обходится в 1,25 раза дороже, но чтение (повторное использование) получает скидку 90% (ранее было 50% при запуске этой функции). Кроме того, разработчики смогут лучше сегментировать свои промпты, чтобы выбрать, какие части сохранять в кэше и затем повторно использовать.
Свежие материалы — Новости IT-индустрии

Вентиляторы, кондиционеры, тепловые насосы (ТН) и термодинамика: знаете ли вы основы?
У меня большой подвал! Кондиционирование воздуха — одна из самых обсуждаемых тем на данный момент. В интернете можно встретить много противоречивой информации, поэтому мы решили разобраться в этом вопросе. В первой части нашей статьи мы рассмотрим основные понятия и определения, а такж

Стоимость «пожизненной» лицензии Plex Pass резко выросла до 690 евро
Новые тарифы подписки Plex, анонсированные в мае, вступили в силу, демонстрируя особенно значительное повышение стоимости «пожизненной» лицензии. Ее цена, ранее выросшая со 120 до 250 долларов (вероятно, в марте прошлого года), теперь достигла 750 долларов. Разработчик известного программного о

Кондиционирование воздуха: Полный обзор экологических, технических и социальных вызовов
В предыдущей части нашего обзора мы рассмотрели основы работы систем кондиционирования. Теперь перейдем к более детальному анализу технических и экологических аспектов, ответив на ключевые вопросы. Начнем с очевидного: кондиционирование воздуха спасает жизни в больницах и домах престар

Евродепутат, член следственной комиссии по Pegasus, сам стал жертвой шпионского ПО
Исследователи из Citizen Lab установили, что iPhone бывшего греческого евродепутата Стелиоса Кулоглу был заражен шпионским программным обеспечением Pegasus в то время, когда он участвовал в работе следственной комиссии, расследующей деятельность Pegasus. Стелиос Кулоглу был депутато

Microsoft Authenticator отказывается от устройств с джейлбрейком в корпоративной среде
Microsoft в настоящее время внедряет ряд значительных изменений в свое приложение Authenticator, которое используется в качестве второго фактора для обеспечения безопасности учетных записей (как Microsoft, так и сторонних). Наиболее заметным нововведением является отказ от поддержки устрой

GTA VI вбивает последний гвоздь в гроб физических игр
Коробка, ноль дисков Игроки теперь знают, чего ожидать. Студия Rockstar и издатель Take-Two объявили цены на GTA VI и открыли предзаказы на то, что обещает стать главным игровым и культурным событием года. Однако в Вайс-Сити, как всегда, не обошлось без подвоха... Масштабная кампан