OpenAI официально запустил GPT-4.1 Семейство моделей, включающее GPT-4.1, GPT-4.1 mini и GPT-4.1 nano через свою платформу API. Разработанные для реальной производительности, модели предлагают значительные улучшения в кодировании, следовании инструкциям и понимании длинного контекста, работая при этом за часть стоимости и задержки предыдущих моделей.
Запуск сигнализирует о решительном шаге к постепенному отказу Предварительный просмотр GPT-4.5, а OpenAI устанавливает дату окончания поддержки 14 июля 2025 года. GPT-4.1 теперь является флагманской моделью компании, работающей только на API, обеспечивая как превосходную производительность, так и ценовые преимущества.
Переосмысленные возможности кодирования
GPT-4.1 превосходит все предыдущие модели GPT на SWE-bench Verified, выполняя 54.6% задач, что на 21 балл больше, чем у GPT-4o. Модель отлично подходит для разработки программного обеспечения в реальном мире, особенно при редактировании больших файлов кода или создании патчей в формате diff.
Такие бенчмарки, как полиглот Эйдера, подтверждают мастерство GPT-4.1 в задачах многоязычного кодирования, при этом модель достигла точности более 52% при генерации различий, удвоив результат GPT-4o и обойдя GPT-4.5. Разработчики также могут воспользоваться расширенными лимитами выходных токенов (до 32,768 XNUMX токенов) и использовать оптимизированные подсказки для более быстрых циклов итерации.
«GPT-4.1 предлагает инженерам революционные возможности, особенно в области отладки, рефакторинга и генерации кода в реальном времени», — сказал разработчик Windsurf, одного из альфа-партнеров OpenAI.
Более четкое выполнение инструкций и точность ответов
С результатом 38.3% ScaleТест MultiChallenge от . GPT-10.5 на 4% выше, чем GPT-4.1o, GPT-49.1 выделяется улучшенным пониманием нюансированных многошаговых инструкций. В собственных тестах OpenAI на выполнение инструкций он зарегистрировал точность XNUMX% на жестких подсказках, значительно опередив конкурентов.
Способность модели анализировать и следовать упорядоченным, условным и зависящим от формата инструкциям делает ее чрезвычайно эффективной в корпоративных приложениях, таких как обеспечение соблюдения налогового законодательства (как видно на примере Blue J) и выполнение запросов к базам данных (о чем свидетельствует производительность в Hex).
Революционно длинный контекст: до 1 миллиона токенов
GPT-4.1 представляет революционное контекстное окно до 1 миллиона токенов, что примерно соответствует размеру восьми полных кодовых баз React. Благодаря новым оценкам, таким как OpenAI-MRCR и Graphwalks, GPT-4.1 доказал свою способность как к поиску, так и к многоадресному обоснованию в обширных документах, превзойдя GPT-4o во всех позициях и тестах.
Такие партнеры, как Thomson Reuters и Carlyle, сообщают о значительном росте точности и анализа документов: от сложных юридических процессов до извлечения финансовых данных из многоформатных файлов.
«GPT-4.1 позволяет нам обрабатывать юридические контракты, состоящие из десятков документов, с минимальным контролем», — отметил представитель Thomson Reuters.
Mini и Nano: производительность на грани скорости и стоимости
- GPT-4.1 mini соответствует интеллекту GPT-4o, но сокращает задержку почти вдвое и снижает стоимость на 83%.
- GPT-4.1 nano — самая быстрая и дешевая модель на сегодняшний день, идеально подходящая для задач классификации и автозаполнения, с впечатляющими результатами: 80.1% на MMLU и 50.3% на GPQA.
Эти модели обеспечивают высокую производительность в любом масштабе, поддерживая до 1 миллиона контекстов токенов со временем отклика до 5 секунд для больших запросов.
Улучшение мультимодального и визуального понимания
Визуальные бенчмарки также показывают значительные улучшения. В таких тестах, как MMMU и MathVista, GPT-4.1 mini и nano превосходят GPT-4o и даже соперничают с GPT-4.5. Модели отлично справляются с интерпретацией графиков, математических диаграмм и научных статей, что критически важно для образования, исследований и аналитических сценариев использования.
Ценообразование и доступность
Вся серия GPT-4.1 теперь доступна в OpenAI API, в том числе через Batch API с дополнительной скидкой 50%. Вот разбивка цен за 1 миллион токенов:
Модель | вход | Кэшированный ввод | Результат | Смешанное ценообразование |
---|---|---|---|---|
GPT-4.1 | $2.00 | $0.50 | $8.00 | $1.84 |
ГПТ-4.1 мини | $0.40 | $0.10 | $1.60 | $0.42 |
GPT-4.1 нано | $0.10 |
Скидки на оперативное кэширование увеличились до 75%, что позволяет разработчикам оптимизировать как производительность, так и стоимость.
Что дальше?
Благодаря улучшениям GPT-4.1 в области генерации кода, рассуждений в длинном контексте, следования инструкциям и видения OpenAI прокладывает путь для более надежных агентских приложений. Компания планирует продолжить включение знаний из GPT-4.5 и более ранних итераций в свой развивающийся набор моделей.
Поскольку предварительная версия GPT-4.5 завершается, разработчикам настоятельно рекомендуется перенести свои рабочие нагрузки на GPT-4.1, чтобы воспользоваться ее расширенными возможностями и снизить эксплуатационные расходы.
«GPT-4.1 — это практический скачок в развитии ИИ, которого мы ждали», — сказал менеджер по продукту в Qodo«Он умнее, быстрее и лучше соответствует задачам, с которыми сталкиваются разработчики сегодня».