OpenAI har officiellt lanserat GPT-4.1 modellfamiljen, bestående av GPT-4.1, GPT-4.1 mini och GPT-4.1 nano via sin API-plattform. Modellerna är designade för verkliga prestanda och erbjuder betydande förbättringar när det gäller kodning, instruktionsföljning och förståelse av långa sammanhang, samtidigt som de fungerar till en bråkdel av kostnaden och latensen för tidigare modeller.
Lanseringen signalerar ett avgörande steg för att fasa ut GPT-4.5 Förhandsgranskning, med OpenAI som ett solnedgångsdatum den 14 juli 2025. GPT-4.1 står nu som företagets flaggskepp endast API-modell, vilket ger både överlägsen prestanda och prisfördelar.

Kodningsmöjligheterna omarbetade
GPT-4.1 överträffar alla tidigare GPT-modeller på SWE-bench Verified, och slutförde 54.6 % av uppgifterna, ett steg på 21 punkter över GPT-4o. Modellen utmärker sig i verklig mjukvaruteknik, särskilt när man redigerar stora kodfiler eller genererar patchar i diff-format.
Benchmarks som Aiders polyglot bekräftar GPT-4.1:s skicklighet i flerspråkiga kodningsuppgifter, med modellen som uppnår över 52 % noggrannhet i diffgenerering, dubblar GPT-4os poäng och slår GPT-4.5. Utvecklare kan också dra nytta av utökade utdatatokengränser (upp till 32,768 XNUMX tokens) och använda optimerad prompt för snabbare iterationscykler.
"GPT-4.1 erbjuder en spelförändrande upplevelse för ingenjörer, särskilt inom felsökning, refactoring och realtidskodgenerering," sa en utvecklare på Windsurf, en av OpenAI:s alfapartners.
Skarpare instruktionsföljning och responstrohet
Med en poäng på 38.3 % ScaleMultiChallenge-riktmärket 10.5 % högre än GPT-4o, GPT-4.1 utmärker sig för sin förbättrade förståelse av nyanserade instruktioner i flera steg. I OpenAI:s egna instruktionsföljande tester registrerade den en 49.1 % noggrannhet på hårda uppmaningar, vilket avsevärt överträffade konkurrenterna.
Modellens förmåga att tolka och följa ordnade, villkorade och formatspecifika instruktioner gör den mycket effektiv i företagsapplikationer som skatteefterlevnad (som sett med Blue J) och databasförfrågningar (vilket framgår av prestanda hos Hex).
Revolutionerande lång kontext: upp till 1 miljon tokens
GPT-4.1 introducerar ett spelförändrande sammanhangsfönster på upp till 1 miljon tokens, ungefär lika stor som åtta fullständiga React-kodbaser. Med nya utvärderingar som OpenAI-MRCR och Graphwalks har GPT-4.1 visat sig kapabel till både hämtning och multi-hop-resonemang över stora dokument, vilket överträffar GPT-4o i alla positioner och tester.
Partners som Thomson Reuters och Carlyle rapporterar stora vinster i noggrannhet och dokumentanalys, från komplexa juridiska arbetsflöden till att extrahera finansiell data från filer i flera format.
"GPT-4.1 tillåter oss att behandla juridiska kontrakt över dussintals dokument med minimal övervakning", konstaterade en representant från Thomson Reuters.
Mini och Nano: Prestanda på kanten av hastighet och kostnad
- GPT-4.1 mini matchar GPT-4os intelligens men halverar fördröjningen nästan och sänker kostnaden med 83 %.
- GPT-4.1 nano är den snabbaste och billigaste modellen hittills, idealisk för klassificering och autoslutförande uppgifter, med imponerande resultat: 80.1 % på MMLU och 50.3 % på GPQA.
Dessa modeller möjliggör högpresterande i skala och stöder upp till 1 miljon token-kontexter med svarstider så snabba som 5 sekunder för stora uppmaningar.
Multimodal och visuell förståelse förbättrad
Visuella riktmärken visar också stora förbättringar. På tester som MMMU och MathVista slog GPT-4.1 mini och nano GPT-4o och till och med konkurrenten GPT-4.5. Modellerna utmärker sig när det gäller att tolka diagram, matematiska diagram och vetenskapliga artiklar, avgörande för användningsfall för utbildning, forskning och analys.
Pris och tillgänglighet
Hela GPT-4.1-serien är nu live i OpenAI API, inklusive genom Batch API med ytterligare 50 % rabatt. Här är prisuppdelningen per 1 miljon tokens:
| Modell | Ingång | Cachad ingång | Produktion | Blandad prissättning |
|---|---|---|---|---|
| GPT-4.1 | $2.00 | $0.50 | $8.00 | $1.84 |
| GPT-4.1 mini | $0.40 | $0.10 | $1.60 | $0.42 |
| GPT-4.1 nano | $0.10 |
Rabatter för snabb cachelagring har ökat till 75 %, vilket gör att utvecklare kan optimera både prestanda och kostnad.
Vad kommer härnäst?
Med GPT-4.1:s förbättringar i kodgenerering, långa sammanhangsresonemang, instruktionsföljning och vision banar OpenAI vägen för mer robusta agentapplikationer. Företaget planerar att fortsätta att införliva lärdomar från GPT-4.5 och tidigare iterationer i sin framväxande svit av modeller.
När GPT-4.5 Preview solnedgångar uppmanas utvecklare att migrera sina arbetsbelastningar till GPT-4.1 för att dra nytta av dess förbättrade möjligheter och lägre driftskostnader.
"GPT-4.1 är det praktiska AI-språnget vi har väntat på", sa en produktchef på Qodo. "Det är smartare, snabbare och mer anpassat till de utmaningar som utvecklare står inför idag."