OpenAI đã công bố o3-mini, mô hình mới nhất trong loạt lý luận của mình, được thiết kế để mang lại hiệu suất vượt trội trong các lĩnh vực STEM, kỹ thuật phần mềm và giải quyết vấn đề logic. Bản phát hành này tăng cường khả năng tiếp cận AI bằng cách duy trì chi phí thấp trong khi cải thiện tốc độ và độ chính xác so với phiên bản tiền nhiệm, OpenAI o1-mini.
Sau khi được xem trước vào tháng 2024 năm 3, oXNUMX-mini hiện đã chính thức có mặt tại ChatGPT và dịch vụ API. Nó cung cấp khả năng suy luận cao hơn, lý tưởng cho các tác vụ trong khoa học, công nghệ, kỹ thuật và toán học (STEM). Các nhà phát triển có thể tận dụng chức năng gọi hàm, đầu ra có cấu trúc và thông báo của nhà phát triển, đảm bảo tính linh hoạt cao hơn và các ứng dụng sẵn sàng cho sản xuất.
Các tính năng và khả năng truy cập nâng cao
Một trong những bản cập nhật được mong đợi nhất với OpenAI o3-mini là khả năng hỗ trợ nhiều cấp độ nỗ lực lý luận khác nhau, cho phép người dùng tối ưu hóa mô hình về tốc độ hoặc độ phức tạp dựa trên nhu cầu của họ. Các chế độ này bao gồm:
- Không cần suy luận nhiều: Ưu tiên tốc độ với chi phí tính toán tối thiểu.
- Nỗ lực suy luận trung bình: Cân bằng giữa độ chính xác và thời gian phản hồi.
- Nỗ lực suy luận cao: Tối đa hóa trí thông minh cho các nhiệm vụ phức tạp.
Không giống như OpenAI o1-mini, o3-mini giới thiệu khả năng tìm kiếm có cấu trúc, cho phép người dùng truy cập thông tin cập nhật với các nguồn web có liên quan. Ngoài ra, nó tăng gấp ba giới hạn tin nhắn cho ChatGPT Người dùng Plus và Team, từ 50 đến 150 tin nhắn mỗi ngày, cải thiện khả năng truy cập cho người dùng thường xuyên.
Lần đầu tiên, OpenAI đã cung cấp một mô hình lý luận cho người dùng miễn phí trong ChatGPT, cho phép họ trải nghiệm giải quyết vấn đề logic được hỗ trợ bởi AI bằng cách chọn tùy chọn “Lý do” trong trình soạn tin nhắn.
Tiêu chuẩn hiệu suất: Vượt trội hơn các mẫu trước
OpenAI o3-mini vượt trội hơn phiên bản tiền nhiệm của nó, o1-mini, trong nhiều chuẩn mực khoa học và toán học:
Toán học và mã hóa
- Lý luận toán học: Độ chính xác tương đương với OpenAI o1 trong khi thời gian phản hồi nhanh hơn.
- Cuộc thi Toán (AIME 2024): Vượt trội hơn o1-mini về khả năng suy luận cao.
- Lập trình cạnh tranh Codeforces: Đạt được cao hơn Điểm Elo trên các cấp độ nỗ lực lý luận.
- Kỹ thuật phần mềm (SWE-Bench): Vượt trội hơn các mô hình trước đây, chứng minh kết quả tốt nhất trong phát triển phần mềm hỗ trợ AI.
Kiến thức khoa học nâng cao
- Câu hỏi khoa học trình độ tiến sĩ (GPQA Diamond): Xuất sắc trong lĩnh vực sinh học, hóa học và vật lý, đạt hiệu suất gần bằng OpenAI o1.
- Toán học cấp độ nghiên cứu (FrontierMath): Với Tích hợp công cụ Python, o3-mini giải quyết thành công hơn 32% vấn đề, Bao gồm cả 28% các vấn đề khó khăn nhất (T3).
Kiến thức chung và sở thích của con người
- Đánh giá cho thấy một 56% thích phản ứng o3-mini hơn o1-mini.
- Giảm lỗi lớn 39%, cải thiện độ tin cậy trên diffcult những câu hỏi thực tế.
Cải thiện tốc độ và hiệu quả
OpenAI o3-mini cung cấp phản hồi Nhanh hơn 24% so với o1-mini, Giảm thời gian phản hồi trung bình từ 10.16 giây đến 7.7 giây. Trong các thử nghiệm độ trễ, o3-mini duy trì Thời gian nhanh hơn 2,500ms để có được mã thông báo đầu tiên, đảm bảo tương tác nhanh hơn và trôi chảy hơn.
Cải tiến an toàn và phát triển AI có đạo đức
OpenAI đã tích hợp các kỹ thuật căn chỉnh có chủ đích để đảm bảo o3-mini tạo ra các phản hồi an toàn, phù hợp với con người. Các thử nghiệm mở rộng cho thấy o3-mini vượt trội hơn đáng kể so với GPT-4o trong các đánh giá bảo mật, khiến nó trở thành một trong những mô hình mạnh mẽ nhất của OpenAI trong việc ngăn chặn việc sử dụng sai mục đích và khai thác bẻ khóa.
Thông qua nhóm đỏ bên ngoài và đánh giá an toàn có hệ thống, OpenAI tiếp tục giảm thiểu rủi ro trong khi tối ưu hóa trí thông minh AI. Thẻ hệ thống mới nhất cung cấp thông tin chi tiết về các đánh giá nội dung không được phép và các giao thức an toàn.
Bước tiếp theo của OpenAI là gì?
Với o3-mini, OpenAI đã thực hiện một bước tiến quan trọng khác hướng đến việc giúp suy luận AI nâng cao dễ tiếp cận hơn và tiết kiệm chi phí hơn. Mô hình này phù hợp với sứ mệnh đang diễn ra của công ty là giảm giá cho mỗi token trong khi vẫn duy trì khả năng suy luận hàng đầu.
Khi việc áp dụng AI ngày càng mở rộng, OpenAI vẫn cam kết mở rộng ranh giới của các mô hình AI thông minh, hiệu quả và an toàn, đảm bảo rằng các doanh nghiệp, nhà phát triển và sinh viên có thể tận dụng AI để giải quyết vấn đề, đổi mới và nghiên cứu.
Bắt đầu từ hôm nay, o3-mini có sẵn cho ChatGPT Plus, người dùng Team và Pro, với quyền truy cập Enterprise sẽ được triển khai vào tháng 3. Quyền truy cập API được cấp cho các nhà phát triển được chọn ở cấp độ 5-XNUMX.
Đối với những ai muốn khai thác sức mạnh của AI trong STEM và phát triển phần mềm, OpenAI o3-mini là một bước tiến vượt bậc đầy thú vị.