GPT-4o: wielomodalny krok naprzód, ale wstrzymaj się z aplauzem

May 16, 2024

OpenAI właśnie zaprezentowało GPT-4o, ich najbardziej ambitny model językowy. To nie jest po prostu kolejna przyrostowa aktualizacja; GPT-4o to multimodalny cud, zdolny do przetwarzania nie tylko tekstu, ale także dźwięku i transmisji wideo na żywo. Wyobraź sobie świat, w którym AI rozumie twoje polecenia mówione, analizuje obrazy wokół ciebie i odpowiada w czasie rzeczywistym za pomocą logicznych dedukcji. Brzmi jak science fiction, prawda? Cóż, wydarzenie OpenAI Spring Update zaoferowało kuszący wgląd w tę rzeczywistość.

Czy rzeczywiście możesz teraz używać GPT-4o?

Prawdopodobnie nie możesz się doczekać, aby wypróbować tę nowatorską technologię, a OpenAI twierdzi, że jest ona dostępna dla wszystkich użytkowników Chata, również tych korzystających z darmowego planu. Wystarczy zalogować się na swoje konto Chata w przeglądarce internetowej i wyszukać opcję GPT-4o w menu rozwijanym w lewym górnym rogu. Jest ona dumnie określana jako „najnowszy i najbardziej zaawansowany model” OpenAI.

Chatgpt-4o

Zwolnij RollOgraniczenia i ograniczenia mobilne

Zanim jednak za bardzo się podekscytujesz, istnieją pewne zastrzeżenia. Wdrażanie GPT-4o w wersji przeglądarkowej następuje stopniowo, a użytkownicy mobilni korzystający z systemów iOS i Android mogą jeszcze poczekać. Nowa aplikacja komputerowa na komputery Mac również jest w trakcie wydawania, a szersza dostępność zostanie obiecana w nadchodzących tygodniach. Użytkownicy systemu Windows będą musieli uzbroić się w cierpliwość, ponieważ ich wersja zostanie udostępniona jeszcze w tym roku.

Pełne doświadczenie GPT-4o: wciąż poza zasięgiem

Tutaj sprawy nieco się komplikują. Pamiętacie tę oszałamiającą demonstrację asystenta głosowego i wizualnego? Te funkcje nie są jeszcze powszechnie dostępne. Deweloperzy mogą uzyskać do nich dostęp poprzez API, ale OpenAI milczał na temat tego, kiedy – lub czy – pełny tryb asystenta będzie dostępny dla ogółu społeczeństwa. Plotki sugerują, że abonenci Chat Plus mogą wkrótce uzyskać dostęp do funkcji głosowych, ale nie ma oficjalnego harmonogramu.

Czat-4o 2

Werdykt: ekscytujący potencjał, ale postępuj ostrożnie

Jako osoba, która od lat pisze reportaże na temat Krajobraz AI, Jestem ostrożnie optymistycznie nastawiony do GPT-4o. Potencjał demokratyzacji dostępu do tak potężnej AI jest godny pochwały, ale rzeczywistość ograniczonej dostępności i nieuchwytna natura pełnego multimodalnego doświadczenia rodzą pytania o prawdziwą dostępność. Czy OpenAI naprawdę daje użytkownikom władzę, czy jest to sprytny podstęp mający na celu zwabienie ich do subskrypcji premium? Tylko czas pokaże.

Czat-4o 3

Moja rekomendacja: eksperymentuj i dziel się swoimi doświadczeniami

W międzyczasie zachęcam do eksperymentowania z możliwościami generowania tekstu GPT-4o, jeśli uda Ci się je zdobyć. Podziel się swoimi doświadczeniami, zarówno pozytywnymi, jak i negatywnymi, i wspólnie zbadajmy potencjał i ograniczenia tego najnowszego cudu AI. Pamiętaj, że przyszłość AI nie leży tylko w rękach gigantów technologicznych, takich jak OpenAI; kształtują ją również głosy użytkowników, takich jak Ty.