Popularny chatbot oparty na sztucznej inteligencji, Chat firmy OpenAI, nauczył się teraz komunikować za pomocą języka mówionego, podobnie jak Siri oraz Alexa, co stanowi znaczący krok w komunikacji AI.
Dzięki temu nowemu rozwiązaniu użytkownicy mogą korzystać z Chata poprzez interakcję głosową, co czyni go bardziej przystępnym i wszechstronnym. Startup OpenAI z siedzibą w San Francisco, zajmujący się sztuczną inteligencją, wprowadził niedawno tę wersję chatbota, przesuwając granice komunikacji opartej na sztucznej inteligencji.
Kolejną nowością jest to, że Chat może teraz reagować na obrazy. Użytkownicy mogą na przykład przesłać zdjęcie wnętrza swojej lodówki, a chatbot zasugeruje potencjalne dania na podstawie dostępnych składników. Ta innowacyjna funkcja ma na celu uczynienie Chata bardziej przyjaznym dla użytkownika i użytecznym.
OpenAI dynamicznie rozwija swoje narzędzia AI. Niedawno firma zaprezentowała wersję swojego generatora obrazów DALL-E i włączyła go do Chata. Od premiery w listopadzie Chat przyciągnął setki milionów użytkowników i zainspirował podobne usługi innych firm.
Nowy bot przewyższa swoich konkurentów, takich jak Google Bard, jednocześnie rzucając wyzwanie tradycyjnym technologiom, takim jak Alexa i Siri. Ci cyfrowi asystenci tradycyjnie umożliwiali interakcję z urządzeniami za pomocą głosu. Jednak nowsze chatboty, takie jak Chat i Google Bard, charakteryzują się lepszymi umiejętnościami językowymi, umożliwiając im generowanie e-maili, pisanie wierszy i natychmiastowe omawianie niemal każdego tematu.
Najnowsza oferta OpenAI skutecznie łączy te dwie metody komunikacji. Firma postrzega mówienie jako bardziej intuicyjny sposób interakcji z chatbotem. Twierdzi, że syntetyczne głosy Chata, dostępne w pięciu różnych opcjach, przewyższają te używane przez popularnych asystentów cyfrowych.
Nowy chatbot będzie dostępny dla wszystkich abonentów Chat Plus, usługi kosztującej 20 dolarów miesięcznie, w ciągu najbliższych dwóch tygodni. Jednak bot może odpowiadać głosowo tylko na iPhone'ach, iPadach i urządzeniach z Androidem.
Choć interfejs głosowy Chata może przypominać użytkownikom wcześniejszych asystentów, technologia, która go napędza, jest zasadniczo inna. Opiera się przede wszystkim na dużym modelu językowym (LLM), który generuje język poprzez analizę ogromnych ilości tekstu z internetu.
Chat może odpowiedzieć na praktycznie każde pytanie w ciągu kilku sekund, w przeciwieństwie do starszych asystentów cyfrowych, takich jak Alexa i Siri, które potrafiły wykonać tylko ograniczoną liczbę zadań lub odpowiedzieć na skończoną listę zaprogramowanych pytań.
Podczas gdy OpenAI przekształca Chat w coś na wzór Alexy lub Siri, firmy takie jak Amazon i Apple przekształcają swoich asystentów cyfrowych, aby przypominali Chat.
Amazon niedawno zaprezentował zaktualizowany system Alexa, którego celem jest bardziej płynna rozmowa na „dowolny temat”, częściowo napędzana przez nowy LLM. W międzyczasie, według wtajemniczonych, Apple testuje prototyp swojego LLM pod kątem przyszłych produktów.
Nowy Czat może również reagować na obrazy, zarówno w przeglądarce internetowej, jak i na urządzeniach iPhone, iPad i Android. Ta funkcja może okazać się nieoceniona dla użytkowników z dysfunkcją wzroku.
OpenAI początkowo zademonstrowało to narzędzie do obrazów wiosną, ale opóźniło jego publiczne wydanie, dopóki nie zrozumieli lepiej jego potencjalnego niewłaściwego użycia. Na przykład istniały obawy, że może ono służyć jako usługa rozpoznawania twarzy do szybkiej identyfikacji osób na zdjęciach.
Pomimo tych postępów bot nadal ma obszary do poprawy. Może na przykład zmagać się z homonimami, ale potrafi także sam się poprawiać, demonstrując zaawansowane możliwości uczenia się bota.
Podsumowując, najnowsza wersja czatu OpenAI stanowi znaczący krok naprzód w komunikacji opartej na sztucznej inteligencji, oferując ulepszoną interakcję i wszechstronność. Wraz z rozwojem sztucznej inteligencji, ciekawie będzie obserwować, jak giganci, tacy jak Amazon i Apple, zareagują na te postępy.