OpenAI Chat, populární chatbot s umělou inteligencí, se nyní naučil konverzovat pomocí mluveného jazyka, podobně jako Siri a Alexa, což znamená významný skok v komunikaci AI.
Díky tomuto novému vývoji se uživatelé mohou s chatem zapojit prostřednictvím hlasové interakce, což jej činí přístupnějším a všestrannějším. Startup zabývající se umělou inteligencí OpenAI se sídlem v San Franciscu nedávno spustil tuto verzi chatbota a posouvá tak hranice komunikace s umělou inteligencí.
Další novinkou je možnost, že Chat nyní dokáže reagovat na obrázky. Uživatelé mohou například nahrát fotografii vnitřku své ledničky a chatbot jim může na základě dostupných ingrediencí navrhnout potenciální pokrmy. Tato inovativní funkce si klade za cíl, aby byl Chat uživatelsky přívětivější a užitečnější.
OpenAI rychle rozšiřuje své nástroje pro tvorbu umělé inteligence. Nedávno představila verzi svého generátoru obrázků DALL-E a začlenila ji do Chatu. Od svého spuštění v listopadu si Chat přilákal stovky milionů uživatelů a inspiroval podobné služby od jiných společností.
Nový bot překonává své konkurenty, jako je Google Bard, a zároveň zpochybňuje zavedené technologie, jako jsou Alexa a Siri. Tito digitální asistenti tradičně usnadňovali interakci se zařízeními pomocí hlasu. Novější chatboti, jako je Chat a Google Bard, se však chlubí vynikajícími jazykovými znalostmi, které jim umožňují generovat e-maily, psát poezii a okamžitě diskutovat o téměř jakémkoli tématu.
Nejnovější nabídka společnosti OpenAI efektivně spojuje tyto dvě komunikační metody. Společnost vnímá mluvení jako intuitivnější způsob interakce se svým chatbotem. Tvrdí, že syntetické hlasy Chatu, dostupné v pěti různých variantách, zastíní hlasy používané u populárních digitálních asistentů.
Nový chatbot bude k dispozici všem předplatitelům služby Chat Plus, která stojí 20 dolarů měsíčně, během příštích dvou týdnů. Bot však může reagovat hlasem pouze na iPhonech, iPadech a zařízeních se systémem Android.
I když hlasové rozhraní Chatu může uživatelům připomínat dřívější asistenty, technologie, která jej pohání, je zásadně odlišná. Je primárně poháněno modelem velkého jazyka (LLM), který generuje jazyk analýzou obrovského množství textu z celého internetu.
Chat dokáže odpovědět prakticky na jakoukoli otázku během několika sekund, na rozdíl od starších digitálních asistentů, jako jsou Alexa a Siri, kteří dokázali vykonávat pouze omezený počet úkolů nebo odpovídat na konečný seznam naprogramovaných otázek.
Vzhledem k tomu, že OpenAI vyvíjí Chat do podoby Alexy nebo Siri, společnosti jako Amazon a Apple transformují své digitální asistenty tak, aby se podobali Chatu.
Amazon nedávno představil aktualizovaný systém Alexa zaměřený na plynulejší konverzaci na „jakékoli téma“, částečně poháněný novým LLM. Mezitím Apple podle zasvěcených testoval prototyp svého LLM pro budoucí produkty.
Nový Chat dokáže reagovat na obrázky i přes web a na zařízeních iPhone, iPad a Android. Tato funkce by se mohla ukázat jako neocenitelná pro zrakově postižené uživatele.
OpenAI původně předvedla tento nástroj pro tvorbu obrázků na jaře, ale odložila jeho veřejné vydání, dokud lépe nepochopí jeho potenciální zneužití. Existovaly například obavy, že by mohl sloužit jako služba rozpoznávání obličeje, která by rychle identifikovala osoby na fotografiích.
Navzdory těmto krokům má robot stále oblasti pro zlepšení. Může se například potýkat s homonymy, ale může se opravit, čímž demonstruje pokročilé možnosti učení robota.
Závěrem lze říci, že nejnovější verze Chatu od OpenAI představuje významný skok v komunikaci s využitím umělé inteligence a nabízí vylepšenou interakci s uživatelem a všestrannost. Vzhledem k tomu, že se umělá inteligence dále vyvíjí, bude zajímavé sledovat, jak na tento pokrok zareagují giganti jako Amazon a Apple.