Firma OpenAI niedawno zaprezentowała Dall E 3, najnowsza wersja narzędzia artystycznego opartego na sztucznej inteligencji. Ta przełomowa technologia wykorzystuje możliwości znanego chatbota OpenAI, Chat, aby ułatwić tworzenie bardziej złożonych i artystycznie skomponowanych dzieł sztuki wizualnej.
Dall-E 3 wyróżnia się na tle swoich poprzedników, upraszczając proces udoskonalania komunikatów tekstowych przesyłanych do systemu – praktykę znaną jako „inżynieria komunikatów”. Umożliwiając udoskonalanie za pośrednictwem interfejsu konwersacyjnego Chat, Dall-E 3 obniżył bariery w tworzeniu zaawansowanych grafik opartych na sztucznej inteligencji, jednocześnie utrzymując OpenAI na czele wyścigu innowacji w dziedzinie sztucznej inteligencji.
Integracja Chatu z Dall-E 3 umożliwiła przekształcenie krótkich podpowiedzi w bardziej szczegółowe instrukcje dotyczące kompozycji obrazu. Ta ewolucja to znaczący krok naprzód dla Dall-E i całej sztuki generatywnej opartej na sztucznej inteligencji.
Wprowadzony w 2021 r. i wprowadzony na rynek w 2022 r. Dall-E łączy algorytm wytrenowany na dużej liczbie oznakowanych obrazów z Internetu i innych źródeł z modelem dyfuzji, aby przewidzieć sposób renderowania obrazu dla danego podpowiedzi. Dzięki istotnym danym może tworzyć złożone, spójne i atrakcyjne estetycznie obrazy. Jednak Dall-E 3 wprowadza kluczową zmianę w sposobie interakcji ludzi i maszyn.
Na przykład Dall-E 3 wygenerował ten obraz w odpowiedzi na polecenie: „Ilustracja ludzkiego serca wykonanego z półprzezroczystego szkła, stojącego na cokole pośród wzburzonego morza…”, udowadniając, że Chat może podjąć się zadania stworzenia bardziej wyrafinowanego polecenia, które w innym przypadku wymagałoby rozległego projektowania poleceń.
Co więcej, Dall-E 3 pozwala użytkownikom udoskonalać swoje dzieła za pośrednictwem czatu, co przypomina prośbę o poprawki do artysty. Jak wyjaśnia Aditya Ramesh, główny badacz i kierownik zespołu Dall-E: „Zamiast tego, możesz po prostu wchodzić w interakcję z czatem, tak jakbyś rozmawiał ze współpracownikiem”.
Premiera Dall-E 3 następuje w okresie szerszego boomu generatywnej sztucznej inteligencji, który rozpoczął się w 2022 r., kiedy na pierwszy plan wysunęły się liczne generatory grafiki AI. Chociaż narzędzia te wzbudziły znaczne finansowanie i zainteresowanie opinii publicznej, pojawiły się obawy dotyczące potencjalnego wysiedlenia artystów-ludzi i wykorzystania materiałów chronionych prawem autorskim do szkolenia algorytmów sztucznej inteligencji.
W odpowiedzi OpenAI wdrożyło środki umożliwiające artystom rezygnację z wykorzystywania ich prac w przyszłych przebiegach szkoleniowych. Ponadto Dall-E 3 ma na celu uniemożliwienie użytkownikom prób generowania dzieł sztuki w stylu znanych artystów.
OpenAI zajął się również obawami dotyczącymi generowania nieodpowiednich lub brutalnych treści, wprowadzając zabezpieczenia blokujące takie próby. Według Sandhini Agarwal, badaczki polityki w OpenAI, Dall-E 3 przeszedł rozległy „red teaming”, aby zapewnić solidność środków ochronnych.
Podczas gdy sztuka tworzona przy użyciu sztucznej inteligencji wciąż robi furorę w mediach społecznościowych, Dall-E 3, przy pomocy Chatu, jest gotowy przyczynić się do tego tętniącego życiem cyfrowego krajobrazu, tworząc surrealistyczne, a jednocześnie urzekające obrazy na podstawie prostych podpowiedzi tekstowych.