Nowy narzędzie Google AI wykorzystuje instrukcje obrazkowe zamiast słów – Kreatywny świat Whisk! – MDC

Nowy narzędzie Google AI wykorzystuje instrukcje obrazkowe zamiast słów – Kreatywny świat Whisk!

Nowa narzędzie AI Google wykorzystuje instrukcje obrazkowe zamiast słów.

Reklamys

Najnowszy produkt AI Google, „Whisk”, pozwala użytkownikom przesyłać zdjęcia, aby uzyskać połączone, wygenerowane przez AI obrazy bez pisania ani jednego słowa.

Przed użyciem Whiska, użytkownicy mogą dostarczyć obrazy przedmiotów, ustawień i stylów.

W swoim wpisie na blogu Google nazwał Whiska „narzędziem kreatywnym” do szybkiej inspiracji, a nie „tradycyjnym edytorem obrazów”. Whisk ma być zabawną funkcją AI, a nie narzędziem profesjonalnym.

Duże firmy technologiczne, takie jak Google i OpenAI, spieszą się, aby dostarczyć produkty konsumenckie, które pokazują nową, fajną technologię, chociaż krytycy ostrzegają, że rozwój AI bez ograniczeń jest niebezpieczny dla ludzkości.

Od wprowadzenia Dall-E, narzędzia do produkcji obrazów na podstawie tekstu przez OpenAI w 2021 roku, sztuka generowana przez AI zalewa media społecznościowe i przenika produkty konsumenckie. Google Whisk to generator obrazu do obrazu, który buduje na generatorach tekstu do obrazu.

Użytkownicy Whiska mogą zmieniać swoje wejścia i mieszać kategorie, aby tworzyć pluszaki, przypinki i naklejki. Użytkownicy mogą kierować szczegółami za pomocą słów, ale obraz nie jest konieczny.

„Whisk został zaprojektowany, aby pozwolić użytkownikom odtworzyć temat, scenę i styl w nowy i kreatywny sposób, oferując szybkie zwiedzanie wizualne zamiast edycji doskonałych pikseli”, powiedział dyrektor zarządzania produktem Google Labs, Thomas Iljic.

Google zakupił DeepMind w 2014 roku i wykorzystał jego AI generatywne do zbudowania Whiska.

Whisk korzysta z głównej usługi AI Google, Gemini, wprowadzonej w grudniu 2023 roku, oraz Imagen 3, najnowszego generatora tekstu do obrazu od DeepMind.

Imagen 3 otrzymuje podpisy od Geminiego, kiedy użytkownicy przesyłają zdjęcia. Aby zmiksować końcowy obraz, technika przechwytuje „istotę” tematu, zamiast dokładnej reprodukcji, która może odbiegać od polecenia.

Google napisał na swoim blogu, że stworzony obraz może różnić się od zdjęć od polecenia pod względem wzrostu, fryzury i karnacji.

Google spotkał się z krytyką w lutym, gdy uruchomił konwerter tekstu na obraz Geminiego, ponieważ tworzył obrazy o historycznie nieprawidłowym charakterze.

Whisk, witryna Google Labs dostępna tylko w USA, jest w fazie wczesnego rozwoju, poinformowała firma.

OpenAI zaprezentował Sorę, generator tekstu na wideo, demonstrując konkurencyjność produktów konsumenckich.

Dyrektor zarządzający i starszy analityk w dziale ekwityd Wedbush Securities, Dan Ives, powiedział dla CNN, że Whisk to kolejny „moment pokazania mięśni” dla Google w dziedzinie AI i technologii.

Produkty AI są częścią „skarbca” nowych produktów Google na 2025 rok, który obejmuje nowy system operacyjny Android opracowany we współpracy z Samsungiem i Qualcommem. „DeepMind jest kluczowym aktywem dla Google”, powiedział Ives.

Picture of Anna Kowalska
Anna Kowalska

Redaktor w MDC od 2024 roku.

ZASTRZEŻENIE:

W żadnym przypadku nie będziesz zobowiązany do płacenia za dostęp do jakiegokolwiek produktu, w tym kart kredytowych, pożyczek czy innych ofert. Jeśli tak się stanie, prosimy o natychmiastowy kontakt z nami. Zawsze upewnij się, że przeczytałeś warunki i zasady dostawcy usług, z którym się kontaktujesz. Generujemy przychody poprzez reklamy i polecenia dla niektórych, ale nie wszystkich, produktów prezentowanych na tej stronie internetowej. Wszystko, co tutaj publikujemy, opiera się na badaniach ilościowych i jakościowych, a nasz zespół stara się być jak najbardziej obiektywny w porównywaniu opcji konkurencyjnych.

ROZPOWSZECHNIANIE REKLAMODAWCY:

Jesteśmy niezależną witryną redakcyjną, obiektywną i finansowaną z reklam. Aby wspierać naszą zdolność do dostarczania treści bezpłatnie naszym użytkownikom, rekomendacje, które pojawiają się na naszej stronie, mogą pochodzić od firm, od których otrzymujemy wynagrodzenie jako afilianci. To wynagrodzenie może wpływać na sposób, miejsce i kolejność, w jakiej oferty pojawiają się na naszej stronie. Inne czynniki, takie jak nasze własne algorytmy i dane pierwszej strony, mogą również wpływać na sposób i miejsce, w którym produkty/oferty są umieszczane. Nie wymieniamy na naszej stronie wszystkich ofert finansowych ani kredytowych, które są obecnie dostępne na rynku.

NOTA REDAKCYJNA:

Opinie wyrażone tutaj są wyłącznie opinią autora i nie reprezentują żadnego banku, wydawcy kart kredytowych, hotelu, linii lotniczej ani jakiejkolwiek innej podmiotu. Ta treść nie została sprawdzona, zatwierdzona ani poparta przez żadną z podmiotów wymienionych w komunikacie. Niemniej jednak, wynagrodzenie, które otrzymujemy od naszych partnerów afiliacyjnych, nie wpływa na rekomendacje ani porady udzielane przez nasz zespół redakcyjny w naszych artykułach, ani w żaden sposób nie wpływa na treść tej strony internetowej. Chociaż ciężko pracujemy, aby dostarczyć dokładne i aktualne informacje, które uważamy za istotne dla naszych użytkowników, nie możemy zagwarantować, że wszystkie dostarczone informacje są kompletne i nie składamy żadnych oświadczeń ani gwarancji dotyczących ich dokładności czy zastosowania.