Whisk: Un instrument inovator AI de la Google, care folosește instrucțiuni sub formă de imagini în loc de cuvinte. – KNFinances

Whisk: Un instrument inovator AI de la Google, care folosește instrucțiuni sub formă de imagini în loc de cuvinte.

Cel mai recent produs AI al Google, „Whisk”, permite utilizatorilor să încarce fotografii pentru a obține o imagine combinată, generată de AI, fără a fi nevoie să tasteze vreun cuvânt.

Publicitate

Înainte ca Whisk să amestece fotografiile, utilizatorii pot furniza imagini ale subiecților, setărilor și stilurilor.

Într-o postare pe blog, Google a numit Whisk un „instrument creativ” pentru inspirație rapidă, nu un „editor de imagini tradițional”. Whisk este menit să fie o funcție distractivă AI, nu un instrument profesional.

Companii mari de tehnologie precum Google și OpenAI se grăbesc să ofere produse pentru consumatori care demonstrează tehnologia nouă și interesantă, chiar dacă detractorii avertizează că creșterea AI fără limite este periculoasă pentru omenire.

De când OpenAI a introdus Dall-E, un instrument de producție text-la-imagine, în 2021, lucrările de artă generate de AI au inundat rețelele de socializare și au pătruns în obiectele de consum. Google Whisk este un generator imagine-la-imagine care se bazează pe generatoarele text-la-imagine.

Utilizatorii Whisk pot modifica intrările lor și pot amesteca categorii pentru a crea jucării de pluș, broșe emailate și stickere. Utilizatorii pot direcționa detaliile folosind cuvinte, dar o imagine nu este necesară.

„Whisk este conceput pentru a permite utilizatorilor să refacă un subiect, o scenă și un stil în moduri noi și creative, oferind explorare vizuală rapidă în loc de modificări perfecte pixel cu pixel”, a declarat Thomas Iljic, directorul de management de produs Google Labs.

Google a achiziționat DeepMind în 2014 și a folosit AI-ul său generativ pentru a construi Whisk.

Whisk folosește serviciul principal AI al Google, Gemini, introdus în decembrie 2023, și Imagen 3, cel mai recent generator de text-la-imagine al lui DeepMind.

Imagen 3 primește titluri de la Gemini atunci când utilizatorii postează fotografii. Pentru a refața imaginea finală, tehnica capturează „esența” subiectului în loc de o reproducere exactă, care poate să se abată de la prompt.

Google a declarat într-o postare pe blog că imaginea creată poate diferi de fotografiile prompt din punct de vedere al înălțimii, tunsorii sau tonului pielii.

Google a primit critici în februarie când a lansat convertorul text-la-imagine al lui Gemini, deoarece a creat imagini istoric incorecte.

Whisk, un site Google Labs disponibil doar în SUA, este într-o fază incipientă de dezvoltare, a declarat compania.

OpenAI a prezentat Sora, un generator de text-la-video, demonstrând competiția în domeniul produselor pentru consumatori.

Directorul managing și analistul principal al acțiunilor de la Wedbush Securities, Dan Ives, a declarat pentru CNN că Whisk este încă un „moment de întindere a mușchilor” pentru Google în domeniul AI și tehnologiei.

Bunurile AI fac parte din „comoara” Google pentru 2025, care include un nou sistem de operare Android dezvoltat împreună cu Samsung și Qualcomm. „DeepMind este un activ-cheie pentru Google”, a spus Ives.

Picture of Andreea Georgescu
Andreea Georgescu

Editor la Knfinances din 2024.

DECLARAȚIE DE RESPONSABILITATE:

În niciun caz nu vi se va cere să plătiți pentru a accesa orice produs, inclusiv carduri de credit, împrumuturi sau alte oferte. Dacă acest lucru se întâmplă, vă rugăm să ne contactați imediat. Asigurați-vă întotdeauna că citiți termenii și condițiile furnizorului de servicii pe care îl contactați. Generăm venituri prin publicitate și recomandări pentru unele, dar nu pentru toate, produsele prezentate pe acest site web. Tot ceea ce este publicat aici se bazează pe cercetări cantitative și calitative, iar echipa noastră se angajează să fie cât mai echitabilă posibil în compararea opțiunilor concurente.

DIVULGAZIONE DELL'INSERZIONISTA:

Suntem un site editorial independent, obiectiv și finanțat prin publicitate. Pentru a susține capacitatea noastră de a oferi conținut gratuit utilizatorilor noștri, recomandările care apar pe site-ul nostru pot proveni de la companii de la care primim o compensație în calitate de afiliați. Această compensație poate influența modul, locul și ordinea în care ofertele apar pe site-ul nostru. Alți factori, cum ar fi algoritmii noștri proprietari și datele de primă parte, pot influența, de asemenea, modul și locul în care produsele/ofertele sunt poziționate. Nu listăm pe site-ul nostru toate ofertele financiare sau de credit disponibile în prezent pe piață.

NOTĂ EDITORIALĂ:

Opiniile exprimate aici sunt exclusiv ale autorului și nu reprezintă o bancă, un emitent de carduri de credit, un hotel, o companie aeriană sau orice altă entitate. Acest conținut nu a fost examinat, aprobat sau susținut de niciuna dintre entitățile menționate în mesaj. Cu toate acestea, compensația pe care o primim de la partenerii noștri afiliați nu influențează recomandările sau sfaturile furnizate de echipa noastră editorială în articolele noastre și nu influențează în niciun fel conținutul acestui site web. Deși ne străduim să oferim informații corecte și actualizate, pe care le considerăm relevante pentru utilizatorii noștri, nu putem garanta că toate informațiile furnizate sunt complete și nu facem declarații sau garanții cu privire la exactitatea sau aplicabilitatea lor.