Google heeft het neurale netwerk Imagen geïntroduceerd
Gemengde Berichten / / May 24, 2022
En hij doet het minstens zo goed als DALL-E 2.
Google aangekondigd Imagen is een neuraal netwerk dat een tekstquery omzet in afbeeldingen. Het is een directe concurrent DALL-E2 van OpenAI - wat in sommige scenario's nog beter werkt.
Om een tekstquery te herkennen, gebruikt het neurale netwerk grote taalmodellen - algoritmen voor natuurlijke spraakverwerking zoals GPT-3 zijn er ook op gebaseerd.
Het systeem werkt in drie fasen. De eerste tekent een kleine afbeelding van 64 x 64 pixels, die wordt verfijnd totdat het neurale netwerk deze kan wijzigen om beter overeen te komen met het oorspronkelijke verzoek. Het beeld wordt vervolgens opgeschaald tot 256 x 256 pixels en Imagen verfijnt de details. In de derde fase wordt hetzelfde al herhaald met het canvas van de uiteindelijke grootte - 1024 x 1024 pixels.
In de tekst van het onderzoek wordt opgemerkt dat Imagen beter omgaat met het begrijpen van complexe zoekopdrachten dan DALL-E 2. Bijvoorbeeld, voor de zoekopdracht "Panda maakt latte art" retourneerde DALL-E 2 uitsluitend latte art met panda's, terwijl het neurale netwerk van Google erin slaagde om meestal correcte resultaten te produceren:
Maar Google geeft ook toe dat geen van deze neurale netwerken de vraag "paardrijdende astronaut" aankon: beide zetten de astronaut koppig op het paard, en niet omgekeerd. Beiden hebben uiteraard ruimte om te groeien.
De resultaten van onafhankelijke kijkersevaluaties laten zien dat Imagen beter presteert dan DALL-E 2 wat betreft nauwkeurigheid en relevantie. En hoewel deze vergelijking als subjectief kan worden beschouwd, zijn dergelijke resultaten nog steeds indrukwekkend, aangezien DALL-E 2 was tot nu toe een onbereikbaar ideaal dat andere neurale netwerken van vergelijkbare aard niet konden evenaren. bestemming.
In ieder geval blijft Imagen voorlopig een experimenteel project waar gewone gebruikers geen toegang toe hebben. Het is niet duidelijk hoe lang het zal duren voordat Google op basis daarvan een open access-service creëert.
Lees ook🧐
- Nieuw neuraal netwerk Paint Transformer verandert een foto in een schilderijobject
- Polaroid van de toekomst: het nieuwe neurale netwerk van NVIDIA verandert 2D-beelden in 3D-modellen
- Sber lanceerde het ruDALL-E neurale netwerk, dat afbeeldingen genereert volgens de beschrijving
Beste aanbieding van de week: kortingen van AliExpress, Lamoda, Mixit en andere winkels