AI-kunst is de populairste trend van 2022, en dat is allemaal te danken aan modellen als DALL-E en Stable Diffusion. Hiermee kun je griezelig realistische AI-aangedreven afbeeldingen genereren. Stable Diffusion 2 is officieel uitgebracht en brengt verschillende verbeteringen met zich mee – en wordt blijkbaar ook op andere aspecten verbeterd.
De grootste verbeteringen van Stable Diffusion 2 zijn netjes samengevat door Stability AI, maar in principe kun je nauwkeurigere tekstprompts en realistischere afbeeldingen verwachten. De tekst-naar-afbeelding-modellen zijn getraind met een nieuwe tekst-encoder (OpenCLIP) en ze kunnen 512×512 en 768×768 afbeeldingen uitvoeren.
Andere modellen verbeteren ook veel, waaronder de upscaler, die nu veel nauwkeurigere afbeeldingen kan produceren, en het depth-to-image-model, dat nieuwe afbeeldingen kan genereren met zowel tekst als een bestaande afbeelding. Er is ook een inpainting-model dat delen van een afbeelding kan verwisselen om een ​​geheel nieuwe afbeelding te genereren.
De nieuwe update heeft echter enkele nadelen. Gebruikers hebben geklaagd dat de nieuwe versie van Stable Diffusion het moeilijker maakt om NSFW-inhoud te genereren, evenals kunst die de stijl van een echte artiest imiteert, waardoor sommigen beweren dat de nieuwe versie “nerfed” is. Gezien de zware kritiek van AI-kunst op zijn vermogen om echt uitziende nepbeelden te produceren, zou het niet verrassend zijn als het model opzettelijk afdwaalt van het produceren van beelden die problemen kunnen veroorzaken.
Als je toegang wilt tot de nieuwe Stable Diffusion 2, bekijk dan zeker meer op GitHub.
Bron: Stabiliteits-AI, Engadget