Modelele Text-to-Image sunt sisteme generative de inteligență artificială care creează imagini originale pe baza unei descrieri textuale oferite de utilizator. Aceste modele combină procesarea limbajului natural cu viziunea computerizată, interpretând semnificația instrucțiunilor scrise și transpunându-le într-un conținut vizual coerent, detaliat și adesea realist.
Modelele avansate Text-to-Image, precum DALL·E, Stable Diffusion, Midjourney sau Imagen, folosesc arhitecturi de tip transformer și/sau modele de difuzie. Ele sunt aplicate în design grafic, publicitate, jocuri video, artă digitală, modă și prototipare rapidă. Prin capacitatea de a genera imagini la cerere, aceste modele democratizează procesul creativ și permit utilizatorilor să transforme ideile în vizualuri fără a avea competențe artistice tradiționale.