Google-ը ներկայացրել է Imagen նեյրոցանցը, որը տեքստի հիման վրա պատկերներ է ստեղծում։ Դրա համար օգտագործվում է դիֆուզիայի մեթոդը. սկզբում ստեղծվում է պատկերի պարզ էսքիզը, այնուհետև այն բարելավվում է այնքան ժամանակ, մինչև արհեստական բանականությունը (AI) որոշի, որ այն բավականաչափ նման է նշված պարամետրերին։
Imagen-ը սկսում է աշխատանքը 64×64 պիքսել չափի պատկերի ստեղծումից, այնուհետև 2 մոտեցմամբ խոշորացնում այն մինչև 1024×1024, սակայն ոչ թե պարզապես մասշտաբայնացնում է պատկերը, այլ յուրաքանչյուր մոտեցման ժամանակ AI-ն նոր դետալներ է ավելացնում, որպեսզի այն մաքսիմալ նման լինի «տեխնիկական առաջադրանքին»։ Կարելի է ասել՝ իրական նկարիչի նման, ով սկզբում գծում է կոպիտ էսքիզը, այնուհետև ավելացնում դետալներ և մասշտաբայնացնում։
Google-ը պնդում է, որ ընկերության ստեղծած նեյրոցանցը պատկերները գեներացնում է «աննախադեպ ֆոտոռեալիզմով»։ Imagen-ի ստեղծողներն այն համեմատում են հայտնի DALL-E 2 անալոգի հետ և նույնիսկ նշում են, որ Imagen-ն ավելի ճշգրիտ պատկերներ է ստանում։
Imagen-ը դեռևս գտնվում է թեստավորման փուլում։ Կայքում հասանելի է պրոդուկտի դեմո տարբերակը, սակայն օգտատերերը կարող են կազմել նախադասություններ միայն կայքում առկա բառերով։
Ահա մի քանի օրինակ.
Տեխնոլոգիական և բիզնես ոլորտի այլ նորությունների ծանոթացե՛ք՝ միանալով մեր Տելեգրամյան ալիքին։