OpenAI-ը ստեղծել է ճշգրիտ պատկերներ անմիջապես ChatGPT-ում ստեղծելու հնարավորություն: Նոր գործառույթը կոչվում է 4o Image Generation և հիմնված է GPT-4o մուլտիմոդալ մոդելի վրա: Այն հասկանում է համատեքստը, բարդ հրահանգները, օբյեկտների փոխազդեցությունները և նույնիսկ ստեղծում է տեքստային գրառումներ՝ առանց արտեֆակտի: Մուտքն այսօրվանից բաց կլինի բոլորի համար։
ChatGPT-ն նախկինում էլ կարողանում էր պատկերներ ստեղծել Dall-E 3 նեյրոնային ցանցի միջոցով: Այնուամենայնիվ, թարմացված գործառույթը շատ ավելի լավ և ճշգրիտ է աշխատում: OpenAI-ի խոսնակ Տայա Քրիստիանսոնը պարզաբանել է, որ անվճար օգտատերերի սահմանաչափերը կմնան նույնը, ինչ DALL-E-ն, որը կազմում է օրական երեք պատկեր։
4o Image Generation-ը առանց սխալների մշակում է 15-20 օբյեկտ, չնայած որ մյուս մոդելների մեծ մասը շփոթվում է 5-8 օբյեկտ մշակելիս:
Օգտատերերը կնկատեն նաև տեքստի մատուցման բարելավումներ՝ թույլ տալով պատկերների վրա գեներացնել ընթեռնելի, տառասխալներից զերծ տեքստ: Պատկերների ստեղծման գոյություն ունեցող գործիքներում տեքստը հաճախ խեղաթյուրվում է, և այս իմաստով որակյալ մատուցման հասնելը լուրջ մարտահրավեր է, քանի որ վերնագրերում կամ տեքստային տարրերի նույնիսկ փոքր սխալները կարող են ամբողջ պատկերը օգտագործման համար ոչ պիտանի դարձնել։
Համակարգը նաև այժմ օգտագործում է ոչ ստանդարտ գեներացման մեթոդ: Պատկերները ստեղծվում են հաջորդաբար՝ ձախից աջ և վերևից ներքև, այլ ոչ թե մեկ կտորով, ինչպես դա DALL-E-ում է:
OpenAI-ը ցուցադրել է 4o Image Generation-ի հնարավորությունները գիտական դիագրամների վրա, ինչպիսիք են Նյուտոնի պրիզմայի փորձը, կոմիքսները և պաստառները: Ցուցադրվել են նաև գործնական կիրառություններ՝ սթիքերների, ռեստորանների մենյուների և լոգոների համար թափանցիկ ֆոնով պատկերներ ստեղծելու գործում: 4o Image Generation-ը բոլոր առաջադրանքները հաջողությամբ ավարտել է՝ առանց տեքստում սխալներ թույլ տալու:
4o Image Generation-ը կարող է նաև խմբագրել օգտատիրոջ կողմից վերբեռնված պատկերները՝ հիմնվելով պարզ հարցումների վրա, ավելացնելով դրանց տարրերը կամ հեռացնելով դրանք:

Կարդացե՛ք նաև