Դեռևս հոկտեմբերին Apple-ը, Կոռնելի համալսարանի գիտնականների աջակցությամբ, հանրությանը հասանելի է դարձրել իր սեփական մուլտիմոդալ լայնալեզու Ferret մոդելը, որը կարող է ընդունել պատկերների հատվածները որպես հարցումներ:
Ferret-ի թողարկումը GitHub-ում հոկտեմբերին չի ուղեկցվել Apple-ի լայնամասշտաբ հայտարարություններով, սակայն նախագիծն, այնուամենայնիվ, ներգրավել է ոլորտի փորձագետների մասնակցությունը:
Ferret-ի գործառնական սկզբունքն այն է, որ մոդելն ուսումնասիրում է պատկերի որոշակի հատվածը, նույնականացնում է այս տարածքում գտնվող օբյեկտները և դրանք ուրվագծում շրջանակով: Համակարգը պատկերի հատվածում ճանաչված օբյեկտներն ընկալում է որպես հարցման մաս, որի պատասխանը տրվում է տեքստային ձևաչափով: Օրինակ՝ օգտատերը կարող է նկարում ընդգծել կենդանուն և խնդրել Ֆերետին ճանաչել այն: Մոդելը կպատասխանի, թե որ տեսակին է պատկանում կենդանին, և հնարավոր կլինի լրացուցիչ հարցեր տալ համատեքստում՝ պարզաբանելով այլ առարկաների կամ գործողությունների մասին տեղեկությունները։
Ferret-ի բաց մոդելը համակարգ է, որը կարող է «հղում անել և հիմնավորել ցանկացած բան, ցանկացած վայրում, ցանկացած մանրամասնությամբ», — բացատրել է Apple AI հետազոտող Չժե Գանը:
Վարկածներից մեկի համաձայն՝ Apple-ը որոշել է գնալ այս քայլին, քանի որ ձգտում է մրցակցել Microsoft-ի և Google-ի հետ, սակայն չունի համեմատելի հաշվողական ռեսուրսներ։ Այդ պատճառով, նա չէր կարող հույս դնել ChatGPT-ին սեփական մրցակցին ստեղծելու վրա և ստիպված էր ընտրություն կատարել ամպային հիպերսքեյլերի հետ համագործակցելու և նախագիծը բաց ձևաչափով թողարկելու միջև, ինչպես նախկինում արել էր Meta-ն:
Միացե՛ք How2B-ի Տելեգրամյան ալիքին՝ ամենահետաքրքիր հոդվածներն ու նորությունները բաց չթողնելու համար: