OpenAI-ը ներկայացրել է GPT-4o-ն՝ հզոր մուլտիմոդալ գեներատիվ արհեստական ինտելեկտի (AI) մոդելը, որը կներդրվի մշակողների և սպառողների համար լուծումներում առաջիկա մի քանի շաբաթվա ընթացքում: GPT-4o-ի անվանման «o»-ն նշանակում է omni (համապարփակ), ինչը ցույց է տալիս, որ GPT-4o-ն մուլտիմոդալ է:
OpenAI-ի տեխնիկական գծով տնօրեն Միրա Մուրատին Սան Ֆրանցիսկոյում (ԱՄՆ) OpenAI գրասենյակում արտադրանքի շնորհանդեսի ժամանակ նշել է, որ GPT-4o-ն ունի «GPT-4 մակարդակի» հետախուզություն, բայց ավելի մեծ հնարավորություններ՝ տեքստի և պատկերների, ինչպես նաև աուդիոյի հետ աշխատելու համար:
«GPT-4o-ն հասկանում է ձայնը, տեքստը և տեսողական պատկերները», — ասել է Մուրատին: «Եվ դա աներևակայելի կարևոր է, երբ մենք մտածում ենք մեր և մեքենաների միջև փոխգործակցության ապագայի մասին»:
GPT-4o-ի հիմնական առանձնահատկությունները
Բազմամոդալություն
GPT-4o-ն կարող է միաժամանակ մշակել տեքստ, աուդիո և պատկերներ: Սա նշանակում է, որ AI-ն կարող է ոչ միայն պատասխանել տեքստային հաղորդագրություններին, այլև արձագանքել ձեր ձայնին, ճանաչել զգացմունքները և վերլուծել վիզուալ տեղեկատվությունը: Օրինակ, դուք կարող եք վերբեռնել լուսանկար կամ տեսանյութ, և մոդելն անմիջապես ձեզ կտրամադրի վերլուծություն կամ պատասխան:
Արտադրողականություն
GPT-4o-ի հիմնական հատկանիշներից մեկը դրա արագությունն է: Ձայնային հարցումների արձագանքման ժամանակը ընդամենը 232 միլիվայրկյան է, իսկ միջին պատասխանի ժամանակը՝ 320 միլիվայրկյան: Սա AI-ի հետ փոխգործակցությունը դարձնում է հնարավորինս արագ և հարթ, գրեթե չի տարբերվում մարդու հետ շփումից:
Տնտեսական արդյունավետություն
«GPT-4o-ն բերում է GPT-4 բանականությունը բոլոր օգտատերերին, ներառյալ անվճար օգտվողներին», — ասել է OpenAI-ի տնօրեն Միրա Մուրատտին:
Անվճար մակարդակի օգտվողները ավտոմատ կերպով կթարմացվեն GPT-4o-ի, սակայն հաղորդագրությունների սահմանափակումով, որը կախված կլինի ընթացիկ պահանջարկից և օգտագործումից: Եթե GPT-4o-ն անհասանելի դառնա, նրանք կվերադառնան GPT-3.5-ի օգտագործմանը:
GPT-4o-ն երկու անգամ ավելի արագ է և API-ում արժե 50%-ով ավելի քիչ, քան նախորդ GPT-4 Turbo մոդելը: Սա այն դարձնում է հասանելի ավելի լայն լսարանի համար: Նոր մոդելի արդյունավետությունն ու ծախսարդյունավետությունը բազմաթիվ հնարավորություններ են բացում մշակողների և բիզնեսի համար:
GPT-4o-ն ոչ միայն ամենաարդյունավետ մոդելն է, այլև ամենախելացին: GPT-4o-ն COT MMLU-ի համար սահմանում է 88,7% նոր ռեկորդ՝ զրոյական պատասխանով (ընդհանուր հարցեր):
Հասկանալու բարելավված կարողություն
GPT-4o-ն զգալիորեն բարելավել է աշխատանքը ոչ անգլերեն լեզուներով: Եթե նախկինում մոդելները կարող էին սխալներ թույլ տալ կամ տալ ոչ լրիվ ճիշտ պատասխաններ այլ լեզուներով, այժմ GPT-4o-ն ավելի լավ է հաղթահարում այս խնդիրը, ինչն այն օգտակար է դարձնում ամբողջ աշխարհի օգտատերերի համար՝ անկախ նրանց մայրենի լեզվից:
Լրացուցիչ հնարավորություններ
- Աուդիո և վիզուալ ճանաչում. GPT-4o-ն կարող է վերլուծել ձայնի տոնայնությունը, հայտնաբերել զգացմունքները և ճանաչել միկրոարտահայտությունները:
- Հավելվածների լայն տեսականի. մոդելն ընդունակ է գրել կոդեր, լուծել մաթեմատիկական խնդիրներ և նույնիսկ անեկդոտներ պատմել:
- Համակարգչի և շարժական սարքերի ինտեգրում. Mac-ի և Windows-ի համար նախատեսված հավելվածները թույլ են տալիս ինտեգրել GPT-4o-ն ձեր աշխատանքային հոսքին՝ իրական ժամանակի պատասխաններ տալով այն ամենին, ինչ տեղի է ունենում ձեր էկրանին:
Գործնական կիրառություններ
GPT-4o-ի շնորհանդեսի ժամանակ OpenAI-ը ցուցադրել է մոդելի իրական ժամանակի տպավորիչ հնարավորությունները: Մոդելը ճանաչել է հույզերը, արձագանքել ձայնի տոնին և նույնիսկ կատակել։
Հետազոտողներից մեկը ցույց է տվել, թե ինչպես է GPT-4o-ն հաշված վայրկյանների ընթացքում լուծում բարդ մաթեմատիկական խնդիրներ և գրում կոդ։ Օրինակ, մոդելը կարողացել է ստեղծել բարդ SQL հարցում ընդամենը երեք վայրկյանում:
Մեկ այլ ցուցադրություն ներառում էր YouTube-ի տեսանյութի վերլուծությունը. GPT-4o-ն դիտել է տեսանյութը և ճշգրիտ արտասանել դրա բովանդակությունը: Այս օրինակները ցույց են տալիս, թե որքան բազմաֆունկցիոնալ է դարձել նոր մոդելը:
Նորարարություն և կատարելագործում
GPT-4o-ն ոչ միայն հզոր և արագ մոդել է, այլև անվտանգ: OpenAI-ը ներկայացրել է անվտանգության նոր միջոցներ, ինչպիսիք են վերապատրաստման տվյալների զտումը և մոդելի վարքագծի ճշգրտումը: Մոդելը ենթարկվել է անվտանգության խիստ փորձարկումների՝ արտաքին փորձագետների մասնակցությամբ։ Այն այժմ ավելի լավ պաշտպանված է չարաշահումից և ունի ներկառուցված համակարգեր՝ ձայնային գործառույթների անվտանգ օգտագործումն ապահովելու համար:
GPT-4o-ն արդեն հասանելի է ինչպես վճարովի, այնպես էլ անվճար բաժանորդների համար, բայց վճարովի՝ ChatGPT Plus և Team պլանների բաժանորդների համար հաղորդագրությունների սահմանաչափը կլինի «5 անգամ ավելի բարձր»։
Միացե՛ք How2B-ի Տելեգրամյան ալիքին՝ ամենահետաքրքիր հոդվածներն ու նորությունները բաց չթողնելու համար: