Anthropic ընկերությունը ներկայացրել է Claude Sonnet 5 արհեստական բանականության նոր մոդելը, որի մշակման ընթացքում հիմնական ուշադրությունը կենտրոնացվել է ԱԲ գործակալների (AI agents) արդյունավետ կառավարման վրա։
Ընկերության խոսքով՝ Claude Sonnet 5-ը կարողանում է ինքնուրույն պլանավորել գործողությունները, օգտվել բրաուզերից և տերմինալից, ինչպես նաև կատարել բարդ առաջադրանքներ՝ աշխատելով գրեթե ամբողջովին ինքնավար։ Anthropic-ում նշում են, որ նման հնարավորությունները մինչև վերջերս բնորոշ էին միայն ավելի հզոր և թանկարժեք մոդելներին։
Claude Sonnet 5-ը դասվում է միջին դասի մոդելների շարքին, սակայն առաջարկում է աշխատանքի որակ, որը մոտ է Claude Opus 4.8-ին՝ զգալիորեն ավելի ցածր արժեքով։ Նոր մոդելն արդեն դարձել է Claude հարթակի լռելյայն տարբերակը՝ ինչպես անվճար, այնպես էլ վճարովի բաժանորդների համար։
API-ի միջոցով Sonnet 5-ի օգտագործման արժեքը մինչև օգոստոսի 31-ը կազմում է 2 դոլար՝ 1 միլիոն մուտքային և 10 դոլար՝ 1 միլիոն ելքային տոկենի համար։ Դրանից հետո սակագները կբարձրանան՝ համապատասխանաբար հասնելով 3 և 15 դոլարի։
Anthropic-ի ներկայացրած տվյալների համաձայն՝ ծրագրավորման թեստերից մեկում Claude Sonnet 5-ը հավաքել է 63,2%, մինչդեռ Opus 4.8-ը՝ 69,2%, իսկ նախորդ Sonnet 4.6-ը՝ 58,1%։ Տվյալների մշակման որոշ փորձարկումներում Sonnet 5-ը նույնիսկ գերազանցել է Opus 4.8-ին։
Ընկերությունում նշում են, որ Opus 4.8-ը շարունակում է մնալ առավել նպատակահարմար ընտրություն այն դեպքերում, երբ պահանջվում է առավելագույն ճշգրտություն, սակայն Sonnet 5-ը մշակողներին առաջարկում է զգալիորեն ավելի մատչելի լուծում՝ բարձր արդյունավետությամբ և ծախսերի ու կատարողականի հավասարակշռությամբ։
Նոր մոդելը նաև դարձել է ավելի անվտանգ: Sonnet 5-ը ավելի հազվադեպ է ցուցաբերում «անցանկալի վարքագիծ», ավելի լավ է դիմադրում վնասակար հրահանգներին և հարցումների միջոցով իրականացվող հարձակումներին, ինչպես նաև նախորդ տարբերակի համեմատ ավելի քիչ է հալյուցինացնում և ավելի հազվադեպ է տալիս օգտատիրոջը հաճոյանալու միտված պատասխաններ։
Միևնույն ժամանակ Anthropic-ը նշում է, որ Sonnet 5-ը դեռևս զիջում է Claude Opus 4.8-ին և Claude Mythos Preview-ին ամենաբարդ խնդիրների լուծման հարցում։ Ընկերության գնահատմամբ՝ Sonnet 5-ն ունի նաև զգալիորեն ավելի սահմանափակ կարողություններ կիբերանվտանգության ոլորտում վտանգավոր գործողություններ իրականացնելու տեսանկյունից, ինչը դիտարկվում է որպես անվտանգության լրացուցիչ առավելություն։












