Alibaba Cloud-ը՝ չինական Alibaba ընկերության ամպային ստորաբաժանումը, հայտարարել է նորացված, լայնամասշտաբ լեզվական մոդելի՝ Qwen2.5-Max-ի թողարկման մասին:
AI մոդելը հիմնված է Mixture-of-Experts (MoE) ճարտարապետության վրա և վերապատրաստվել է ավելի քան 20 տրիլիոն տոկենների վրա: Մշակողները շեշտում են, որ գործիքը ցույց է տվել «զգալի առաջընթաց ինտելեկտուալ հնարավորությունների մեջ» և արդեն հասանելի է օգտագործման համար:
Մոդելի նոր տարբերակն առանձնանում է բարելավված կատարողականությամբ և ճշգրտությամբ, ինչպես նաև ավելի լավ է կարողանում լուծել համատեքստի խորը ընկալում պահանջող առաջադրանքներ, ինչպիսիք են՝ տեքստի վերլուծությունը, թարգմանությունը և բովանդակության ստեղծումը:
«Qwen2.5-Max-ը զգալի առաջընթաց է ցույց տալիս բարդ հարցումների մշակման և համապատասխան պատասխանների տրամադրման գործում», — գրում է ընկերությունն իր բլոգում:
Մոդելը գերազանցություն է ցույց տվել DeepSeek V3-ի նկատմամբ այնպիսի թեստերում, ինչպիսիք են Arena-Hard-ը, LiveBench-ը և LiveCodeBench-ը, ինչպես նաև ցույց է տվել մրցակցային արդյունքներ MMLU-Pro-ում:
Համեմատելով այլ առաջատար մոդելների հետ, ինչպիսիք են GPT-4o-ն և Claude-3.5-Sonnet-ը, Qwen2.5-Max-ն այստեղ էլ հաստատել է իր առաջատար դիրքը:
Alibaba Cloud-ը նախատեսում է ինտեգրել Qwen2.5-Max-ն իր ամպային ծառայությունների մեջ՝ թույլ տալով հաճախորդներին օգտագործել գործիքը՝ լուծելու խնդիրների լայն շրջանակ, ներառյալ տվյալների մշակման ավտոմատացումը, չաթ-բոտերի միջոցով հաճախորդների փոխհարաբերությունների բարելավումը և բիզնես գործընթացների օպտիմալացումը:
AI-ի մոդելն արդեն հասանելի է Qwen Chat ծառայության միջոցով, որտեղ օգտատերերը կարող են շփվել Qwen2.5-Max-ի հետ, փորձարկել դրա հնարավորությունները։ API-ը նույնպես բաց է մշակողների համար: Մուտք գործելու համար անհրաժեշտ է գրանցվել Alibaba Cloud-ում, ակտիվացնել Model Studio ծառայությունը և ստեղծել API բանալի:
Կարդացե՛ք նաև.