Meta-ն ներկայացրել է Llama 3-ը՝ նոր սերնդի մեծ լեզվական մոդելը, որն անհամեստորեն անվանում է «առայժմ ամենահզոր բաց կոդով LLM-ը»: Ընկերությունը թողարկել է երկու տարբերակ՝ Llama 3 8B և Llama 3 70B, համապատասխանաբար, 8 և 70 միլիարդ պարամետրերով։ Ընկերության տվյալներով՝ AI նոր մոդելները զգալիորեն գերազանցում են նախորդ սերնդի համապատասխան մոդելները և ներկայումս առկա գեներատիվ արհեստական ինտելեկտի լավագույն մոդելներից են։
Որպես իր հայտարարությունների ապացույց Meta-ն տրամադրում է հանրաճանաչ թեստերի արդյունքները՝ MMLU (գիտելիք), ARC (սովորելու ունակություն) և DROP (տեքստի հատվածների վերլուծություն): Llama 3 8B-ը գերազանցում է իր դասի այլ բաց կոդով մոդելներին, ինչպիսիք են Mistral-ի Mistral 7B-ը և Google-ի Gemma 7B-ը՝ 7 միլիարդ պարամետրով, առնվազն ինը թեստերում։ Այնուամենայնիվ, Meta-ն շատ ավելի հպարտ է իր ավելի առաջադեմ մոդելով՝ Llama 3 70B-ով, որը դասվում է գեներատիվ AI-ի այլ առաջատար մոդելների շարքին, այդ թվում՝ Gemini 1.5 Pro-ն, որն ամենաառաջադեմն է Google-ի Gemini-ի շարքում:
Ըստ Meta-ի՝ նոր մոդելներն ավելի կառավարելի են, ավելի քիչ հավանական է, որ հրաժարվեն հարցերին պատասխանելուց և, ընդհանուր առմամբ, ավելի ճշգրիտ տեղեկատվություն են արտադրում, այդ թվում՝ գիտական որոշ ոլորտներում, ինչը, հավանաբար, արդարացված է դրանց վերապատրաստման համար օգտագործվող հսկայական քանակությամբ տվյալներով՝ 15 տրիլիոն նշան և 750 միլիարդ բառ, որը յոթ անգամ ավելի է, քան Llama 2-ի դեպքում:
Llama 3-ը շուտով հասանելի կլինի Amazon Web Services-ում, Google Cloud-ում, Microsoft Azure-ում և NVIDIA NIM-ում: Առաջիկա ամիսներին Meta-ն նախատեսում է նաև նոր հնարավորություններ ներկայացնել Llama 3-ի համար՝ ավելի երկար համատեքստային պատուհաններ, մոդելի լրացուցիչ չափսեր, և ընկերությունը կհրապարակի նաև AI մոդելի վերաբերյալ հետազոտական հոդվածներ:
Միացե՛ք How2B-ի Տելեգրամյան ալիքին՝ ամենահետաքրքիր հոդվածներն ու նորությունները բաց չթողնելու համար: