EPFL-ից նոր մուլտիմոդալ մոդել ավելի ճկուն AI-ի համար

Այն կարող է սովորել տեքստից, պատկերներից, տեսանյութից և ձայնից և մոդուլյարության շնորհիվ արտադրում է կանխատեսումների ցանկացած քանակ կամ համակցություն:

Մեքենայի ուսուցում. նոր մուլտիմոդալ մոդել EPFL-ից ավելի ճկուն AI-ի համար
EPFL-ից նոր մուլտիմոդալ մոդել ավելի ճկուն AI-ի համար (Լուսանկարը՝ Brian Penny/Pixabay)

Անկախ նրանից, թե մենք խոսում ենք OpenAI-ի կամ ChatGPT-ի, չաթ-բոտերի ճնշող մեծամասնության մասին գեներատիվ արհեստական ​​բանականություն հիմնված են այսպես կոչված Լեզուների մեծ մոդել (LLM), մոդելներ խորը ուսուցում մեծ մասշտաբով, վերապատրաստվել են իրենց առաջադրված հարցերի պատասխանները տալու համար՝ մեծ քանակությամբ տեքստի միջոցով տեղեկատվություն սովորելու միջոցով:

-ի վերջին սահմանըԳեներատիվ AI սոնո ես մուլտիմոդալ մոդելներ, որոնք համատեղում են լեզվի ըմբռնումն ու պատկերները, վիդեո և աուդիո՝ ավելի առաջադեմ փորձ և ծառայություն առաջարկելու համար:

Դրանց ստեղծումը, սակայն, ներկայացնում է մի քանի մարտահրավեր, հատկապես, եթե նպատակը փոքր մասշտաբով մուլտիմոդալ մոդելներ կառուցելն է. բացակայող տվյալների առկայությունը տեղեկատվության անհասանելիության պատճառով, գրեթե միշտ՝ ռեսուրսների մասնակի առկայության պատճառով։

Մի խոսքով, ռիսկն այն է, որ մոդելը սովորում է բացակայության հիման վրա, և որ հաշվարկներն ու կանխատեսումները խեղաթյուրված են: Եվ ահա, որտեղ EPFL-ն սկսեց իր նոր նախագծով:

Լոզանի և Ցյուրիխի տեխնիկական համալսարանից կանաչ էներգիայի կոալիցիա
Եռաչափ ձևով տեխնոլոգիական ձեռնոց, որը շոշափելի կդարձնի վիրտուալ իրականությունը

Machine Learning
Լոզանի դաշնային պոլիտեխնիկական համալսարանը (Լուսանկարը՝ Facebook/EFPL)

MultiModN, մոդուլային մուլտիմոդալ մոդել, որը ծնվել է Լոզանում

Հետազոտողները Լոզանի դաշնային պոլիտեխնիկ (EPFL), իրականում զարգացել է աշխարհի լավագույն համալսարաններից մեկը՝ ճարտարագիտության և տեղեկատվական տեխնոլոգիաների առումով MultiModN, եզակի մոդուլային մուլտիմոդալ մոդել, որը վերջերս ներկայացվել է NeurIPS2023-ում։

EPFL-ի Համակարգչային գիտության և հաղորդակցության դպրոցի Machine Learning for Education (ML4ED) և Machine Learning and Optimization (MLO) լաբորատորիաների հետազոտողները որոշեցին մշակել և փորձարկել մեծի ճիշտ հակառակը, բայց մտածել ավելի փոքր մասշտաբով:

Ուսուցչի գլխավորությամբ Մերի-Էն Հարթլի, Համաշխարհային Խելացի Առողջապահական Տեխնոլոգիաների Լաբորատորիայի տնօրեն, որը համատեղ հյուրընկալվել էր MLO-ում և Յեյլի բժշկական դպրոցում, և պրոֆեսոր Տանյա ԿեսերML4ED-ի տնօրեն, թիմը ստեղծել է մուլտիմոդալ մոդել, որը կարող է սովորել տեքստից, պատկերներից, տեսանյութերից և ձայներից, բայց որը, ի տարբերություն գոյություն ունեցողների, բաղկացած է. փոքր մոդուլների փոփոխական քանակ, ինքնավար և մուտքային հատուկ:

Վերջինս կարող է ընտրվել առկա տեղեկատվության հիման վրա և այնուհետև միավորվել ցանկացած թվի, համակցության կամ մուտքագրման տեսակի հաջորդականության մեջ: Հետևաբար, այն կարող է առաջացնել կանխատեսումների ցանկացած քանակ կամ համակցություն:

"Մենք գնահատեցինք MultiModN-ը տասը իրական գործունեություն, ներառյալ բժշկական ախտորոշման, ակադեմիական կատարողականի կանխատեսման և եղանակի կանխատեսման աջակցություն, բացատրել է Վինիտրա Սվամի, ML4ED և MLO ասպիրանտ և նախագծի առաջին համահեղինակ:

«Այս փորձերի միջոցով մենք հավատում ենք, որ MultiModN-ը մուլտիմոդալ մոդելավորման առաջին յուրովի մեկնաբանվող և տվյալների նկատմամբ բացակայող մոտեցումն է:".

EPFL-ի «բաղադրատոմսը» ավելի հզոր քվանտային համակարգիչների համար
Արհեստական ​​ինտելեկտից որոշիչ խթանո՞ւմ է կրիպտոարժույթները:

Machine Learning
EPFL Համակարգչային գիտության և հաղորդակցության դպրոց (Լուսանկարը՝ Facebook/EPFL IC)

Օգտագործման առաջին դեպքը. կլինիկական որոշումներ բժշկական անձնակազմի համար

MultiModN-ի առաջին օգտագործման դեպքը կլինի որպես օժանդակ համակարգ կլինիկական որոշումներ ռեսուրսներով սահմանափակ պայմաններում գտնվող բժշկական անձնակազմի համար:

Իրականում, առողջապահության ոլորտում կլինիկական տվյալները հաճախ բացակայում են՝ միգուցե սահմանափակ ռեսուրսների պատճառով (հիվանդը չի կարող իրեն թույլ տալ կոնկրետ թեստ) կամ, ընդհակառակը, ռեսուրսների և տեղեկատվության առատության պատճառով: MultiModN-ն ի վիճակի է սովորել իրական աշխարհի այս տվյալներից՝ առանց կլանելու իր այսպես կոչված կողմնակալությունները, և կանխատեսումները հարմարեցնել ցանկացած համակցության կամ մուտքերի քանակի:

"Տվյալների բացակայությունը հատկանիշ է ռեսուրսներով սահմանափակ համատեքստերում, և քանի որ մոդելները սովորում են այս բացակայող օրինաչափությունները, նրանք կարող են կոդավորել սխալները իրենց կանխատեսումների մեջ»: նա ընդգծել է Մերի-Էն Հարթլի.

«Անկանխատեսելիորեն հասանելի ռեսուրսների առջև ճկունության անհրաժեշտությունը ոգեշնչեց MultiModN-ին".

Լավագույն իրադարձության դեպքում AI-ի և մեքենայական ուսուցման ազդեցությունը ծառայությունների վրա
Թվային արվեստում AI-ի աճող ազդեցության բոլոր պատճառները

Machine Learning
Անալիզի լաբորատորիա (Լուսանկարը՝ Michal Jarmoluk/Pixabay)

Լաբորատորիայից մինչև իրական կյանք. ընթացքի մեջ է թոքաբորբի և տուբերկուլյոզի փորձարկումը

Հրապարակումը, սակայն, միայն առաջին քայլն է իրականացման և դաշտային փորձարկման ուղղությամբ: Պրոֆեսոր Հարթլին աշխատել է Լոզանի համալսարանական հիվանդանոցի (CHUV) և Inselspital-ի՝ Բեռնի համալսարանական հիվանդանոցի գործընկերների հետ՝ անցկացնելու համար. կլինիկական ուսումնասիրություններ կենտրոնացած է թոքաբորբի և տուբերկուլյոզի ախտորոշման վրա ռեսուրսներով սահմանափակ պայմաններում և գտնվում է հազարավոր հիվանդների հավաքագրման գործընթացում Հարավային Աֆրիկա, Տանզանիա, Նամիբիա e Բենին.

Հետազոտական ​​խմբերը ձեռնարկեցին լայնածավալ վերապատրաստման նախաձեռնություն՝ դասավանդելով ավելի քան 100 բժիշկ համակարգված կերպով հավաքել մուլտիմոդալ տվյալներ, ներառյալ ուլտրաձայնային պատկերներ և տեսանյութեր, որպեսզի MultiModN-ը կարողանա ուսուցանվել ցածր ռեսուրսների ռեսուրսների իրական տվյալների նկատմամբ զգայուն լինելու համար:

«Մենք հավաքում ենք հենց այնպիսի բարդ մուլտիմոդալ տվյալներ, որոնց մշակման համար նախատեսված է MultiModN-ը»:,-ասաց բժիշկը Noémie Boillat-Blanco, CHUV-ի վարակաբան.

«Մենք ոգևորված ենք տեսնելով մի մոդել, որը կարող է գնահատել բացակայող ռեսուրսների բարդությունը մեր համատեքստում և սովորական կլինիկական գնահատումների համակարգված բացակայությունը», հավելեց բժիշկը Քրիստինա Քեյթել Շվեյցարիայի մայրաքաղաքի համալսարանական հիվանդանոցի՝ Inselspital-ի։

AI-ի անվտանգությո՞ւնը: Բլետչլի Պարկի հայտարարությունը շատ կարևոր է
Axel Springer-OpenAI առանցքը AI-ի համար՝ լրագրության ծառայության մեջ

EPFL-ի նորարարությունը կոչված է բարելավելու կլինիկական որոշումների կայացումը՝ ապահովելով մասնագիտացված բժշկական գիտելիքների հասանելիություն (Լուսանկարը՝ Irwan/Unsplash)

Մեքենայի ուսուցումը հանրային բարիքի ծառայության մեջ

MultiModN-ի մշակումն ու ուսուցումը ներկայացնում է EPFL-ի ջանքերի շարունակությունը՝ հարմարեցնելու մեքենայական ուսուցման գործիքներն իրականությանը և հանրային բարօրության համար, և տեղի է ունենում գործարկումից անմիջապես հետո: Մեդիտրոն, արհեստական ​​ինտելեկտի մոդել, որը հատուկ մշակված է բժշկական ոլորտի համար։

Meditron-ը նույնպես պատկանում է Large Language Models (LLM) կատեգորիային, սակայն ի տարբերություն ընդհանուր մոդելների, որոնք ծառայում են խնդիրների լայն շրջանակի, այն կենտրոնացած է բժշկական դաշտ, և չափի առումով ավելի կոմպակտ է, բայց նույնքան արդյունավետ:

Meditron-ի նպատակն է ժողովրդավարացնել բժշկական տեղեկատվության հասանելիությունը բարձր որակ, այդպիսով նպաստելով կլինիկական որոշումների կայացմանը:

EPFL հետազոտողները մշակել են երկու տարբերակ՝ համապատասխանաբար 7 միլիարդ և 70 միլիարդ պարամետրերով, և մոդելները վերապատրաստվել են ընտրված, բարձրորակ բժշկական տվյալների աղբյուրների վրա, ներառյալ գիտական ​​գրականությունը և տարբեր կլինիկական ուղեցույցներ՝ ապահովելով լայն և ճշգրիտ գիտելիքների բազա:

Ե՛վ Meditron-ը, որը ներկայացված է 2023 թվականի նոյեմբերին, և՛ MultiModN-ը, հետևաբար, համահունչ են EPFL-ի նոր AI կենտրոնի առաքելությանը, որը կենտրոնանում է այն բանի վրա, թե ինչպես պատասխանատու և արդյունավետ արհեստական ​​ինտելեկտը կարող է խթանել տեխնոլոգիական նորարարությունը՝ ի շահ հասարակության բոլոր հատվածների:

Հեղափոխական սենսորներ, որոնք կարող են փրկել միլիոնավոր մարտկոցներ
AI. Պատերազմը, որը պատրաստվում է բռնկվել, չի լինի այնպես, ինչպես մենք ակնկալում ենք…

Մեքենայի ուսուցում. նոր մուլտիմոդալ մոդել EPFL-ից ավելի ճկուն AI-ի համար
EPFL համալսարանի արտաքին տեսքը՝ Լոզանի դաշնային պոլիտեխնիկական լոգոտիպով (Լուսանկարը՝ Facebook/EFPL IC)