Portré: Dr. Feldmann Ádám
Portré: Dr. Feldmann Ádám
Happ Zsuzsa / 2023-07-21 lokál
Amíg mi csak találgatjuk, hogy mi is az AI tulajdonképpen, addig Dr. Feldmann Ádám évek óta „beszélget” gépekkel. Fejleszti és tanítja a mesterséges intelligenciát, ugyanakkor használja is szövegek generálására vagy éppen programozási feladatokra. Amit próbálunk összefoglalni ebben a cikkben az általa elmondottakból, az csak egy töredéke annak a különleges tudásnak, amivel bír.

Ádám útja a pszichológián keresztül vezetett a nagy nyelvi modellekig. „Amikor a pszichológia irányába mentem, már akkor sem terapeuta akartam lenni, hiszen engem az érdekelt, hogy az emberi kognitív, affektív és szociális funkciókat hogyan tudjuk modellezni. A mai értelemben vett mesterséges intelligencia története az 1950-es években kezdődött és az akkori alapok még mindig be vannak építve azokba a modellekbe, amiket most is használunk. Az 1990-es években megtorpant a terület fejlődése és egészen a 2010-es évekig búvópatakként működött, amíg újra előtérbe nem került. Amikor az emberi látórendszer neuropszichológiáját tanítottam harmadéves orvostanhallgatóknak, bemutattunk olyan folyamatábrákat is, amelyek nagyon hasonlóak azokhoz a mesterséges neurális hálózatokhoz, amik a képosztályozást és -felismerést végzik, például az önvezető autókban is. Vagyis ahhoz, hogy lássunk és felismerjünk tárgyakat, ugyanúgy szűrőrendszerek segítenek az agyunknak, mint ahogy a mesterséges intelligencia által vezérelt rendszerekben.”

A nagy nyelvi modellek lényege a szakértő szerint leegyszerűsítve valami olyasmi, hogy a weben elérhető hatalmas mennyiségű szöveges információt beletesszük egy dobozba. „Ezután az információt nem utasítássorozatokban, programkódokban, hanem a saját nyelvünkön kérdezhetjük le. Ahogy fejlődnek ezek a rendszerek, úgy egyre kisebb dobozba férnek bele és egyre többet tudnak. Eljutottunk egy olyan pontig, hogy nagyon nagy mennyiségű szöveg használatával, statisztikai feldolgozással, elméleti háttér nélkül, nagyon-nagyon nagy számítási kapacitással sok-sok információt tudunk könnyen elérhetővé tenni. Ugyanakkor ezeknek a modelleknek az egyik kulcsa a kontextus, amit ma már nagyon pontosan tudnak értelmezni. Az tudja jól használni ezeket a modelleket – például a ChatGPT-t –, aki tudja, hogyan tegyen fel neki jól kérdést minél pontosabban, felhasználva a kontextuális információt.”

Ádám 2020-ban kezdett el azon dolgozni az ELKH Nyelvtudományi Kutatóközponttal és a Microsofttal együttműködve, hogy létrehozzanak egy nagy magyar nyelvmodellt, a HilBERTet. „A nagy mennyiségű szöveganyag és a számítási kapacitás olyan működésre tette alkalmassá a mesterséges intelligenciát, aminek még nem teljesen értjük a működését, mindenesetre olyanokra lett képes, mint például az absztraktív összefoglalás, információ kinyerés. A mi akkori modellünk – ami magyar nyelvű – a tizedik ilyen volt a világon 2020-ban. Tavaly pedig elkészült a Hilanco–GPTX egy szuperszámítógépen, amely szövegeket tudott generálni. Ezt aztán elsodorta a ChatGPT és a többi sokkal nagyobb volumenű projekt, melyek hirtelen elérhetővé váltak a piacon.”

Joggal merülhet fel a kérdés, hogy miért váltak ezek az eszközök széles körben elérhetővé és hogy mire fogjuk tudni használni őket. „Egyrészt fontos az, hogy ezeket ne lehessen kisajátítani. Másrészt hosszabb távon nagyon nagy előnyre fog szert tenni, aki ezt a technológiát megérti és jól használja. A jelenlegi helyzet azoknak kedvez a piacon, akik magasabb kockázatvállalási hajlandósággal rendelkeznek, illetve integrálni tudják az új eredményeket a meglévő megoldásaikba. A jelenlegi hype mellett természetesen az újtól való félelem is jelen van, ami teljesen érthető egy paradigmaváltási folyamatban. Elkezdtünk olyan eszközöket csinálni, amiket félve vezetünk be a gyakorlatba, mert egészen megváltoztathatják az eddigi világunkat. Sok olyan magas szintű képesség jelent meg ezekben a rendszerekben, amikre nem számítottunk, mert azt gondoltuk, hogy ezek nehezebben megvalósíthatók. Az is látszik, hogy akár teljesen autonóm rendszereket is létre lehet hozni. Jelenleg a nagy nyelvmodell alapú autonóm ágensek fejlesztése az egyik fő terület, amin dolgozom. Idő kell ahhoz és megfelelő intézkedések, hogy megszokjuk és merjük ezeket használni. Lassan a mostani megoldások már egy otthoni gépen is futtathatóak lesznek, vagyis az az emberi tudás, ami évezredek alatt felhalmozódott, bekerülhet egy egészen kezelhető méretű dobozba és úgy lehet majd vele beszélgetni, mintha a világ összes tudásával beszélgetnénk, ami a neten elérhető.”

lokál
Made in Pécs-díj 2019 – A győztesek
 
lokál
Neked munka, nekem álom
 
súgó
Szabad gravitáció