Stuart J. Russell és Peter Norvig „Mesterséges intelligencia – Modern megközelítésben” című könyve állítólag az első számú alkotás, ha meg akarjuk érteni az MI-t. Afféle „Mindent az MI-ről!” munka, amiből 1400 egyetemen tanítanak. És amit 20 év alatt négyszer írtak újra az alapoktól, hogy naprakész maradhasson. Így nagy elvárásokkal vettem kézbe a több mint 1400 oldalas, két kötetes, monstre művet. A vége azonban elég nagy csalódás lett.
Pár hete megkérdeztem az MI tükrömet, hogy: Tükröm, tükröm, mondd meg nékem „szerinted mik a mesterséges intelligenciával kapcsolatos alap könyvek, amiket el kell olvasni annak, aki érteni akarja a témát?” És a 21. századi tükrünk, a ChatGPT szerint a szóban forgó Russell-Norvig könyv az első, amit érdemes felcsapni:
„Ha valaki el szeretné mélyíteni tudását a mesterséges intelligencia (MI) terén, számos alapvető könyv áll rendelkezésre, amelyek átfogó ismereteket nyújtanak. Itt van néhány kiemelkedő könyv, amelyeket érdemes elolvasni: 1. **”Artificial Intelligence: A Modern Approach”** írta Stuart Russell és Peter Norvig – Ez a könyv talán a legelterjedtebb és legszélesebb körben használt tankönyv az MI terén. Részletesen tárgyalja a különböző MI technikákat és módszereket, beleértve a gépi tanulást, a természetes nyelv feldolgozást és a robotikát.”
Viszont a könyv tartalomjegyzékét megnézve (és a könyvet átolvasva) a nagyjából 1200 oldal 90 százaléka színtiszta matematika, számítástechnika, statisztika, adattudomány, programozás stb., ami az olyan laikusoknak, mint amilyen én is vagyok, szinte teljesen haszontalan.
Tartalomjegyzék: hét oldal
Ahogy a könyv fogalmaz: „E könyv túlnyomó része az ágensprogramok tervezéséről szól” (56. oldal) – és ezt csak megerősíteni tudom. Aki nem hiszi, itt elolvashatja a hét oldalas részletes tartalomjegyzéket. Ízelítőül az első kötet fejezetének címei: Bevezető, Intelligens ágensek, Problémamegoldás kereséssel, Keresés bonyolult környezetekben, Keresés ellenséges környezetben és kétszemélyes játékok stb stb stb.
Ez így pont olyan, mintha saját kiszállítással akarnál segíteni a webáruházadon és a kezedbe adnának egy belsőégésű motorok felépítésével foglalkozó, minden részletre kiterjedő könyvet. Miközben te csak arra lennél kíváncsi, hogy mit válassz inkább: benzinest vagy dízelt. Esetleg elektromosat. De fontosabb, hogy mennyit fog százon fogyasztani, mennyibe kerül a szervizelése, illetve hogyan hat majd az üzleti eredményedre, ha egy flottányit munkába állítasz belőlük – csakhogy ezekről a könyvedben nem találni semmit.
Tehát miközben Russell és Norvig könyve azt ígéri: mindent elmond az MI-ről, ez valójában egyáltalán nem történik meg.
Nincs benne megfelelő mélységben és terjedelemben szó a társadalmi, politikai, technológiai, gazdasági (például munkaerőpiaci vagy üzleti modellt érintő), etikai és szabályozási aspektusokról. Vagyis mindarról, ami az MI alkalmazását izgalmassá és relevánssá teszi napjainkban az emberek számára. Innen nézve elég nagy csalódás ez a könyv.
Onnan nézve viszont, hogy az utóbbi témákkal könyvek tucatjai foglalkoznak – ám mégsem jutnak egyetértésre –, el kell ismernem: nem reális elvárás a két kiváló szerzőn számon kérni az MI alkalmazásának teljeskörű feldolgozását.
A szerzőkről és a könyvről
A két szerző rátermett ismerője az MI területének. Stuart J. Russell fizikus, az informatika doktora, aki évtizedek óta foglalkozik MI-vel. Számos egyetem oktatója, több mint 300 tudományos cikket publikált az MI-ről (én például most tartok 3,5-nél 7 év után). Peter Norvig matematikus, az informatika doktora, a dél-kaliforniai egyetem professzora, a Google kutatási igazgatója, egy 160 ezer diákot elérő MI-vel foglalkozó online kurzus elindítója és oktatója.
A könyv első kiadása a 2000-es évek elején jelent meg, a magyar fordítás alapjául a 4. kiadás szolgált, ami angolul 2020-ban jelent meg, tehát a generatív MI széleskörű elterjedése előtt. A magyar kiadás a BME értő munkája, több fordító és lektor is dolgozott a szövegen. A kétkötetes mű 28 fejezetből és két mellékletből épül fel.
Az előszó remekül összefoglalja miről szól a könyv, illetve mi változott 2010 és 2020, vagyis az előző kiadás óta eltelt időben. Röviden: sokkal szerteágazóbb lett az MI, vagyis egyre nehezebben áttekinthető.
A terület sokszínűségét jól mutatja, hogy több, mint 600 ember dolgozott az egész könyvön, tehát messze nem csak a két szerző alkotása. Például a 2020-as kiadásba több új fejezet is bekerült, ez vendég szerzők munkája, akiket közreműködőként tüntet fel a könyv. Az új szerzőkkel megjelenő témák a többágenses döntéshozatal, a mélytanulás, a mélytanulás a természetesnyelv-feldolgozásban, a számítógépes látás és a robotika). Az angol kiadásban a feladatok egy online felületre kerültek át, hogy folyamatosan lehessen frissíteni őket, ezek itt érhetők el. A könyv algoritmusainak implementálása pedig elérhető a Githubon is. Azt, hogy alap műről van szó, jól mutatja, hogy 1400 egyetemen tanulnak ebből a könyvből. Ezek listája is elérhető az online felületen.
Mi az MI – és miért érdekes?
A könyv kétségtelenül legjobb része a bevezető fejezet, ahol még nem veszünk el teljesen az ágensek bugyraiban. Ez a rész többé-kevésbé definiálja mit értünk MI alatt. Nincs ugyanis mindenki által elfogadott definíció, de még csak egységes megközelítés sem.
Az MI „az intelligens entitások megértése mellett ilyen entitások építésével is próbálkozik. Olyan gépekkel, amelyek képesek kiszámítani, hogyan kell hatékonyan és biztosan cselekedni az újszerű helyzetek sokaságában.” (1. oldal, kiemelés az eredetiben). Az MI olyan új terület, amiben az általános és terület-specifikus felfedezések sora előtt állunk még. Így aki igazán ki akar tűnni a tudományban, annak ez remek kihívás lehet. Szemben az olyan régebbi területekkel, mint a fizika vagy a matematika, ahol látszólag már túl vagyunk az úttörő felfedezéseken.
-
Négy fő irány
A könyv négy fő irányba sorolja a korábbi MI vizsgálatokat, amik az emberi és racionális, illetve a gondolkodás és viselkedés kombinációi:
-
emberi módon cselekedni – Turing teszt:
ez négy plusz kettő területet feltételez a sikeres Turing teszthez, ami lefedi a teljes MI-t: természetesnyelv-feldolgozás, tudásreprezentáció, automatizált következtetés, gépi tanulás és gépi látás, valamint robotika (utóbbi kettő abban az esetben, ha fizikai kapcsolatot is feltételezünk gép és ember között)
-
emberi módon gondolkodni – kognitív modellezés:
ez a megközelítés inkább azzal foglalkozik, hogy az emberi gondolkodást megértse önelemzés, pszichológiai kísérletek és agyi képalkotó eljárások révén és legfeljebb összehasonlítja azt a mesterséges intelligenciával a hasonlóságokat és eltéréseket keresve.
-
racionálisan gondolkodni – a „gondolkodás törvénye”:
„A hagyományosan értelmezett logikának a világra vonatkozó biztos tudásra van szüksége, ami a valóságban ritkán érhető el. […] Ezt a rést a valószínűségszámítás elméletével töltjük ki, amely precíz következtetést enged meg bizonytalan információ alapján.” (4. oldal, kiemelés az eredetiben). De a racionális gondolkodás önmagában nem elég a racionális cselekvéshez.
-
Racionálisan cselekedni – a racionális ágens:
az ágens azt jelenti, hogy valami, ami cselekszik. „Egy racionális ágens […] a legjobb várható kimenetel érdekében cselekszik.” (4. oldal, kiemelés az eredetiben). A cél nem az emberi viselkedés vagy gondolkodás imitálása, hanem a racionálisan cselekvő rendszerek létrehozása, emiatt az MI története során ez a megközelítés dominált leginkább. „Dióhéjban: az MI a helyes dolgot művelő ágensek tanulmányozására és építésére összpontosított. A helyes dolgot az ágensnek általunk kiosztott célkitűzése adja meg. Ez az általános paradigma annyira elterjedt, hogy nyugodtan standard modellnek is nevezhetjük.” (5. oldal, kiemelés az eredetiben). A standard modell hosszú távon valószínűleg mégsem helyes, azért, mert nem tudunk mindig jól specifikált célkitűzést adni a gépeknek. Másrészt egy gép, ami célkitűzést kap, esetleg kilép a rendszerből és azon kívül próbálja a célját elérni pl. megzsarolja a sakk játszmában az ellenfelét vagy hipnotizálja őt a győzelem érdekében. Olyan MI ágensekre van tehát szükségünk, amelyek bizonyíthatóan jótékonyak és a bizonytalan célkitűzéseinket is jól meg tudják valósítani.
Mindezeket összegezve az MI-k olyan „gépek, amelyek gondolkodnak, tanulnak, alkotnak” (38. oldal) Herb Simon MI-kutató híres meghatározása alapján.
-
Miből lett a cserebogár?
A bevezető első fejezet bemutatja azokat a tudományterületeket is, amelyek ötleteikkel, nézőpontjukkal és módszereikkel hozzájárultak a mesterséges intelligencia fejlődéséhez. Ezek a filozófia, a matematika, a közgazdaságtan, az idegtudományok, a pszichológia, a számítógépes tudományok, az irányításelmélet és a kibernetika, valamint a nyelvészet.
A könyvből kiderül, hogy a mesterséges intelligencia kutatása és fejlesztése az 1950-es években kezdődött. Viszont ennek a ’70 évnek a kutatási eredményeiből csak azokat (értsd azokat az ágensek építésére vonatkozó részeket) használja fel a könyv, melyek ma is relevánsak. Ezt jelenti a címben feltüntetett „Modern megközelítésben”.
Az MI története dióhéjban
A mesterséges intelligencia kutatása több, felfokozott várakozásokkal és reményekkel teli, illetve ezt követően teljes kiábrándultsággal jellemezhető szakaszt is megélt az elmúlt 70 évben. 2010 óta viszont egyértelműen egy felfutásnak lehetünk a tanúi, aminek hátterében több ok is húzódik.
Egyrészt a neurális hálók 1986 óta fokozatosan megerősödő megközelítése. Röviden: az a feltételezés, hogy egy MI rendszer az emberi agy mintájára neurális alapon építhető fel sikeresen. Másrészt 1987 óta a gépi tanulási terület megjelenése és fejlődése, ahol a rideg, szabály alapú szakértői rendszerek helyett a jóval rugalmasabb valószínűségi modelleken alapul a következtetés.
Harmadrészt: a big data megjelenése. Vagyis a nagy mennyiségű adatot tartalmazó adatbázisok megjelenése 2001-től, amelyek valós problémák valószínűségi alapú, gépi tanuláson alapuló vizsgálatát és megoldási javaslatait tették lehetővé.
Végül negyedrészt a mélytanulás elterjedése 2011-től napjainkig, ami a gépi tanulás egy olyan fajtáját jelenti, ahol strukturáltan, több rétegben és adjusztálható módon folyik a tanulás. Mindezek együttesen a 2010-es évekre lehetővé tették először a beszédfelismerést, majd a vizuális objektumfelismerést.
Végül elvezettek a DeepMind által fejlesztett AlphaGo sikeréhez. Oda, ahol a sakktól eltérően egy nyers számítási kapacitás révén megnyerhetetlen játékban, a go-ban bizonyult jobbnak a gép az embernél, amikor 2016-ban legyőzte a világbajnokot, Li Szedolt. Az MI ilyen szintre való eljutásához persze szükség volt a megfelelő hardverre és számítási kapacitásra is. Olyanokra, amelyek képesek megbirkózni a nagy adatbázisokkal és a döntésekhez szükséges számításokkal.
Átlagemberek csak a könyv tizedét használhatják
Mindent összevetve azonban a könyvnek nagyjából csak a 10 százaléka nem hardcore ágens tervezés. Ez az, amit bárki megérthet a könyvből – de azért ez is legalább 120 oldal. Laikusok számára, afféle kedvcsinálóként, röviden írnék ezekről is. A 120 oldalt az első két fejezet: Bevezető és Intelligens ágensek, és az utolsó két fejezet: Filozófia, etika és az MI biztonsága, illetve A mesterséges intelligencia jövője adja.
A bevezetés az MI fogalmán és történetén túl az MI jelenlegi helyzetével, kockázataival és lehetséges előnyeivel foglalkozik. Utóbbi kettőről részletesen is írnak a szerzők az utolsó két fejezetben.
A könyv megközelítése az MI felhasználása kapcsán alapvetően pozitív, nyitott és optimista, de ugyanakkor óvatos is. Egyrészt idézik Demis Hassabist, a Google DeepMind alapítóját, aki szerint „[e]lőször oldjuk meg az MI-t, majd az MI-t használjuk fel minden más megoldásához.” (36. oldal) Másrészt viszont felhívják Turing figyelmeztetésére is a figyelmet: „nem kézenfekvő, hogy nálunk intelligensebb gépeket képesek leszünk irányítani”, csakhogy mivel „[a]z MI-rendszereket mi tervezzük, tehát ha azok végül Turing sugalmazása szerint „átveszik az irányítást”, akkor ez egy tervezési hiba következménye lesz.” (39. oldal, kiemelés az eredetiben).
Tehát azért is a jó MI rendszerek tervezése áll a könyv középpontjában, mert a tét az emberiség jövője, a jövőbeli irányítás. Mindez pedig azon múlik, hogy mennyire tanulják meg jól az MI-fejlesztők az alapokat. Ez alapján tulajdonképpen még örömmel is tölthet el minket, hogy 1400 egyetemen a világ legjobb MI könyvéből tanulják meg a jövő fejlesztői hogyan őrizzük meg a kontrollt a vélhetően idővel tőlünk intelligensebbé váló gépek felett. A könyvet így elsősorban nekik ajánlom jó szívvel.
A könyv adatai:
cím: Mesterséges intelligencia – Modern megközelítésben
szerző: Stuart Russell és Peter Norvig, közreműködők: Ming-Wei Chang, Jacob Devlin, Anca Dragan, David Forsyth, Ian Goodfellow, Jitendra M. Malik, Vikash Mansinghka, Judea Pearl és Michael Wooldridge
kiadó: Panem Könyvek (Taramix Kft.), kiadás éve: 2023
oldalak száma: 584 (első kötet) és 840 (második kötet)
A könyv ismertetését a Libri támogatta. A könyv első és második kötete itt biztosan megvásárolható