A növekvő érdeklődés és a rengeteg újdonság miatt a mesterséges intelligencia népszerű téma lett a kereskedelmi konferenciákon, hangsúlyosan megjelent például az Ecommerce Hungary szokásos nyári nagykonferenciáján vagy a Laurel Retail rendezvényen is, hogy csak két példát említsünk a közelmúltból. Nem árt azonban leszögezni, hogy bár az MI fejlődése több mint fél évszázados múltra tekint vissza, fejlettebb eszközeinek gyakorlati alkalmazása még gyerekcipőben jár: igazából nem az a kérdés, hogy mire használják most, hanem hogy mire lesz jó a jövőben.
A mesterséges intelligenciának nincs pontos, általánosan elfogadott definíciója, éppen ezért, ha mondjuk ketten beszélgetnek róla, nem árt rögtön az elején tisztázni, hogy ki mit ért alatta. A definíciós bizonytalanság ellenére nyugodtan kijelenthetjük, hogy a technológia fejlődésében a közelmúltban látványos ugrás következett be, ami fontos, egymással konvergáló trendeknek köszönhető, így leginkább a számítógépes kapacitások növekedésének (Moore törvénye), a felhőinformatika terjedésének, valamint az adatok gyűjtésében, tárolásában, feldolgozásában bekövetkezett forradalomnak, de nem szabad lebecsülnünk a matematikusok és a programozók teljesítményét, a szükséges algoritmuskészlet fejlődését sem.
Amiről pár éve még csak beszéltünk és álmodoztunk, amiről csak a kutatókkal és fejlesztőkkel készített interjúkban olvastunk, most lehetségessé vált. Megjelent és terjedni fog, de hogy merre és milyen sebességgel, az számos tényezőtől függ. Az innovációk diffúziójával foglalkozó elemzések szerint az terjed gyorsan, ami
- egyértelmű, jól látható előnyöket mutat a korábbi megoldásokkal szemben;
- kompatibilis a már meglévő eszközökkel és rendszerekkel, azokkal könnyen összekapcsolható, integrálható, hadrendbe állítható anélkül, hogy minden már meglévő holminkat kidobnánk;
- mérsékelten komplex, megértése, használata nem haladja meg az alkalmazó szellemi kapacitásait és képességeit;
- viszonylag olcsón és egyszerűen kipróbálható;
- működés közben megfigyelhető, eredményei jól láthatók;
- hajlékony, jól adaptálható, igény szerint módosítható.
Ezeknek a követelményeknek most leginkább a ChatGPT és a Stability DreamStudio nagyközönség számára hozzáférhető alkalmazásai felelnek meg, hasonló funkciójú és működési elvű rokonaikkal együtt. Sokféle célra használhatók, és bizonyára megmozgatják a kereskedők fantáziáját is, akik hamar felfigyeltek a marketing, ügyfélszolgálati, adminisztrációs és egyéb lehetőségekre. Az általános érdeklődés nagy, a piaci láz nő, amit jól jelez a nagy nyelvi modellek tréningezéséhez használható chipeket gyártó Nvidia részvényeinek tőzsdei árfolyama: januárban még csak 150 dollárnál járt, júniusban viszont már meghaladta a 400-at.
Emberi és emberfeletti képességek
A verseny különösen éles a nagy nyelvi modellek (LLM) világában, ahol egymást érve jönnek a termékbejelentések: február 24-én a Meta jelentkezett az LLaMA modellel, március 10-én a Google szállt ringbe a PaLM-E-vel, öt napra rá a Baidu lépett színre az ERNIE chatbottal, de még így sem előzte meg az egy nappal korábban az OpenAI által bejelentett új GPT verziót, a GPT-4-et. Március 22-én pedig a GitHub jelentkezett a programozókat támogató Copilot X-szel.
Az MI legújabb eszközei gépi tanulásra, bonyolult, sokelemű és százmilliárdos nagyságrendű beállítható (vagy mondjuk inkább így: tanulás során beállítódó) paraméterből álló neurális hálókra épülnek. A hatalmas adattömeggel történő tréningezés során kialakuló modellek valóban emberi, esetenként emberfeletti képességekkel bírnak. Ha a modell méreteit és a betáplált tréningadatok tömegét növelik, olyan képességek jelenhetnek meg, amelyekre a fejlesztők nem is számítottak.
A képességeket (például az arcfelismerés vagy a nyelvi fordítás képességét) nem „beleprogramozzák” a gépekbe, hanem a tanulás során a gép önmagát programozza; az eredmény egy olyan modell lesz, ami méretei és komplexitása miatt ember számára felfoghatatlan, ráadásul, ha a tanulás nem áll le, folyamatosan változik. A gépi tanulásra épülő mesterséges intelligenciát alapvetően ez különbözteti meg a „hagyományos” statisztikai elemzéstől. A „hagyományos” szót azért tettük idézőjelbe, mert az adatelemzés tudománya rengeteget fejlődött, eszközei közül jó néhány versenyképes alternatívát kínál a gépi tanulással szemben: az alkalmazónak kell eldöntenie, hogy adott feladatra melyiket használja. A kereskedők között minden bizonnyal vannak olyanok, akik már ügyesen alkalmazzák a „hagyományos” statisztikai eszközöket például a kereslet előrejelzésére, a készletek optimalizálására, mindenféle okos rendszerek építésére, mások viszont egy nagy ugrással egyből az MI világába kerülhetnek.
Ezen a ponton fogalmazzunk meg két fontos állítást:
- A gépi tanulásra épülő mesterséges intelligencia általános célú technológia, ami sokféle célra használható, és ezért sokféle helyen megjelenhet. A gépi tanulás eszközei olyan egymástól távoli területeken bukkannak fel, mint például az internetes keresés, ajánlórendszerek, fordítás egyik nyelvről a másikra, képek szerkesztése, egészségügyi alkalmazások.
- A legtöbb MI probléma előrejelzési probléma, vagyis a modellek fő funkciója az előrejelzés. Az „előrejelzés” (prediction) szót tág értelemben használjuk: új információ előállítását jelenti a meglévők alapján. Egy gépi tanulással tréningezett önvezető autó például azt képes előre jelezni, hogy egy adott forgalmi helyzetben egy jó sofőr mit csinálna (és azt éles üzemben azonnal végre is hajtja), egy hasonló módon kiképzett raktári robot pedig azt jelzi előre, hogy egy adott tárgyat egy ember hogyan fogna meg és helyezne odébb. Kereskedelmi helyzetekben lényegében egy jól képzett, rendkívül informált, intelligens, fáradhatatlan alkalmazott viselkedését kell előre jelezni.
A piaci tolongást és a nagy nyelvi modellek valóban meghökkentő képességeit látva nem meglepő, hogy tudományos és kevésbé tudományos körökben élénk vita bontakozott ki az emberi és a gépi nyelvi „tudás” hasonlóságáról és különbözőségéről: a konzervatív vélemény szerint a gép egyáltalán nem „érti” amit mond, nincsenek közvetlen érzékelései, személyes „tapasztalatai”, viszont a hatalmas szövegtömeggel történő tréningezés eredményeként nagyon ügyesen tudja a következő szót előre jelezni – és akkor itt vagyunk megint az előrejelzésnél.
Célkeresztben a hiperautomatizálás
A mesterséges intelligencia legújabb eszközeinek terjedése, annak szándékolt és nem szándékolt következményei számtalan izgalmas filozófiai, jogi, etikai és politikai kérdést vetnek fel, de most ne foglalkozzunk ezekkel, maradjunk az eszközök praktikus, kereskedelmi célú használatánál. Nem kell különleges fantázia annak elképzeléséhez, hogy milyen változásokat hozhat az online kereskedelemben az, ha a gépekkel emberi nyelven, párbeszédes üzemmódban lehet kommunikálni, vagyis nem kell nehezen áttekinthető katalógusokban böngészni, kulcsszavak beírásával keresgélni, és erre az intelligens párbeszédes frontvonalra szépen felfűzhetők a zökkenőmentes működést biztosító, egymással összekapcsolt, automatizált háttérrendszerek. (Ezt nevezi a szakirodalom hiperautomatizálásnak.)
Az ügyfél a mesterséges intelligenciára épülő frontvonallal találkozik majd, ott tapasztalja meg, hogy milyen az MI-vel turbózott vásárlási élmény, de az MI ott lesz a háttérrendszerekben, így például a dinamikus árazásban, a raktárgazdálkodásban, a termékfejlesztésben, a kapacitástervezésben és a pénzügyekben is, az ügyfél számára láthatatlanul, de érezhető hatással a kiszolgálási frontvonal eredményességére és hatékonyságára.
Ez már nem a jövő, hanem egyre inkább a jelen. A példák száma szaporodik, számos esettanulmány igazolja, milyen versenyelőnyöket biztosíthat az új MI eszközök kreatív használata. Az innovátorok után sorra jelennek meg a korai alkalmazók, és számíthatunk a korai többség megjelenésére is. Az MI „demokratizálódó” (értsd: ingyen vagy olcsón hozzáférhető, könnyen kipróbálható) eszközei gyorsan terjednek, a drágább és komolyabb megoldások tekintetében azonban nem egyformák az esélyek. Izgalmas verseny bontakozik ki a védett, saját tulajdonú, és a szabad (open source), ingyenes vagy látszólag ingyenes megoldások között.
Az eredményes, valódi versenyelőnyt biztosító felhasználásnak számos feltétele van: nagy tömegű, releváns, szisztematikusan gyűjtött, gondosan megtisztított saját adat, megfelelő számítási kapacitások, felkészült informatikai és adatfeldolgozási szakemberek, az eredményeket értelmezni és hasznosítani tudó üzleti vezetők, innovációkra fogékony, azoktól nem félő alkalmazottak, és persze nem kevés pénz. Ezeket nem nehéz felsorolni, de nem könnyű biztosítani.
A mesterséges intelligenciáért és az azzal folytatott versenyben a vállalkozások esélyei nem egyformák, de hasonló a helyzet az országok és régiók esetében is. Külön elemzést igényelne annak vizsgálata, hogy hol állnak rendelkezésre kellő méretű számítási kapacitások (leginkább rendszeresen frissített Nvidia A100-as vagy annál fejlettebb klaszterek), nagy és gondosan tisztogatott (pl. egészségügyi) adatbázisok, hol bocsátanak ki az egyetemek kellő számban és minőségben szakembereket, a szakértők és a tudás hova áramlanak, hol indulnak fejlődésnek vonzó és kreatív városok vagy városrészek, hol van támogató, innovációra ösztönző, iparági és piaci sajátosságokhoz igazodó szabályozás. A láz nő, jó lesz figyelni a nemzetközi mezőnyt!