Weboldal vagy webáruház tulajdonosként érdemes megértenünk, hogy milyen folyamatok és fejlesztések zajlanak a mesterséges intelligenciával. Egy új generációs ChatGPT vagy más lesz az aktuális befutó? Tudnunk kell, mert csak így őrizhetjük meg pozíciónkat a piacon, és fejleszthetjük a belső folyamatainkat. Összeszedtem, mire számítok a mesterséges intelligenciától 2024-ben.

Baráti beszélgetésekben azt a példát szoktam felhozni, hogy gondoljunk úgy a következő évekre, mintha most vennénk kézbe egyet az első iPhone-ok közül. Akkoriban merőben új volt, merőben más, mint bármi előtte, a mából visszatekintve azonban azért kicsit komikus, bumpszli. Nagyok a gombok, kevés a pixel és a tárhely, alig pár applikáció és sokkal kevesebb funkció az, amivel találkozunk.

Valami ilyesmire számíthatunk a következő 5-10 évben a mesterséges intelligencia és a különböző nagy nyelvi modellekkel kapcsoatban is. Azonban, míg az első iPhone 2007-ben jelent meg, tehát 17 évvel ezelőtt – jövőre lenne nagykorú – addig ma már millió applikáció, funkció és nagyságrendekkel nagyobb számítási kapacitás található az iPhone 15-ben.

Nagy nyelvi modellek 

Ha ezt nem tudod, nem fogod tudni jól használni sem! A Nagy nyelvi modellek megértése szerintem kiemelten fontos abban, hogy megértsük, hogy mi is történt az elmúlt lassan két évben. A mostani mesterséges intelligencia boom annak köszönhető, hogy könnyűvé vált írásban és szóban kommunikálni a mesterséges intelligenciával. Illetve, hogy az MI is képes válaszokat adni nekünk ilyen módon. Ez két dolognak köszönhető, egyrészt a számítási kapacitás miatt, sikerült beléjük táplálni az internetet és megannyi szöveges anyagot. Másrészt, sikerült olyan modellt építenie az OpenAI-nak, aminek köszönhetően könnyűvé vált a szövegek, tartalmak feldolgozása – így a kommunikációnk a géppel már nem kell, hogy programozási nyelveken és matematikai képleteken keresztül történjen. Ez megnyitja a mesterséges intelligencia alkalmazását széles körök számára is – számunkra. De ugyanennek köszönhető például az is, hogy mondjuk az ukrán-orosz háborúban, a mesterséges intelligencia használatához nem kellenek már “adattudósok” és programozók, hanem egy sima chat ablakban is meg lehet kérni az MI-t, hogy adjon három javaslatot egy megelőző csapásra, részletezve az adott taktikát és a csapáshoz szükséges alakulatok felszereltségét.

Ennek és a Boston Dynamics-nál is folyó robotikai fejlesztéseknek köszönhető az a robot, amit talán már nyugodtan hívhatunk humanoidnak is. Hiszen: megérti, amit mondunk neki (köszönhetően a nagy nyelvi modelleknek) és végre is tudja hajtani azokat a feladatokat, amiket kérünk tőle. Tehát, bár évtizedek óta zajlik a mesterséges intelligencia fejlesztése, most vagyunk igazán csak a hajnalán. Ezért nagyon fontos, hogy mindenki megértse a folyamatokat, és azt, hogy milyen módon működnek. Ugyanis sokan pár – hibás – próbálkozás után elfordultak tőle. 

Sok vállalat azonban már beépítette, vagy elkezdte beépíteni a saját folyamataiba a mesterséges intelligenciát, így pedig hatalmas előnyre tesznek szert a versenytársaikkal szemben. Így viszont csak mélyül a szakadék, ahogy történt ez az internet, a közösségi média használat megjelenésével is. Elég csak visszagondolni, hogy Covid előtt, mennyire lenézte mindenki a TikTok-ot, majd a Covid után rengeteg cég elkezdte használni, sőt külön TikTokkereket vettek fel cégek, hogy rendszeresen gyártsanak tartalmakat a platformra.

Új alkalmazási területek, új megoldások

Fontos, hogy azt is megértsük, hogy bár tele van az internet rengeteg új mesterséges intelligencián alapuló applikációval, megoldással, ezek döntő többsége igazából csak a már ismert ChatGPT – Gemini – CoPilot (ha még mélyebbre akarunk menni, akkor különböző betanított (trainelt) modelleken alapuló) rendszereit használják különböző területeken, mint az ügyfélszolgálat, szövegelemzés, szövegírás stb., és ennek megfelelő, specifikusabb “pre-promt”-okkal dolgoznak.

Az igazi újításokat nem ezen a területen kell keresni, hanem az olyan megoldásokban, mint a következő alkalmazások – bár ezek egy része is, a fenti módon működik. Mégis érdemes mindegyiket kipróbálni, mert új megközelítést és perspektívát adhatnak abban, hogy mire és hogyan használd a mesterséges intelligenciát.

  • Perplexity

Aki sokat dolgozott már a ChatGPT-vel, az tudja, hogy azért igen könnyen téveszt, ha specifikus adatokat, adatbázisokat szeretnénk kérni tőle. A Perplexity pont ezt a problémát szünteti meg. Tulajdonképpen egy kutató asszisztenst kapunk vele. Forrásokkal megtámogatva, hivatkoza, precízen mutatja be az adott választ a kérdésünkre. 

  • Descript

A Descript alapvetően egy videóvágó eszköz, azonban teljesen máshogy működik, mint a korábbi vágóprogramok, például a Premier Pro. Itt a vágói munka alapja nem feltétlenül az elkészült videós anyag, hanem lehet az a videós anyag leirata is. Ezért a vágást végezhetjük úgy, mintha csak egy word fájlban a szöveget szerkesztenénk, és ahogy kiveszünk szövegeket, azok kivágódnak a videós anyagból is. 

A Descript is képes hangot generálni, így akár a saját hangunkat lemásolva is képesek lehetünk további hanganyagok hozzáadására az elkészült videóban. Ez sokkal könnyebbé és gyorsabbá teszi a podcast-ek és YouTube-csatornák gyártását, szerkesztését.

  • TwelveLabs

A TwelveLabs, eltérően a fentiektől, valódi és hatalmas újításon dolgozik. Mesterséges intelligencia rendszerük képes videók értelmezésére. Így teljesen új alkalmazási területek jelenhetnek meg ezáltal. Példaként azt szoktam mesélni, hogy a rendszer, mondjuk egy Forma 1-es futam videóját feltöltve képes megmondani, mikor és mivel szúrta el a Ferrari az adott futam stratégiáját, vagy mondjuk a Gyűrűk Ura esetében, hogy ki és melyik percben zuhant bele a Végzet Hegyének lávatengerébe.

Nyilván ennél nagyobb gazdasági hatású, jobb jövedelem termelési potenciállal bíró kérdéseket is fel lehet tenni más-más videók esetében.

  • ‍Rewind

Más típusú kérdéseket és lehetőségeket vet fel a ReWind, amely a személyi asszisztenciát válthatja ki majd a mesterséges intelligenciára alapozva. Ha megfelelő jogosultságokat adunk a rendszernek, az képes arra, hogy megválaszoljon olyan kérdéseket, hogy mikorra is kellett volna foglalnom asztalt XY ügyféllel és melyik étterembe.

A rendszer ugyanis rögzíti, értelmezi és kereshetővé teszi a mindennapjainkat, így könnyen meg tudja mondani majd, hogy mi volt az a kellemes heavy metal szám, amit a barátokkal a Ligetben piknikezés közben hallgattunk a hétvégén. De ugyanígy – megfelelő jogosultságok megadása mellett –, hozzáférhet és támogathat minket a különböző online megbeszéléseken, és azokat követően is.

  • Synthesia, Colossyan és Murf.ai

Bízom benne, hogy sokan találkoztak már olyan mesterséges intelligencia megoldásokkal, ahol saját magunk hangját, arcát, mimikáját tudjuk klónozni. Ezek közül az egyik legrégebbi a Synthesia, de rengeteg másik applikáció is ezt a területet célozza. Ilyen megoldásokat kínál Murf.AI és a magyar alapítású Colossyan is. Ezeket is érdemes kipróbálni.

  • Sora

Szintén érdemes megnézni a Sora bemutató videóját is. A ChatGPT fejlesztői, a Dall-E képgeneráló nyomdokait követve létrehozták a Sora-t, amely videók generálását teszi lehetővé. Ez publikusan még nem hozzáférhető, és kérdés, hogy az lesz-e egyáltalán. A modell létrehozása során a YouTube open source videót használták fel a modell feltraineléséhez, betanításához. 

Menjünk kicsit mélyebbre!

Bár a fenti megoldások közül több is valódi újdonság, fontos, hogy rálássunk, mi történik a háttérben, és milyen további újdonságok, fejlődési lehetőségei vannak a vállalkozásoknak, webshopoknak itthon is.

  • Mi az a RAG, és mire tudom használni a vállalkozásomban?

A RAG betűszó, angolul: Retrieval-Augmented Generation (magyar fordításban: visszakereséssel bővített generáció). Leegyszerűsítve a választ, a RAG egy bővített és kontrollált “ChatGPT” – vagy másik nagy nyelvi modell, ezt a hazai szóhasználatban is sokszor használjuk sajnos szinonímaként.  A RAG annyival több, mint egy nagy nyelvi modell, hogy a RAG esetében mi határozzuk meg az adatok forrását. Ez lehet például a korábbi blogcikkeink összessége, a termékeink leírásai, az egészségügyi adataink, stb.

Ezek ismeretében, a nagy nyelvi modell sokkal inkább tekinthető egy interface-nek, ami a promptunkat kezeli, és kérdezi le a választ az adatbázisunkból, ami lehet nyílt, vagy zárt, a fentiek közül valamelyik vagy mondjuk akár az összes pénzügyi adatunk, és ez alapján válaszolja meg a kérdést a “ChatGPT”, nem pedig az ő saját – bizonyos esetekben korlátozott tudása alapján. 

  • Mi az az AGI, és mit jelent ez a vállalkozásomra nézve?

Az AGI, a teljes általános intelligencia koncepciója. Még nem érkeztünk el ide, de különböző prognosztizációk alapján akár a következő 5-10 évben eljuthatunk ide. Úgy érdemes ezt elképzelnünk, mint egy beszteroidozott ChatGPT-t. Olyat, ami viszont már nem csak a betáplált anyagokból táplálkozik, hanem képes önállóan is fejlődni, új funkciókat önmagától megtanulni, kialakítani saját maga számára. 

Az AGI eljövetele akár a teljes civilizációnk átalakulásával is járhat. Ezért is érdemes figyelemmel kísérni az olyan híreket, amik például 2023 végén az OpenAI vezetőségében történtek. Hiszen az AGI kifejlesztése egyre inkább etikai kérdéseket vet fel, mintsem technológiait. Vagy akár azt, hogy mi fog történni a ChatGPT5-tel, hiszen már a 4 is meghaladja az átlagos ember intelligenciahányadosát. 

Mikor várható a ChatGPT 5?

Az új verziót sokan nyárra prognosztizálják. Azonban a ChatGPT5 és a Sora kapcsán is előkerült, hogy esetleg nem lesznek a korábbiakhoz hasonló mértékben publikusak. Ennek egyszerű oka lehet – valószínűleg egy túl fejlett megoldás a mindennapokban túl gyors és túl nagy változásokat indíthatna el, ezért könnyen lehet, hogy akár a ChatGPT5, akár későbbi modellek és megoldások már sokkal korlátozottabban lesznek elérhetőek. 

Összefoglalás

Az elmúlt években megkezdődött forradalomról nem érdemes lemaradni, mindenképp érdemes tisztában lenni azokkal a folyamatokkal és fogalmakkal, amik a mesterséges intelligencia és annak alkalmazása terén történnek. Érdemes megnézni, auditálni, hogy milyen folyamatok vannak a cégben, amik automatizálhatóak MI-vel, és ezt követően dönteni arról, hogy milyen szinten szeretnénk ezeket rábízni mesterséges intelligencia alapú technológiákra.

Ha érdekesnek találod a cikkeimet a kosárérték.hu-n, nézd meg az esettanulmányokat az oldalamon, vagy a YouTube videóimat! A LinkedIn oldalamon pedig nyugodtan felveheted velem a kapcsolatot!