Megmondom őszintén, én nem értem, mi ez a nagy hype a DumcsiBot körül. Jönnek az arcomba a hírek, hogy a Google felvenné, mint programozót, emberek lelki szemetesládának használják, tízszeresére növeli a produktivitást, vagy egyszerűen csak verset ír Hamupipőke ürítési szokásairól.
Összehasonlítva a StableDiffusion-el, ami egy képességet ad hozzám, ami nincs nekem (nevezetesen a rajzolást), addig DumcsiBot semmi olyat nem tud, amit én ne tudnék. Én is tudok írni, én is tudok programozni, én is képes vagyok nagyobb szöveget összefoglalni. Igaz, engem nem venne fel a Google és Hamupipőke WC használati szokásait sem írnám le olyan odaadással, de ettől függetlenül a képességek csírái megvannak bennem.
Maga a technológia szerintem ígéretes, és már most is jól használható olyan esetben, mikor nem tudom pontosan beírni a Duckduckgo-ba a keresőszót, mert csak homályos fogalmaim vannak a dologról. Ekkor egy beszélgetés során jobban előjön, hogy mit is akarok igazán.
Amit én problémának látok, hogy az emberek azt hiszik, ez a program gondolkodik, mert szöveget generál. De ez nem igaz. Egy politikusokról sem gondolja senki, hogy gondolkodik, csak azért, mert szöveget generál. Onnan lehetne gyanítani, hogy a rendszer gondolkodik, hogy tudja, mikor NE generáljon szöveget. (Amire ugye a chatGPT-hez hasonlóan a politikus is képtelen.)
Szerintem a rendszer azért olyan sikeres, mert az emberek imádják a sok szöveget (gondoljunk csak a pletykákra, meetingekre, vég nélküli telefonbeszélgetésekre), ez a rendszer pedig pontosan ezt adja meg nekik. Rengeteg szöveget. Például az emberek megkérdezik a Dumagépet azokról a dolgokról, amit tudnak. Miért? A Google-be ki szokta beírni, hogy mennyi 5 + 5? Senki. De a chatGPT-nek feltesznek ilyen fajsúlyú kérdéseket, és élvezettel nézik, hogy milyen válaszokad ad.
Viszont feltehetünk olyan kérdést a Szószátyárnak, amire nem tudjuk a választ? A helyzet az, hogy nem érdemes, mert a sok szövegnek sok az alja elv alapján rengeteg marhaságot is kapunk, amit a kellő hozzáértés nélkül nem tudunk kiválogatni. Ilyen esetben nem kapjuk meg a hőn áhított 10x produktivitást. Mint, ahogy a következő eset is mutatja:
A szakdolgozóm is azt gondolhatta, a sok szöveg jó. A témájához eddig írt egy használható Bash szkriptet, ami működött. Azt kértem tőle, hogy írja át Snakemake-be, hogy egy nagyobb adatszetten is lefuttassuk. A Bash szkript 4 lépést tartalmazott, gondoltam ezt elég egyszerű feladat lesz átírni. Azt vártam, hogy a végén megérti a Snakemake működését, ugyanakkor lesz egy hatékony kódunk, ahol nem kell sokat vacakolni, ha munkafolyamatot újra kell indítani.
Pár nap múlva jelezte, hogy a Snakemake fájl elkészült, de valami miatt nem megy, nézzem meg. Megnyitottam a fájlt, és majdnem lefordultam a székről. Néztem a kapott fájlt, és nem értettem, amit láttam. Voltak benne szabályok, voltak benne "dolgok", de az egésznek nem volt semmi értelme. Mivel a szakdolgozóm értelmes, a szkriptet viszont láthatóan egy hülye írta, arra kezdtem gyanakodni, hogy a chatGPT a ludas. Neki is szegeztem a hallgatómnak a kérdést, mire csak annyit mondott, hogy "ötleteket merített". Bizonyára jó nagy kanállal merítette az ötleteket, de az eredmény így sem különbözött egy Hamupipőke-vers alapanyagtól.
Ezek után nem is próbáltam kijavítani a bughalmazt, hanem megírtam nulláról. Lehet, hogy a Google felvenné, de nálam a chatGPT nem lehetne szakdolgozó.