Ön tudja nyomkodni a Facebookot? Használt már Windowst? Gratulálunk, Ön mától bioinformatikus! Hogyan? Ön úgy érzi, keveset ért semmit a biológiához? Semmi gond, ez nem akadály. A nukleotidokra gondoljon úgy, mint holmi karakterekre a Wordben, ahol csak négy karaktert kell lenyomni. Látja, könnyebb, mint a gépírás! Úgy látom, még mindig nem hiszi el, hogy Ön bioinformatikus. Mondja, mi még a gondja. A statisztika? A
statisztika felesleges, gondoljon csak a bikinis hasonlatra. A
programok úgyis kiírnak valamit. Olyan programot meg úgysem írnak, amelyik ostobaságot írna ki.
Ez után a bevezető után kifejteném, miért látom úgy, hogy a bioinformatikához mindenki ért. A munkahelyemen meghírdettünk egy bioinformatikai állást, amire csak úgy özönlöttek a jelentkezők. Ennyi bioinformatikust még konferencián sem láttam. A jelentkezők legtöbbje Unixot még nem látott. Ez azért probléma, mert a programok legtöbbje Mac-en vagy Linuxon fut. Miért? Mert ezeken van egy olyan parancssor, ami nagyban segíti a munkát. Legtöbbször ugyanis szöveges állományokat kell feldolgozni. Ha van három fájl, azt még egy klikkelős programmal el lehet intézni, de 20 fölött még a legtürelmesebb ember is feladja. Ha viszont van egy jó parancssor, akkor a munka gördülékeny.
Ez elvezet minket oda, hogy kell némi programozói ismeret. Nem muszáj Terminátorokat gépi kódban hekkelni, de a Perl szkriptek ismerete szükséges. Miért Perl? Mert szövegfeldolgozásra kihegyezett programnyelv. Van egy BioPerl modulgyűjtemény, amivel az ismertebb fájlformátumokat feldolgozhatóak. Az EnsEMBL API szintén Perl-ben készült, A nyelv ismerete elengedhetetlen. Ennek ellenére volt olyan jelentkező, aki C#-ban írt egy programot, ami promóter mutációkat szimulált. A gond csak az volt, hogy a program egy tetszőleges szövegen véletlenszerűen megváltoztatott néhány nukleotidot. Ha beírtam volna a Háború és Békét, azt is mutálja. A programnak semmi értelme nem volt, de legalább bebizonyította, hogy a jelölt ért egy olyan programozási nyelvhez, ami irreleváns bioinformatikailag. Az már csak hab a tortán, hogy felhívtuk a figyelmét rá, hogy a program értelmetlen, semmilyen biológiai folyamathoz nincs köze, de csak annyit mondott, még további fejlesztésre szorul. (Azóta sem láttam a Nature címlapján)
Az adatok feldolgozása egy dolog, de nyersanyagot is tudni kell szerezni. Egyik próbafeladatunk alkalmával egy gént kértünk FASTA formátumban. Ha a jelölt nem a Google és Wikipédia oldalakon keresztül jutott a célhoz, már örültünk. Pedig az elsődleges szekvencia adatbázisok minden bioinformatikai kurzusban szerepelnek. Három van belőlük, de mivel ugyan az van mindegyikben, elég egyet megjegyezni.
Azután ott vannak a fura figurák. Ők már a felszínen átrágták magukat, de mégis hihetetlen dolgokat produkálnak. Például egy programozó, aki saját bevallása szerint eddigi munkája során a másodfokú egyenlet megoldóképleténél bonyolultabb matematikai formulát nem használt, elhatározta, hogy szekvencia illesztőt ír. Gondoltam segítek neki irodalommal, hogy mégse kelljen feltalálnia a spanyolviaszt. Mikor meglátta a Smith-Waterman algoritmust, kijelentette, hogy ez csak misztifikálja a problémát. Végül írt egy grep szintű programot. Ez annyira megtetszett neki, hogy tőlem kérdezgette, hogyan tudna bioinformatikusként elhelyezkednie.
A másik érdekes eset az volt, amikor egy másik bioinformatikus wannabe írni kezdett egy illesztőprogramot. Végül belefulladt a feladatba, ezért segítséget kért tőlem. Először elmagyaráztam neki, hogy az ő problémájára nem lesz jó a LCS algoritmus, neki globális illesztő kell. Azt felelte, de ő csak ezt találta letölthető kódban. Utána megpróbáltam megygyőzni, hogy ha már van kész program, nem szükséges fejleszteni. Megmutattam neki a programot, azt is, hogyan kell használni. Ezután közölte, hogy ő ezt Windows alól fogja használni 1500 fájlra. De mivel a PowerShell-t sem ismeri, ezért majd ír egy Java programot, ami meghívja neki az illesztőt. Igen, akinél kalapács van...
A bioinformatika határtudomány, ezért én úgy érzem, soha nem tudhatok eleget, hogy megfeleljek a kihívásoknak. Napi szinten találkozom olyan kérdésekkel, amelyekre nem tudok válaszolni. Legutóbb azt kérdezték tőle, minek a rövidítése a LOH. Nekem is utána kellett néznem.
Mások pedig felületes tudással tökéletesen elvannak. Mi lenne, ha én is azt mondanám: OpenGL-es demókat írok, akkor én játékmotor fejlesztő vagyok. Megszereltem a villanybojlert, akkor megpályázok egy víz-gáz-fűtés szerelői állást. Nevetségesen érezném magam.