HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Szakmák, amikhez mindenki ért: bioinformatika

2011.12.22. 00:56 Travis.CG

Ön tudja nyomkodni a Facebookot? Használt már Windowst? Gratulálunk, Ön mától bioinformatikus! Hogyan? Ön úgy érzi, keveset ért semmit a biológiához? Semmi gond, ez nem akadály. A nukleotidokra gondoljon úgy, mint holmi karakterekre a Wordben, ahol csak négy karaktert kell lenyomni. Látja, könnyebb, mint a gépírás! Úgy látom, még mindig nem hiszi el, hogy Ön bioinformatikus. Mondja, mi még a gondja. A statisztika? A 

statisztika felesleges, gondoljon csak a bikinis hasonlatra. A 

programok úgyis kiírnak valamit. Olyan programot meg úgysem írnak, amelyik ostobaságot írna ki.


Ez után a bevezető után kifejteném, miért látom úgy, hogy a bioinformatikához mindenki ért. A munkahelyemen meghírdettünk egy bioinformatikai állást, amire csak úgy özönlöttek a jelentkezők. Ennyi bioinformatikust még konferencián sem láttam. A jelentkezők legtöbbje Unixot még nem látott. Ez azért probléma, mert a programok legtöbbje Mac-en vagy Linuxon fut. Miért? Mert ezeken van egy olyan parancssor, ami nagyban segíti a munkát. Legtöbbször ugyanis szöveges állományokat kell feldolgozni. Ha van három fájl, azt még egy klikkelős programmal el lehet intézni, de 20 fölött még a legtürelmesebb ember is feladja. Ha viszont van egy jó parancssor, akkor a munka gördülékeny.

Ez elvezet minket oda, hogy kell némi programozói ismeret. Nem muszáj Terminátorokat gépi kódban hekkelni, de a Perl szkriptek ismerete szükséges. Miért Perl? Mert szövegfeldolgozásra kihegyezett programnyelv. Van egy BioPerl modulgyűjtemény, amivel az ismertebb fájlformátumokat feldolgozhatóak. Az EnsEMBL API szintén Perl-ben készült, A nyelv ismerete elengedhetetlen. Ennek ellenére volt olyan jelentkező, aki C#-ban írt egy programot, ami promóter mutációkat szimulált. A gond csak az volt, hogy a program egy tetszőleges szövegen véletlenszerűen megváltoztatott néhány nukleotidot. Ha beírtam volna a Háború és Békét, azt is mutálja. A programnak semmi értelme nem volt, de legalább bebizonyította, hogy a jelölt ért egy olyan programozási nyelvhez, ami irreleváns bioinformatikailag. Az már csak hab a tortán, hogy felhívtuk a figyelmét rá, hogy a program értelmetlen, semmilyen biológiai folyamathoz nincs köze, de csak annyit mondott, még további fejlesztésre szorul. (Azóta sem láttam a Nature címlapján)

Az adatok feldolgozása egy dolog, de nyersanyagot is tudni kell szerezni. Egyik próbafeladatunk alkalmával egy gént kértünk FASTA formátumban. Ha a jelölt nem a Google és Wikipédia oldalakon keresztül jutott a célhoz, már örültünk. Pedig az elsődleges szekvencia adatbázisok minden bioinformatikai kurzusban szerepelnek. Három van belőlük, de mivel ugyan az van mindegyikben, elég egyet megjegyezni.

Azután ott vannak a fura figurák. Ők már a felszínen átrágták magukat, de mégis hihetetlen dolgokat produkálnak. Például egy programozó, aki saját bevallása szerint eddigi munkája során a másodfokú egyenlet megoldóképleténél bonyolultabb matematikai formulát nem használt, elhatározta, hogy szekvencia illesztőt ír. Gondoltam segítek neki irodalommal, hogy mégse kelljen feltalálnia a spanyolviaszt. Mikor meglátta a Smith-Waterman algoritmust, kijelentette, hogy ez csak misztifikálja a problémát. Végül írt egy grep szintű programot. Ez annyira megtetszett neki, hogy tőlem kérdezgette, hogyan tudna bioinformatikusként elhelyezkednie.

A másik érdekes eset az volt, amikor egy másik bioinformatikus wannabe írni kezdett egy illesztőprogramot. Végül belefulladt a feladatba, ezért segítséget kért tőlem. Először elmagyaráztam neki, hogy az ő problémájára nem lesz jó a LCS algoritmus, neki globális illesztő kell. Azt felelte, de ő csak ezt találta letölthető kódban. Utána megpróbáltam megygyőzni, hogy ha már van kész program, nem szükséges fejleszteni. Megmutattam neki a programot, azt is, hogyan kell használni. Ezután közölte, hogy ő ezt Windows alól fogja használni 1500 fájlra. De mivel a PowerShell-t sem ismeri, ezért majd ír egy Java programot, ami meghívja neki az illesztőt. Igen, akinél kalapács van...

A bioinformatika határtudomány, ezért én úgy érzem, soha nem tudhatok eleget, hogy megfeleljek a kihívásoknak. Napi szinten találkozom olyan kérdésekkel, amelyekre nem tudok válaszolni. Legutóbb azt kérdezték tőle, minek a rövidítése a LOH. Nekem is utána kellett néznem.

Mások pedig felületes tudással tökéletesen elvannak. Mi lenne, ha én is azt mondanám: OpenGL-es demókat írok, akkor én játékmotor fejlesztő vagyok. Megszereltem a villanybojlert, akkor megpályázok egy víz-gáz-fűtés szerelői állást. Nevetségesen érezném magam.

Szólj hozzá!

Címkék: filozofálás bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr553484865

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása