HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Murphy oktat

2016.07.01. 07:53 Travis.CG

Mindig lenyűgöztek Frederick Forsyth regényei, ahol a főhős aprólékos és gondos tervezéssel félelmetes tetteket hajtott végre. Ahogy olvasta az ember a történeteket, olyan érzése támadt, hogy ezeknek az embereknek semmi nem állhat útjába. Ha csak a Sakál napjára gondolok, ott is csak az akadályozta meg a merényletet, hogy a másik oldalon is egy hasonlóan felkészült ember volt.

Micsoda szemenszedett hazugság.

Mikor felkértek, hogy oktassak az RNA-seq kurzuson, azt is a nagy előd nyomdokait követve terveztem meg. Felmértem, milyen számítógépes erőforrásokat használhatnak majd a tanulók. A szervezők azt mondták, kb. egy laptop erejével gazdálkodhatok, ezért ennek megfelelően kezdtem el a munkát. A második lépés a gyakorlat felépítése volt. Tudtam, hogy egy differenciál expressziót és egy fúziós gén keresést akarok megcsináltatni velük, ezért olyan eszközöket választottam, amelyek elég sok közös lépést tartalmaznak, hogy ezzel is időt spóroljak meg. Így esett a választás a STAR-ra és a STAR-Fusion-re. Mivel a legtöbb expressziót feldolgozó Bioconductor csomag nyers readszámokat tartalmazó táblázatot vár, ezért a BAM fájlokat HTSeq-el terveztem átalakítani.

Az első bökkenő a STAR memória igénye volt. Lefuttattam a teljes adatszetten a programot, kiválasztottam a legmarkánsabb fúziós gént, majd a készítettem egy kisebb adatszettet, ami csak két kromoszómát tartalmazott a rájuk illeszkedő readekkel együtt. Ez vígan elfért 6GB-ban, a tárhely szükséglete 4GB volt.

Az EBI-osok egy hónappal a kurzus előtt bekérték a szükséges programok listáját, amit egy VMWare virtuális gépre telepitettek, klónoztak, hogy minden résztvevő ugyan azokat a beállításokat lássa. Én az elsők között töltöttem ki az igénylésemet, sőt, mivel attól tartottam, hogy az indexelés tetemes időt fog igénybe venni, azt is megcsináltam előre.

A kurzus előtt egy héttel újra végigmentem a lépéseken, beírtam őket az előadás diái közé. Aztán arra gondolva, hátha a vetítőt nem fogják jól látni, készítettem egy GitHub-os wiki oldalt is az összes lépéssel. Végső esetben innen is kimásolhatják a paramétereket.

Az előadásomat is több napon keresztül gyakoroltam, hiszen nem vagyok tökéletes angolból, nem akartam, hogy ne értsenek semmit. Apró megjegyzéseket tettem a diák mellé, hogy ha nem jut eszembe valami, végső esetben fel tudjam olvasni.

Feltöltöttem a laptopom akkumulátorát, nehogy az előadás felénél fogyjon el a szufla belőle. Előadás kezdés előtt egy órával megjelentem a helyszínen. Kétszer lefuttattam a teljes diasort, a hátsó asztalokból ellenőriztem, hogy minden jól látható-e.

A szervezők adtak lézer pointert, mikrofont, tartalék elemeket mindkét eszközhöz. Megmutatták a gépet, amit ugyan azzal a virtuális Linuxal szereltek fel, mint a hallgatók gépét, hogy velük együtt tudjam csinálni a lépéseket. Megmutatták a megosztott könyvtárat, ahova úgy tuduk fájlokat elhelyezni, hogy mindenki hozzáférjen,

Ellenőriztem, hogy a használni kívánt programok az elérési útban vannak-e, működnek-e. Egyedül a STAR-Fusion panaszkodott egy hiányzó Perl modulra, de csak azért, mert a program munkakönyvtára az /usr/local/bin volt. Feljegyeztem a program abszolút elérési útját, hogy majd ha ehhez a lépéshez érünk, innen futtassuk.

Még negyed óra volt kezdésig. Minden készen állt.

Beléptek a hallgatók. A legkülönbözőbb égtájakról, a legkülönbözőbb életkorú emberek jöttek. Mindenki valami csodára várt, azt hitték, majd elmondom nekik az egy igaz RNA-seq feldolgozási módszert. Ennek ellenére én minden lépésre legalább három alternatívát mutattam be és egyikre sem mondtam, hogy jobb a másiknál. Helyette azt mondtam, teljesen mindegy, mit használnak, mert minden programnak van valami hibája.

Több kérdést is feltettem előadás közben, de mindegyik az épp aktuális projektjükre vonatkozott, hogy azt miként dolgozzák fel. Például hogyan futtassák a GATK-t RNA-seq adaton? Mit csináljanak, ha kontrolból nincs ismétlés, de a tumorból három is? Mi az az FPKM érték, ami alatt ne foglalkozzanak az expresszióval?

Ennek ellenére is sikerült fél óra alatt elmondani az egy órára tervezett előadást. Legalább nem aludt el senki.

Azután következett a gyakorlat. Az első hiba, amit észrevettem, hogy a szimlink nem volt jó a STAR-Fusion index könyvtárában, Azt viszonylag gyorsan orvosoltuk. Bemutattam, milyen lépéseket követtem el az index elkészítésénél, de nem mondtam elég egyértelműen, hogy ezt nem kell megcsinálniuk, úgyhogy néhányan nekiláttak, hogy letöltsék a teljes egér genomot.

Azután megkérdeztem, hogy mindenki hozzáfér-e az előadáshoz, hogy onnan ki tudja másolni a parancsokat, de néhányan valahogy nem fértek hozzá. Akkor megmutattam a GitHub oldalt. A káosz valahol itt kezdődött.

Mondtam nekik, hogy akkor illesszék a szekvenciákat a szkript részlet alapján, és én is elkezdtem csinálni velük együtt, a nagy kivetítőn. Néhányan elkezdték kicsomagolni a read fájlokat, pedig ezt nem is mondtam. Mások a közös mappában találtam valami fájlt, amin elkezdtek dolgozni, de ezt sem mondta senki.

Ekkor az egyik szervező odajött, hogy mi lenne, ha az illesztő szkriptet csak bemásolnám a közös mappába, hogy azt futtassák. Gondoltam, rendben. Korábban a rendszergazda, aki elkészítette a VMWare lemezképet, büszkén mondta, hogy 12 processzor van, 24GB RAM, a tárhellyel pedig "nem kell törödni". De a valóság valahogy más volt.

Az történt ugyanis, hogy valaki gondolkodás nélkül a közös mappában elindította a szkriptet, amiben én naívan 12 szálat adtam meg. Ekkor az összes gép a teremben lefagyott.

Szerencsére ez a kávészünet közelébe történt, ezért mindenki kiment, a rendszergazda meg rohangászott gépről gépre és újra indított mindent. Utána jött a nagy tanácskozás és végül megállapodtunk, hogy 4 magon indítjuk a szkriptet. De ez is lelassított minden gépet, még az egér sem mozgott. Végül megkérdezték, le tudnám-e futtatni a gyakorlatot a saját laptopomon, a többiek meg nézik.

Végül is ebben maradtunk. Moziztak végig. Nem tudom, mennyire volt hasznos számukra ez a bemutató, egy ember nagyon örült, hogy láthatott egy downstream analízist. Elmondása szerint mindig az volt a problémája, hogy nem tudott mit kezdeni a génlistákkal. Legalább egy embernek hasznos volt a bohóckodásom.

Szólj hozzá!

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr668857752

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása