HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Így elemeztek exomot Ti

2016.08.15. 01:18 Travis.CG

Legutolsó Titines kalandom után a főnökség úgy döntött, keresnek valakit, aki megtaníthat rendesen exomot elemezni. Patrickre esett a választás, mert az ő eredményeire még a nagyfőnök Peter Campbell is elismerően füttyent.

Én az elején nem értettem, miért van erre az egészre szükség, különösen azt nem értettem, miért most és miért csak egy bizonyos projektnél jött ez elő, de úgy gondoltam, azért jöttem a Sangerbe, hogy tanuljak, ha pedig tanítani akarnak, nem szabad elzárkózni. Patrick sem értette pontosan, mit kívánnak tőle, de annak rendje és módja szerint eljött a megbeszélésre. Megjelent az egyik principális bioinformatikus is a csoportból, plusz két manager, akik az egészet kitalálták.

Arra kérték Patrick-et, mutassa meg, hogyan szokta elemezni az exomot, és lépésről-lépésre mutassa be az én adatszettemen. Patrick kinyitotta a laptopját és kivetített milliónyi titokzatosnak tűnő ábrát. Úgy éreztem, hogy itt valami valami olyat tanulok, hogy ha nem tapasztom be a fülem, a sok tudás azon fog kifolyni.

Patrick eltűntette az ábrákat és elkezdte bemutatni a lépéseket. Az első hasznos dolog egy előre megírt script volt, ami egy szekvenálási projekt összes VCF-jéből egy hatalmas táblázatot csinál, amiben minden minta minden adata szerepel. A VCF kriptografikus bejegyzései dekódolva külön oszlopba kerültek, amitől az egész sokkal átláthatóbb lett.

Ezt követően mindent betöltött egy Excelbe, amitől az arcomon megrándult egy izom, valahogy úgy, mint amikor Winnetou-t egy cölöphöz kötve kínozták ahol ez jelezte kínjai netovábbját. A táblázatot először a mutációt tartalmazó gének neve szerint sorba rendezte, megszámolta, hogy egy gén mennyi mutációt tartalmaz az összes szekvenált mintát egybe számolva. Csökkenő sorba rendezte a géneket a mutációk száma szerint, majd az első sort egy laza mozdulattal kitörölte, mert az volt a Titin, és mindig a Titin jön fel elsőre.

Patrick még beletekert a táblázatba, majd számomra teljesen ismeretlen géneket kijelölt és mielőtt megjegyezhettem volna a nevüket, kitörölte őket a táblázatból, mert azok hosszú gének és statisztikusan a hosszú gének több mutációt tartalmaznak. Végül összegyűjtötte a lista első 15-20 génjét és voila! Megvannak a driver gének! Én lopva a managerekre sandítottam, hátha valaki elröhögi magát, de nem tették. Őszintén szólva elkezdtem kényelmetlenül érezni magamat. Még mindig be akartam tapasztani a fülemet, de már nem azért, hogy a tudás ne távozzon, hanem, hogy ez a sok hülyeség be ne fészkelje magát oda.

Mi a gond a fenti módszerrel? Először is nem objektív. Akinek a zsebébe nincs egy mini-Patrick, az nem tudja mely géneket kell kitörölni. Ebből adódik a második probléma is: nem megismételhető. Ezt csak ez a kutató tudja megismételni. Ha publikáció lesz ebből, mit írok az Anyag és Módszerbe?

Ha ezt egy PhD hallgató adja elő, összecsavarok egy újságot és a fejére verek: "rossz, rossz, rossz". Ő viszont egy szenior kutató. Itt van már időtlen idők óta, én meg csak egy jött-ment kelet-európai vagyok. Végül is egy kutató intézetben vagyunk, talán észérvekkel rá tudok világítani a módszer hiányosságaira. Megkérdeztem, mi lenne, ha a találatok számát a gén hosszával normalizálnánk. Nem, az nem jó, mert elvesznek a rövid gének. Nem, mintha így nem vesznének el, de ráhagytam. Akkor azt kérdeztem, mi lenne, ha a szinoním-misszensz mutációk arányával kezdenénk valamit. Hiszen ahol több aminosav módosulással járó mutáció van, mint semleges, az nyilván fontosabb gén. Igen, ez így van, ezen Inigo dolgozik.

Ekkor két dolgot döntöttem el: szerzek szentelt vizet meg egy feszületet, hogy Patrickot távol tartsam magamtól és beszélnem kell Inigoval.

Egy labor megbeszélés után próbáltam beszélni vele. Sietett vissza a laborba dolgozni, de azt el tudta mondani, hogy a módszer lényege, hogy nem csak a gén hosszát nézni, hanem a kromatin állapotot, repeateket, meg még néhány paramétert. A szinoním mutációkkal egy negatív binomiális modelt készít és nézi, mennyire térnek el tőle a misszensz mutációk. Megkérdeztem néhány dolgot, amiből szerintem látta, hogy tök hülye vagyok, sietett is, ezért fogta a tollamat, a jegyzet füzetemet és a folyosón kb. 10 másodperc alatt odafirkantott egy fél R programot nyilakkal és matematikai jelzésekkel. Miközben írt, én éreztem, hogyan megyek össze. Mondta, hogy első sorban humánra készíti a programot, de kíváncsi, mit hozok ki egérre. Szabadkozott, hogy amit leírt nekem, az nem a teljes model, mert hiányzik belőle pár faktor. Mondtam, hogy szerintem még így is fényévekkel jobb, mint Patrick módszere. Ezzel egyet értett, majd otthagyott.

Három napig Wikipédiáztam, mire felfogtam a felét.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr1310410782

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása