HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

És ezért hiszik, hogy értek az RNA-seq-hez.

2016.05.13. 00:25 Travis.CG

Igazából nem értek hozzá. Illetve volt idő, amikor azt gondoltam, hogy értek hozzá, de aztán a Sangerben kezdtem dolgozni. Talán kezdjük az elejéről.

Még a hírhedt benthamiana projekt idején érezhettem először testközelből a nyers RNA-seq adatot. Túl sokat nem töprengtem rajta, olvastam pár cikket, de csak olyanokat, ahol adatokat dolgoztak fel. Végül a főnököm kezembe nyomta ezt, amivel el is dőlt, hogy mivel dolgozom fel az adatokat. Néha futtattuk a Trinityt, de az esetek többségében teljesen jól elvoltunk a Cufflinks-el. Annyira, hogy unalmas óráimban a a SeqAnswer-en osztottam az észt.

Mikor csatlakoztam az itteni csoporthoz, akkor kezdtek el az RNA-seq felé kacsingatni és nagyon boldogok voltak, hogy én is itt vagyok, hiszen én már láttam ilyet. Rajtam kívül csak Angela foglalkozott expressziós adatokkal, de ő anyai örömök elé néz, így a saját projektjeit szépen lezárta és nem kezdett újakat.

Közben én egyre több előadást hallgattam, ahol más csoportok osztották meg tapasztalataikat és cikkeket kezdtem olvasgatni, ahol a módszereket hasonlították össze. Az eredmény az lett, hogy teljesen elbizonytalanodtam saját tudásomban, de azt is láttam, hogy mások sem ismerik az egy és igaz ösvényt. Illetve mindenki a saját ösvényét tartja az igazinak.

Mit lehet ilyenkor tenni? Elfogadni a tényt, hogy nem tudunk semmit, és megkeresni a saját ösvényünket. Az első és legfontosabb, hogy keressünk valami kapaszkodót, valami kiindulási pontot. Mint oly sok esetben, nálunk is a korábbi eredmények reprodukálása volt ez a pont. Ugyanis van itt az egyik kutatónak 1096 sejtvonala, amiből mind csináltak RNA-seq-t. De több, mint négyszáz sejtvonalból van microarray is.

Még 2008 környékén jelentek meg nyakra-főre az összehasonlító cikkek, nem tettünk mást, mint ezek alapján mi is összevetettük a két technológiát. Mi is korrelációkat számoltunk. Először egy sejtvonalon belül néztük a gének expresszióját, mennyire feleltethetőek meg a két módszerrel. Mint az várható volt, semmi korrelációt nem kaptunk.

Több módszert is kipróbáltam. Először Spearman korrelációval számoltam, mert a microarray expressziós értékek normál eloszlást követtek, míg az RNA-seq exponenciálist. Később Box-Cox transzformációval is próbálkoztam, de így sem tudtam az értékeket feltornázni. Nem számított. hogy miként normalizáltam. Milyen illesztő programot használtam.

Már kezdtem kifogyni az ötletekből és úgy látszott, a két technológia teljesen összevethetetlen eredményeket produkál, ami túlzottan nem is állt messze a cikkekben olvasottaktól.

A fordulat akkor következett be, amikor csupán néhány gént néztem, amelyeket más kísérletes módszerekkel validáltak és az expressziós profiljuk ismert volt. Egy hirtelen ötlettettől vezérelve azt kezdtem nézni, hogy egy gén hogyan változik a különböző sejttípusok között. Ez viszont nagyon szépen korrelálta két eljárás között! Kiterjesztettem a vizsgálatot sok génre és az eredmény megmaradt.

Tehát ha a géneket expressziójuk alapján sorba rendezem, teljesen más sorrendet kapok, ha RNA-seq vagy microarray adatokból indulok ki. De ha differenciál expressziót nézek, az adatok összevágnak. Látszólag ez ellentmondás, de nem az. Arról van szó (ez feltételezés, nem tudom bizonyítani), hogy a technológiából eredő zaj elég nagy, hogy az egyes gén szintjén megnehezítse a korrekt detektálást, de kisebb, mint a gének expressziós változása. A másik, számomra megdöbbentő eredmény, hogy a korreláció már a nyers, normalizálástól mentes readeszám esetén is kimutatható! Ez persze nem azt jelenti, hogy nem kell normalizálni.

Aztán Angela újabb kéréssel keresett meg. Felkérték még korábban, hogy tartson előadást és gyakorlatot az egyik EBI kurzuson, ami sajnos a gyerek születésével esik egybe. Megkérdezte, átvállalnám-e? El nem bírtam képzelni, mit mondhatnék a tanulni vágyó embereknek, amikor még én magam is tanulom az egészet, de a kíváncsiság legyőzte az aggodalmaimat.

Mikor beszéltem a szervezővel, kérdeztem, miért a Sangerből importálják az oktatókat, hiszen az EBI-ban is van elég bioinformatikus. Azt mondták, a tavalyi oktatók még életükben nem dolgoztak rákos RNA-seq-el, és nem tudtak válaszolni a kérdésekre. Ezért idén nem akarják elkövetni ezt a hibát.

Közben az eredményeimet bemutatták az egyik labor beszámolón, ahol a kutató olyan lelkesen beszélt arról a pár ábráról, amit készítettem, hogy hirtelen hárman is megkerestek, hogy az ő adataikat is fel tudnám-e dolgozni? A főnököm csak annyit mondott, mikor elmondtam mindezeket, hogy azért tartsam észben, hogy ő fizeti a béremet, nem a többi csoport.

Még el sem igazodtam a számtalan feldolgozási módszer között, amikor megint megkerestek, mert úgy hallották, hogy én az egy sejtes módszerekhez is értek (pedig csak egy konferencián voltam), bevennének az egy sejtes RNA-seq munkacsoportba. Talán itt kellett volna azt mondanom, hogy nem. De nem bírtam ellenállni az új technológia csábításának.

Szólj hozzá!

Címkék: filozofálás bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr868697638

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása