HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Majdnem mindent az RNA-seq-ről (1. rész)

2016.10.24. 01:46 Travis.CG

Már annyi RNA-seq adatot dolgoztam fel, hogy lassan én is elhiszem, hogy értek hozzá. Ez, és túláradó magabiztosságom együtt ezt a poszt sorozatot eredményezte, eredményezi.

Igyekszem valami rendszert felállítani, de annyi egymással összefüggő téma van, hogy akaratlanul lesznek átfedések. Azért remélem nem sűlyedünk a "Mindenféle dolog kusza összevisszasága" szintjére.

Az RNA-seq alapja az RNS szekvenálása. Először RNS-t izolálnak a mintából, ami lehet 1 sejt, néhány sejtes kolónia vagy még több sejtet tartalmazó minta. Ez "csak" olyan mértékben befolyásolja a bioinformatikai munkát, hogy mekkora amplifikációs hibával kell számolni. Mivel többféle RNS molekula létezik, az izolálás során megcélozhatunk bizonyos molekula típust és szekvenálhatunk mRNS-t, kisRNS-eket, riboszóma RNS-t, stb. A továbbiakban elsősorban az mRNS szekvenálásról lesz szó, mivel (szerintem) ez a legelterjedtebb RNA-seq alkalmazás.

Az mRNS-t a poliA vég segítségével viszonylag egyszerű kigyűjteni. A könyvtár készítés többi lépéséről nem írnék, mert ezt mások sokkal jobban tudják nálam, csupán egy részt emelnék ki, ami az analízist befolyásolhatja, ez pedig az irány specifikus (strand specific) kit alkalmazása. Ez röviden annyit jelent, hogy a szekvenálás során kapott read orientáció összefügghet annak az mRNS-nek az orientációjával, amiből származik. Az átfedő antiszensz transzkriptek esetén pontosabban meghatározható az expresszió. Itt a Sangerben az esetek 98%-ban a read orientáció megegyezik a transzkript orientációjával (first strand) és a veterán bioinformatikusok között van, aki már hallott olyanról, hogy valaki ellentétes irányú kitet használt (second strand).

Szemben a DNS szekvenálással, ahol a lefedettség jóval egyenletesebb, különböző transzkriptek lefedettsége eltérő lehet. Gyakran felmerülő kérdés, milyen mélységben szekvenáljuk mintáinkat? Természetesen attól függ, mire keressük a választ, de az Encode konzorcium ajánlása jó kiindulási alap. Ők egy standard emberi differenciál expressziós vizsgálathoz 30 millió readet elégnek tartanak, alacsonyan expresszálódó transzkriptek vizsgálata esetén 100-200 millió readet ajánlanak.

Ugyancsak gyakori vitakérdés az alkalmazni kívánt read hossza. Ugyan csak az analízistől függ. Ha csak gén szinten vagyunk kíváncsiak az expressziós különbségekre, akkor elég lehet a rövidebb méret is. Izoforma variánsok detektálása és referencia genommal nem rendelkező élőlények esetén a "hosszabb jobb" elv érvényesül.

Végezetül álljon itt néhány link, ahol nálam részletesebben mutatják be ezt a technológiát:

https://www.youtube.com/watch?v=0e1zWjgZODc

https://www.youtube.com/watch?v=Ji9nFCYl7Bk

http://rnaseq.uoregon.edu/

https://github.com/griffithlab/rnaseq_tutorial/wiki

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr6411820121

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása