HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Majdnem mindent az RNA-seq-ről (9. rész)

2018.03.11. 00:28 Travis.CG

A bioinformatikában vannak dolgok, amiket érdemes megcsinálni, mert jó eredményt adnak. Vannak dolgok, amiket érdemes megcsinálni, még akkor is, ha tudjuk, hogy az eredmény nem feltétlenül tükrözi a valóságot. Végezetül vannak dolgok, amiket meg lehet csinálni, de teljesen feleslegesek. Ma ez utóbbiról fogok írni.

Ez pedig nem más, mint a nukleotid variációk detektálása RNA-seq adatokból. Az, hogy kár erre az időt vesztegetni, csupán a személyes véleményem, a szakirodalom elég sokat foglalkozik vele és a Sangerben is volt egy kolléga, aki elmélyült a témában, vele beszélgettem.

Először is, miért gondolom, hogy értelmetlen? A kapott eredményeket nagyban befolyásolják a poszt transzkripciós nukleotid modifikációk. Ha látunk egy SNP-t az RNA-seq adatokban, az nem feltétlenül jelent genomi változást, elképzelhető, hogy a szekvenáló gép rosszul értelmezett egy módosított bázist. Továbbá ha az egyik allél tartalmaz egy olyan mutációt, ami megakadályozza a transzkript átírását (például korai stop kodont tartalmaz), arról nem kapunk információt a szekvenálás során, egyszerűen, mert nem képződik az allélról semmi. Egyik esetben sem ússzuk meg a DNS szekvenálást. Ha pedig mindenképp kell még egy szekvenálás, akkor mi értelme a vizsgálatnak?

Egyedül akkor van értelme, ha igazolni akarjuk, hogy egy SNP tényleg átíródik vagy sem. De ha a módosult fehérjére vagyunk kíváncsiak, akkor meg tömeg spektrometriát kell végezni.

Akik mégis végre akarják hajtani a vizsgálatot, érdemes követni a GATK ajánlását. A folyamat nagymértékben hasonlít a DNS feldolgozás lépéseire, ezért ismerős lehet annak, aki már csinálta (vagy olvasta ezt a bejegyzést).

Milyen eredményre számíthatunk? Semmi jóra. A fent említett kollégám a Sanger összes elérhető mellrák mintájára lefuttatta a GATK pipeline-t, majd az eredményeket összehasonlította az exom szekvenálásból kapott variációkkal. A fals pozitívok száma óriási volt. Úgy tudta valamelyest visszaszorítani a hibás találatok számát, hogy készített egy úgynevezett normál panelt. Ez azt jelenti, hogy fogott 120 normál mintát, azokon is lefuttatta a GATK-t, és amit abban talált, azt egy táblázatba rendezte, mint ismert hibát. Ezt használta szűrésre a rákos mintáknál. Az eredmények jobbak voltak, de még mindig nem érték el azt a szintet, amit egy SNP detektálótól elvárna az ember.

Ezt egy munkabeszámolón adta elő, ahol a normál panel méretének növelését célozta meg. Nem tudom, hogy utána mennyit foglalkozott a dologgal, de egy átlagos kísérletnél nincs lehetőség ekkora erőforrásokat mozgósítani, pláne, ha van egyszerűbb módja is a variációk azonosításának.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr7713607831

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása