HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Amikor a p-érték arcon köp

2016.02.28. 00:42 Travis.CG

Egy bevezető kísérlet kapcsán egér oesophagus exome szekvenciákat kellett feldolgoznom. Meghatázotam a mutációkat, annotáltam mindegyiket, majd elkezdtem a mintákat különböző módszerekkel csoportosítani, hátha kirajzolódik valami szabályszerűség.

Készítettem egy bináris mátrixot is, ahol a sorok a géneket jelölték, az oszlopok a minták voltak, majd egy egyszerű binomiális teszttel megpróbáltam meghatározni a feldúsulásokat. A szignifikáns találatokat összegyűjtöttem, majd egy ki-a-fasza-gyerek mosollyal átnyújtottam.

A lista tetején ott virított a Ttn gén. A mosoly gyorsan lehervadt az arcomról, mikor ezt a cikket kaptam válaszul. Már az absztraktban arra hívják fel a figyelmet, hogy a Titin gén a legtöbb elemzésben feljön, mert nagyon hosszú és ezért statisztikusan több mutáció található benne. Sajnos a cikkben egy Matlan szkript jelenti a megoldást. Én inkább normalizáltam a találatokat a gének hosszával. A Titin eltűnt, de azért maradtak így is szaglással kapcsolatos gének.

A másik vicces eset egy RNA-seq feldolgozás során jött elő. Mutagénnel kezeltek egereket, majd RNS-t izáláltak bizonyos idő elteltével. A jól bevált TopHat/Cufflinks/cummeRbund mesterhármassal könnyen meg is lehetett határozni azokat a géneket, amelyek expressziója szignifikánsan eltér a kontrollhoz képest. A qPCR validáláshoz olyan géneket akartunk kiválasztani, amelyek szép nagy változást mutatnak, ezért a log fold change alapján sorba rendeztem a táblázatot, és visszaküldtem az eredményt, hogy kedvükre szemezgessenek belőle.

Jött is a válasz, hogy nem tudni miért, de a qPCR-el nem lehet expressziót kimutatni. Ez meg hogy lehet? Rövid keresgélés után meg is találtam a választ. A kontrollban a normalizált expresszió 0.0001, a kezelés hatására felment 0.01-re, ami szép százszoros változás. A statisztikai tesztek teljesen elégedettek voltak, csak épp az egésznek semmi értelme nem volt. Végül kiszűrtem az összes gént, aminek az expressziója 1 alatti minden mintában (elég önkényes, de mivel kevés gént akartak ellenőrizni, szerintem megbocsátható).

Nem olyan nehéz ebbe a hibába esni. Mi sem bizonyítja jobban, hogy az egyik csoportbeszámolón a bioinformatikus mutatta a táblázatokat mindenféle FDR értékekkel. Mikor az egyik vezető kutató firtatni kezdte, hogy milyen furcsa, hogy az egyik gén benne van a listában, amikor csak egy mintából lehet kimutatni, az előadó azzal védekezett, hogy az FDR alacsony, annak jónak kell lenni. 

Én szeretem a p értéket. Sokat segít, ha az adatok el akarnak borítani minket. De nem szabad csak rájuk hagyatkozni. Mindig van valami extra információ, ami támogatja a döntéseket. Használni kell azokat is.

Szólj hozzá!

Címkék: filozofálás bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr738388320

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása