HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup
  • sdani: Nagyon jók ezek a bejegyzések! Feszültséggel teli, fordulatos, mint egy jobb krimi. :D Abba ne hag... (2024.04.29. 10:35) Wgel CTF
  • sdani: @Travis.CG: Egy kis szerencse sosem árt. :D (2024.03.01. 13:19) A bioinformatika helyzete 2024-ben
  • Travis.CG: Szóval az akadémiai szféra mazochistává tett, amit a Pinephone-al élek ki? Hmm, érdekes összefüggé... (2023.10.05. 18:23) Új barátom az Informatikai titkárságról
  • Travis.CG: Túl nagy a hype körülötte, ezért túlzó elvárások vannak vele szembe. Ha a korábbi chatbotokhoz kép... (2023.02.28. 06:28) chatGPT, a bioinformatikus

Differenciál expresszió felülvizsgálva

2022.03.22. 10:53 Travis.CG

A tudományban nem sok helye van a berögzült szokásoknak. Már csak azért sem, mert jöhet egy olyan új vizsgálat, ami fenekestül felforgatja az eddigi ismereteinket. Például eddig sem rejtettem véka alá ellenszenvemet a Wilcoxon-teszttel szemben, ezért is ért meglepetésként, hogy az egyik cikk egyenesen azt javasolja, hogy csakis ezt használjuk, ha differenciál expressziót akarunk számolni nagy ismétlésszámmal.

De mielőtt leborulnánk bizonyos kutatócsoportok lába előtt, akik már évek óta mindenre a Wilcoxon-tesztet használnak, nézzük meg alaposabban is a problémát.

Kezdjük azzal, hogy minden döntéshozatal téved. Szándékosan nem a statisztikai próbákat említettem, mert azok csak számokat adnak vissza eredményül. A számok alapján viszont mi, emberek döntünk, és ez a döntés nem minden esetben pontos. Ezeket a tévedéseket szintén számszerűsítjük, ez a fals pozitív és fals negatív.

Az is köztudott, hogy a különböző döntési kritériumok, különböző módon tévednek. A szakértők ezeken szoktak vitázni, hogy melyik döntés a jobb. A lehetséges döntések száma pedig nagy.

Nincs ez másként a differenciál expressziós elemzéseknél sem. Itt azt kell eldönteni, hogy melyik gén mutat megnövekedett, vagy csökkent expressziót válaszul egy hatásra. Génből pedig sok van. Korábban már erről is írtam.

A fent említett cikk is azzal indít, hogy két programmal is megnézték az expressziós különbségeket, és nagyon kevés gén volt az, amelyik mindkét módszerrel feljött. Ezért elkezdtek utána menni, hogy miért látják ezeket a különbségeket. Mivel manapság nem ritkák a nagyon sok ismétlést tartalmazó kísérletek, kiválasztottak egyet és random összekeverték a csoportokat, meghatározták az eltérő expressziót mutató géneket, majd az egész folyamatot megismételték ezerszer.

Ez egy rendkívül okos megközelítés. A cikkben azt mondták, hogy az így kapott gének mindegyike fals pozitív. Ez nem teljesen igaz. Ha a véletlen csoport bontás jórészt átfed a valódi csoportokkal (nagyszámú permutációs ismétlésnél előfordulhat), akkor feljöhetnek valódi pozitív eredmények is. Szerencsére a cikkben azokat a géneket emelték ki, amelyek a permutációs vizsgálatok 50%-ban feljöttek. Ezeket tényleg nehéz lenne nem fals találatoknak tekinteni.

Ezek alapján pedig a DESeq2, edgeR sokkal több fals pozitív eredményt ad vissza, mint amennyit beállítottunk, míg a Wilcoxon-teszt sokkal kevesebbet.

Azért azt hozzá kell tenni, hogy nem kell kidobni a kukába az összes DESeq2-es számítást. Ha az ismétlések száma kevesebb, mint 8, a Wilkoxon nem ad vissza értékelhető eredményt. Nyolc ismétlés felett viszont a cikk szerint statisztikai erőben nincs különbség a két módszer között, miközben a fals pozitív a Wilkoxon teszt felé billenti a mérleget.

Amit viszont nem értettem a cikkben, hogy miért hagyták ki a t-próbát az összehasonlításokból. A felsorolt indokok meghaladták az én statisztikai ismereteimet, de az is lehet, hogy nem volt kedvük megcsinálni, mikor kérte tőlük egy bíráló. A normalizált adatok logaritmikus transzformációjával elméletileg a t-próbát is lehetne használni.

Mint minden eredménynél, természetesen itt is van ellenvélemény. Röviden arról van szó, hogy nem a statisztikai tesztet kell kicserélni egy kisebb erejűre, hanem a null hipotézist kell megfelelően megválasztani.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr5217783346

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása