HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • Travis.CG: @webhauser: Én nem vagyok jó programozó. Nem vennéd sok hasznomat. (2025.09.18. 10:26) T0ad 2025
  • Travis.CG: Annyiban én is hibás vagyok, hogy könnyen előjönnek belőlem negatív posztok, ezt akartam ellensúly... (2025.05.22. 19:34) Ne csak a rosszat halljátok
  • sdani: Oh... néha eszembe jut, hogy az EBI után esetleg vissza kellene menni valamennyire az akadémiai vo... (2025.03.18. 16:58) Pontos, jól behatárolt célok
  • legyen úgy: Szia, Értem és köszönöm a válaszodat! T. (2025.02.24. 18:23) Expose CTF
  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup

Bioinformatika 2017

2017.12.07. 22:38 Travis.CG

A Bioinformatika 2017 konferencia nem csak a Magyar Bioinformatikai Társaság konferenciája, hanem az Elixir első rendezvénye is volt. A csoportvezetők mellett a PhD hallgatók is előadhatták kutatási eredményeiket. A rendezvényről video felvétel is készült, ha lesz link, itt fogom közzétenni én is. (Szerk: A videók itt találhatóak.)

Csabai István: Kollaboratív keretrendszer genomikai adatelemzéshez
A genomika felfutóban van, egy projekten belül több, különböző háttérrel rendelkező ember dolgozik, gyakran nagy földrajzi távolságban. A megoldás egy felhő alapú rendszer, aminek a Jupyter notebook az alapja, GitLab a verzió követő rendszere, míg a számítás virtuális gépeken megy. Van jogosultság rendszere és kommunikációs felülete. A szolgáltatás itt található.

Barta Endre: Transzkripciós faktorok és kofaktorok topológiájának vizsgálata a DNS-en ChIP-seq adatok elemzésével
A munka során a szabadon elérhető Chip-seq adatokat elemezték újra. A peak legmagasabb pontját meghatározták és ezt tekintették kötőhelynek. A CTCF pozícióhoz képes a többi kötőhely pozíciója nem véletlen szerű, ezért a kötőhelyek egymáshoz viszonyított helyzetére lehet következtetni. Az elcsúszás mértékéből még azt is meg lehet állapítani, hogy a motivum közvetlenül vagy közvetve kötődik-e a DNS-hez.

Antal Péter: Bayesi rendszerszintű vizsgálatok a közös genetikai háttér felderítésére komplex fenotípusok, betegségcsoportok és betegségek összessége esetén
A genetikai asszociációk a kezdeti SNP/fenotípus kapcsolatból tovább fejlődtek. A túlzott többszörös teszt korrekciót a Bayes módszerrel igyekeznek orvosolni, ahol imputációval a már létező háttértudást igyekeznek bevonni a számításokba. Az így keletkező hálózatok rendkívül bonyolultak, mert a gráfok részletesebb leírást adnak, de a feldolgozásuk is időigényesebb.

Fuxreiter Mónika: A szerkezeti elmosódottság szerepe a fehérjék szerveződésében
Az előadáson nem voltam.

Mészáros Bálint: Rendezetlen fehérjék és fehérje régiók szerepe a rákban
Az előadáson nem voltam.

Pongor Sándor: Molekuláris jelzések és a mikrobiális közösségek stabilitása
A mikrobiális élőlények még mindig a legynagyobb metabolizáló állomány a Földön. A megfigyelések alapján tudjuk, hogy a sejtek "tudják", hogy elég a számuk egy erőforrás feldolgozásához, ami azt jelenti, hogy kommunikálnak és kollaborálnak. A kommunikációs géneket matematikailag modellezték, majd megpróbálták a azok evolúcióját is feltárni. Ha a kommunikációs gének mutálódnak, kevert populációk jönnek létre, melyek túlélése kihathat a teljes állományra. Szerencsés esetben az egyik szubpopuláció felül tud kerekedni és túlél. Rossz esetben a hátrányos szubpopuláció gátolja a többi terjeszkedését is.

Gáspári Zoltán: Térszerkezeti sokaságok szerepe a fehérjék szerkezet-hatás összefüggéseinek megértésében
A fehérje szerkezetek meghatározásának egyik legjobb módja, ha kísérletes eredményeket kombinálnak molekuladinamikai számításokkal. Egy prediktált szerkezet validálása bonyolult folyamat, fennáll a túlillesztés veszélye. A csoport készített egy webszervert, melynek célja, hogy elvégezze ezt a validálást.

Szöllősi Gergely János: Horizontális géntranszfer események mint molekuláris fosszíliák
A molekuláris szekvenciák közti különbségek az idővel arányosan nőnek, ezért molekuláris órákként lehet őket használni. Ezek az órák nem globálisak, hanem élőlény csoportonként eltérhetnek. Jelenleg a fosszíliákat tekintik az egyetlen valós bizonyítékoknak, de azok sem képesek minden kérdéses eseményt megmagyarázni. A horizontális géntranszferből eredő bizonyítékok viszont kiegészítheti a fosszíliákat és precízebb génfákat eredményezhetnek. Az elmélet implementációja itt található.

Bálint Mónika: Hogyan csomagoljunk be egy célpontot?
Fehérje molekulák célba juttatásánál fontos azok becsomagolása, hogy a kötőhelyeket megvédjék. Jelenleg két módszer létezik: az AutoDock és az úgynevezett blind docking. A csoport egy harmadik módszert dolgozott ki, amit wrap'n'shake-nek neveztek el. Habár még nincs validálva, a szintetikus teszteken jól teljesít.

Fichó Erzsébet: Rendezett rendezetlenség
A rendezetlen fehérjék kapcsolódhatnak más rendezett vagy rendezetlen fehérjékhez. A PDB, GO és PubMed információkat felhasználva két webszolgáltatást hoztak létre, melyek célja a kölcsönhatás függvényében a rendezetlen fehérjék és azok partnereinek összegyűjtése. A DIBS esetén a rendezetlen fehérjék globuláris partnerekhez kötődnek, míg az MFIB a rendezetlen-rendezetlen kapcsolatokra specializálódott. A két adatbázis a rendezetlen fehérjék teljes spektrumát lefedik.

Dobson László: Rendezetlen fehérjék komplexeinek vizsgálata szekvenciális, szerkezeti és funkcionális szempontból
A rendezett és rendezetlen fehérjék között rengeteg átmenet fordulhat elő. Például egy rendezetlen fehérje is lehet stabil, ha bizonyos partnerekhez kötődik. Kérdés, hogy a rendezetlen-rendezetlen komplexek tagjai lehetnek-e targetek?

Kerepesi Csaba: Öregedést befolyásoló fehérjék predikciója gépi tanulással
A GeneAge az öregedéssel összefüggésbe hozható gének adatbázisa. A kutatási téma célja, hogy gépi tanulás segítségével lehet-e közös jellemzőket találni a gének között, illetve a trenírozott modellel lehet-e új géneket találni? Az XGBoost csomagot használva döntési fát hoztak létre, amelyek jellemzői GO termek voltak.

Medgyes Horváth Anna: Humán mitokondrium haplotípus meghatározás és filogenetikai analízis szennyvíz mintákból
A projekt úgy indult, hogy járványok metagenomikai vizsgálatát végzik szennyvízből, de időközben humán mitokondrium haplotípus azonosítás lett belőle. Az eredmények sem okoztak túl nagy meglepetést: Afrikában az afrikai haplotípus volt döntő többségben, míg ázsiában az ázsiai. Amerika sajnos kevert mintát mutatott.

Nagy Gergely: Makrofág transzkripciós faktor kaszkádok vizsgálata ATAC-seq-kel
Egér modelleken ATAC-seq-kel vizsgálták a makrofágok transzkripciós szabályozását. Több szekvenálással a folyamatot időben nyomon követték és megpróbálták a jelátviteli útvonalat feltérképezni.

Pongor Lőrinc: Mintavételezés hatásának vizsgálata ovárium tumoros betegekben újgenerációs szekvenálással
A tumor egy evolúciós folyamat, tehát szekvenálásnál egy kevert populációs kapunk. Kérdés, hogy a tumor mérete hogyan befolyásolja a szekvenálást? Sequenza segítségével határozták meg a cellularitást, Mutect 2-vel a variációkat. Az eredmények azt mutatják, hogy a méret nem befolyásolta a mutációk számát, mert a nagy mintában a kis klónok kihígulnak.

Pipek Orsolya: Egyedi mutációk gyors és megbízható detektálása izogenikus mintákban
Az előadásban megismerhettük az IsoMut programot, mely hasonló mintákból olyan mutációkat keres, melyek csak kevés mintára jellemzőek. A program már több publikáció alapját is képezte.

Végezetül egy kis anekdota: A molekuláris fosszíliák előadás után az egyik kérdező feltétlenül szükségesnek érezte bejelenteni, hogy meghatározták a bibliai Éva genomját. Az előadó egy pillanatra megfagyott egy kényszeredett mosolyban, majd azzal vágta ki magát, hogy a mitokondriális DNS vizsgálatával tényleg meg lehet állapítani egy ősi mitokondriális szekvenciát, amit hívhatunk Évának, de a kérdező tántoríthatatlanul állította, hogy Évát bizony megszekvenálták. Több komment nem volt.

Ugyan ez a kérdező a haplotípusos előadás után megkérdezte, hogy a dia, ami az emberi faj feltételezett elterjedését ábrázolta, a Pangea állapotot tükrözi-e. Az előadó nem tudta, mit válaszoljon, végül azt mondta: igen. Sajnos a mentés későn érkezett. Az egyik kutató megjegyezte, hogy a Pangea idején még nem volt ember.

1 komment

Címkék: bioinformatika

Ejnye-bejnye

2017.12.02. 23:51 Travis.CG

Már megint rosszalkodtatok, gyerekek? Nem megmondtam, hogy rendesen publikáljatok! Mondtam nektek, hogy tegyétek fel a kódot GitHubra. Milyen kódot? Hát amiről a drágalátos cikketek szól!

Nem, gyerekek, nem azt kértem, hogy tegyetek egy GitHub linket a cikkbe, mert az olyan nagyfiús. A GitHub nem arra való, hogy SVG képeket rakjatok ki, hanem a forráskódot. Tudjátok, megismételhetőség és a többi dolog, amit már kiscsoportban is gyakoroltunk. Így a többi gyerek nem tud játszani a programotokkal.

Van letöltési link? Hol, drágaságaim? A wiki oldalon? Had nézzem csak! Jaj, gyerekek, még mindig nem tudom letölteni, mert itt egy link van az intézet weboldalára, ahol még egy újabb email írása után kapjuk meg a programot. Ez nagyon nincs rendben!

De ha már itt vagyunk a wikin, akkor írjátok le rendesen: Tuxedo pipeline és mellőzzétek a kiscsoportosokra jellemző "a többi eszközt nehéz nem emberi fajokra beállítani", mert tiéteket jelenleg nem lehet letölteni sem. Ha már itt tartunk, azt sem tudjuk meg a wikiből, hogyan kell beállítani a ti programocskátokat. Annyira azért nem lehet egyszerű, hogy le sem kell írni.

Nem akarom hallani a kifogásokat! Ha a csoportvezetőd azt mondja, ugorj a kútba, akkor beleugrasz? A GitHub-on is láthatod a letöltéseket, nem kell eltéríteni a felhasználót.

Még mindig van problémátok? Tényleg? Amíg ezeket a hibákat ki nem javítjátok, nem kezellek benneteket felnőttnek.

Szólj hozzá!

Szolgálunk és értünk

2017.11.23. 23:29 Travis.CG

Egy pár rendszergazda itt is nagy kedvencem lesz, látom. Új ismerősöm, a Hegylakó. Szeretném, ha csak egy maradna belőle.

Egyik nap megkérdezték tőlem, tudok-e csinálni FTP szervert, mert milyen remek is lenne, ha arra küldenék el az adatokat a partnerek. Elmondtam, hogy maga a szerver felállítása nem probléma, de ha azt akarjuk, hogy az intézeten kívülről is elérhető legyen, beszélni kell a rendszergazdákkal is.

Mindjárt meg is kaptam a lehetőséget, hogy a kapcsolati tőkémet gyarapíthassam. Kétszer nem sikerült elérni őket az irodájukban, de ebéd után rájuk találtam. Elő is adtam kérésemet. Egy magas, hosszú hajú rendszergazda vette a fáradságot, hogy meghallgassa. A két szemtengelye nem volt párhuzamos, ezért egy ideig gondot okozott, hova is nézzek, mert az volt az érzésem, hogy a bal szemével mustrál valakit a hátam mögött, miközben a jobb egyenesen rám meredt.

- Persze, meg tudjuk oldani, kell szólni a főnökünknek. Ő most nincs itt, nem is lesz ezen a héten, de az e-mailt figyelemmel kíséri. Most én hiába mondok bármit is, ha ő azt mondja, hogy máshogy csináljuk. A gépteremhez is neki van csak kulcsa. Mennyi adatról lenne szó?

- Tíz és húsz gigabájt köztt.

- Nem lenne jobb egy webes feltöltés? - szólt közbe egy másik rendszergazda.

- Nem. A HTTP protokollnak van egy csomó gyengesége. Nagy adatokhoz nem a legjobb - válaszoltam. Közben végigfutott az agyamon a számtalan kerülő megoldás, amivel mindenki igyekszik elérni, hogy ne kelljen óriási fájlokat weben feltölteni.

- Kell szólni a főnöknek - vette vissza a beszélgetés fonalát Hegylakó. - Ő majd megmondja, mit kell csinálni. Kell írni neki egy levelet, leírni, mennyi adatról lenne szó. Az is lehet, hogy javasol valami jobbat az FTP-nél, nem tudom.

A levelet meg is írtam. A válasz szerint, az intézetnek már van felállított FTP szervere, a levélben el is küldték a felhasználó nevet, de a jelszóért vissza kellett mennem a "fiúkhoz". Biztonság mindenek felett.

A fiúk megint nem voltak a helyükön. Óránként visszajártam és két sikertelen megkeresés után, harmadszor kaptam el őket. Hegylakó rögtön értette, miért jöttem.

- Most olvastam a főnök levelét. Én nem is tudtam, hogy ilyenünk van! A jelszó meg... - itt vágott egy olyan arcot, mintha a kezembe zöld taknyot tartanék és váltig állítanám, hogy ez egy földön kívüli életforma. - Gyere vissza később, addig megpróbálom kideríteni, honnan lehet megszerezni a jelszót.

- Nekem el kell mennem. El tudnád küldeni emailen?

- Persze, nem probléma.

Egyetlen emailt kaptam csak Hegylakó főnökétől, amiben leírta a fiúknak, hogy vegyék át a paranoid gondolkodást és ne küldjenek jelszavakat levélben. Én ebből arra következtettem, hogy a jelszó megvan, csak nem akarják elküldeni nekem. Rendben. Írtam egy munkatársamnak, hogy akkor vegye át ő a jelszót. Válaszában leírta, hogy Hegylakó még mindig nem tudja, miről van szó.

Remek, aki létrehozta a hozzáférést, nem mondja meg a jelszót, aki megmondhatná, az meg nem tudja. Így húzódott át egy egyszerű probléma a jövő hétre.

Szólj hozzá!

Címkék: életmód rendszergazda

Használható táblázatok

2017.11.19. 01:11 Travis.CG

Most következő bejegyzésem nem kifejezetten bioinformatikai témájú, sokkal inkább abban próbál segíteni, hogyan készítsünk olyan táblázatokat, amelyeket egy bioinformatikus is tud használni. A cél, hogy ne abból álljon a közös munka, hogy készítünk egy táblázatot, majd továbbadva azt munkatársunknak, az szintén egy csomó munkát beleöljön szükségtelenül.

Az itt leírtakat inkább iránymutatónak szánom, mint konkrét szabályoknak, mert el tudok képzelni olyan eseteket, amelyek felülírhatják az itt vázoltakat. Sőt, olyan helyzet is akadt már munkám során, amikor többen együtt sem tudtuk eldönteni, melyik táblázat lenne nekünk megfelelő.

Az azonosító maradjon azonosító

A legtöbb laborban dolgozó ember eleve használ táblázatokat, jóllehet ennek nincsenek is tudatában. Ezek egy oszlopos táblázatok szoktak lenni, ahol egyetlen oszlop tartalmaz minden információt. Például: MutMale2007A, MutMale2007B, stb. Ismerős? Biztos vagyok benne. Személy szerint nem szeretem ezt a megoldást, de mint említettem, van létjogosultsága, ha valaki az eppendorf csöveket gyorsan átnézve akarja egy gélen megfuttatni csak a férfi mintákat. Hátránya, hogy nagyon sok információt kell minden egyes alkalommal leírni. Előnye, hogy nem kell egy lapot is böngészni, ha egy kezelést csak egy csoporton kell alkalmazni.

Személy szerint az egyszerű, minimális információval rendelkező azonosítókat kedvelem. Nem az azonosítónak kell hordoznia az összes információt. Az információ száma úgyis növekedni fog a kísérletek és eredmények számával. Arról nem is beszélve, hogy hibák mindig előfordulnak. Csak képzeljük el, ha kiderül, hogy az egyik csövet már az elején rosszul cimkéztük és nem férfiból származik. Közben már futott négy PCR, két különböző kezelés, stb. Mindegyik lépésből tettünk el kis csöveket a mélyhűtő leghátsó zugába. Átcimkézünk mindent, ami többnyire lehetetlen, vagy inkább csak megcsillagozzuk, hogy tudjuk, hogy igaz, hogy ez férfi mintának van jelölve, de valójába más. Ezzel el is indultunk a káosz felé vezető úton.

Egy személytelen és minimális információval rendelkező azonosító esetén ilyen gond nincs. A táblázatot kell csak korrigálni, ahol az azonosítót hozzárendeljük az információhoz.

A másik ok, ami miatt a minimalista azonosító hasznos lehet, ha vakon akarunk dolgozni. Mivel emberek vagyunk, a prekoncepció tudat alatt módosíthatja a mintákhoz való hozzáállásunkat. PhD hallgató koromban emlékszem, én is nagy figyelemmel mértem az enzimet (a drága enzimet, mint erre minden alkalommal felhívták a figyelmemet), szemben a vak mintánál, ahol csak deszt vizet kellett hozzáadni (nem baj, ha kicsit több megy bele, hiszen ez csak a vak). De a bioinformatikai munka elején is szívesen dolgozok vakon, segít, hogy objektívebben lássam az adatot.

Ha ennek ellenére is az információ dús azonosítók mellett döntünk, akkor legalább legyenek következetesek az elnevezések. Mit értek ezalatt? Ha a fenti példánál maradva MutMale2007A jelölést használunk, akkor ne váltsunk át 2007Female1-re félúton. Az információ tartalom ugyan az, de mikor számítógépre kerülnek az adatok, roppant nehéz lesz kódot írni rá. A helyzet akkor szokott bonyolódni, ha a nem várt események történnek. Ismét csak a fenti példa okán. Kiderül, hogy MutMale2007-ből van 50 darab. Először elfogynak az angol ABC betűi, majd azon kezdünk el gondolkodni, hogy a Lineáris B vagy a Klingon karakterek felhasználásával nevezzük el a többit. Mivel mindkettő nehéz, maradnak az emoji-k.

Egy oszlop, egy információ

Ha megvan az azonosító, a táblázat többi oszlopa plusz információkkal tölthető fel. Egy oszlop egy féle információt tartalmazzon. Ezek lehetnek kategorikus változók vagy folytonosak. A folytonos látszólag nem igényel magyarázatot, de itt is akadhatnak problémák. Például a mértékegység. Egy féle mértékegységet használjunk és bár fizika órán megkövetelik, hogy írjuk ki minden szám után (Öt micsoda? Krumpli? Ahogy tiszteletre méltó tanáraim mondták.), táblázatoknál ne tegyük, mert ez után a lépés után a cella megszűnik szám lenni és szöveg lesz. Arról nem is beszélve, milyen frusztráló, ha néha kis betűvel, néha nagy betűvel van kiírva a mértékegység. Néha space-el, néha anélkül, csak, hogy szép legyen az élet.

A kategórikus változóknál is igyekezzünk elkerülni a hasonló elírásokat. Személy szerint itt is az egész számokat részesítem előnybe a kiírt nevek helyett. Habár a kiírt nevek könnyebben értelmezhetőek, ha ábrázolunk valamit, legtöbbször hiba forrásai. Ha mégis a nevek mellett döntünk, csak alfanumerikus karaktereket használjunk és minden esetben ellenőrizzük, nem történet-e elgépelés.

Természetesen itt is van kivétel. Ha a táblázatot DESeq2-ben akarjuk használni csoport képzésre, akkor előfordulhat, hogy meg kell szegnünk ezt a szabályt. A DESeq2 ugyanis csak egy oszlopban található kategóriákat használ fel a differenciál expresszióhoz. Ha tehát több kategória (oszlop) alapján akarunk géneket keresni, kénytelenek leszünk összevonni azokat.

Ne legyen túl sok oszlop

Kinek mi a sok, igaz? A Sangerben volt egy csoportvezető, akinek 107 oszlopos táblázatot kellett generálni. De ő mindig csak az utolsó hármat nézte, ami azt jelezte, hogy a mutáció képes-e tumort indukálni. Ennek ellenére ha nem kapta meg a 107 oszlopot, akkor meg sem nézte az utolsó hármat. Ha a vizsgálatainkhoz fel kell használni egy információt, akkor annak oszlopként szerepelni kell a táblázatban. Ne vigyünk be olyan adatokat, amelyeket úgysem használunk. Ne vigyünk fel olyan oszlopokat, amelyek két vagy több korábbi oszlopból kinyert adat módosulatai. A fenti esetben az utolsó három oszlop a következő volt: tumor indukáló A szerző szerint, tumor indukáló B szerző szerint, tumor indukáló A vagy B szerző szerint.

Redundancia: gondoljuk át

A redundancia kérdése elég nehéz. Alapból a redundancia mentes táblázatokat szeretem, de egyes esetekben nem ilyen egyszerű a válasz. Vegyük például a mutációs táblázatokat. Minden sor egy mutáció, tehát egy kromoszóma pozíción adott nukleotid csere. A táblázatban jelölni akarjuk, hogy melyik génben található meg. Mivel elsajátítottuk az "egy oszlop egy információ" elvet, csak egy gént viszünk fel. De mi van az átfedő génekkel? Egy mutáció ilyenkor két gént ront el. Valamelyik szabályt meg kell szegni!

Másik eset: A Variant Effect Predictorral megnézzük, hogy a mutációnk milyen változást okoz aminosav szinten. A program a gén összes transzkriptjére meghatározza ezt. Tehát egy mutációhoz több hatás is tartozhat. Itt én a redundancia mellett döntöttem, még akkor is, ha ezzel olyan triviális információt vesztek, mint a mutációk száma.

Sokszor látni olyan táblázatokat, ahol ilyen esetben a táblázattól független elválasztó karakterrel felsorolják az összes lehetséges változatot. Ez jó megoldás, ha az oszopot csak szűrésre használjuk. Amennyiben statisztikai számításhoz kívánjuk felhasználni, rögtön egy sor problémába futunk.

Az egyik megoldás két táblázat használata, a másik, hogy feltételeket szabunk Például a VEP táblázat esetén úgy döntöttünk, a leghosszabb transzkriptet nézzük csak. Mint később kiderült, ez nagyon rossz döntés volt, mert a TP53 esetén, ami a rákos elváltozások döntő többségéért felelős, egyetlen aminosav cserét sem találtunk. Mert a leghosszabb transzkript nem kódol fehérjét! Remélem ez a kis példa is mutatja, hogy egy hibásan felépített táblázat mennyi problémát okozhat.

Hiányzó értékek, kerüljük el

Természetesen nem tudjuk elkerülni őket. Mindig van hiányzó adat. A hiányzó adatnál már csak a bizonytalan adat a rosszabb. Egy szám és mögötte egy kérdőjel. Ha hiányzó érték van, az egyérteműen látszódjon. Ne úgy, hogy pirossal kiszínezzük a cellát! Folytonos változóknál az NA tökéletes, még az R is megérti. A 0 csak akkor jó, ha 0 nem lehet egyébként a táblázatban, tehát nem keverhetjük össze értékkel.

Amikor egy táblázat nem elég

Ha a komplexitás nagyon megnő, felesleges egy táblázatba préselni mindent. Inkább legyen több, kisebb táblázat, mint egy monolitikus, de használhatatlan. Ha a táblázatok száma kezd nagyon megszaporodni, inkább használjunk adatbázisokat. Felépítésük időigényes, de után kinyerhetjük az adatokat mindenki ízlése szerint. Természetesen egy adatbázist elfogadtatni egy Excel központú világban nagyon nehéz. A legjobb, ha nem is borzoljuk vele mások idegeit, csak használjuk. Ha pedig sürgősen szüksége van az adatok más formában való prezentálására, csak írjunk egy lekérdezést 10 másodperc alatt.

Szólj hozzá!

Címkék: bioinformatika

Nem a tiéd

2017.11.13. 00:21 Travis.CG

Technológiai trendek terén mindig is rosszul döntöttem, illetve van egyfajta vonzódásom a vesztes megoldások iránt. Például annak idején szívbaj nélkül vettem egy Efika 5200b-t, pedig mindenki mondta, hogy kevés a memória benne, vannak jobb alternatívák, ha MorphOS-t akarok használni. De a microA1-t is azután szereztem, hogy az AmigaOS4 felhasználók kezdtek áttérni MorphOS-re.

Ezeket a döntéseket nem szoktam megbánni, bár sokkal több akadályt gördítek magam elé, mintha sodródnék az árral. Angliában is Windows telefont vettem, pedig a szakmai fórumok sulykolták, hogy milyen kevés a piaci részesedés, mennyire nincs szoftver támogatottság, stb.

Úgy gondoltam érdekes lesz használni. Nem is bántam meg. A Skype például remekül működött. Amíg az Androidos táblagépen a hívásokat nem kaptam meg, ha a gép alvó állapotban volt, addig a telefon vígan felébredt. Remek volt, hogy egy eszközzel elértem mindent. Természetesen Androidra is volt valami extra szoftver, amit telepíthettem volna, de nem akartam. Miért kell egy program használatához kettőt telepíteni? (Azóta ezt frissítették, most már felébred a tablet is.)

De ennek most vége. Egy hónapja nem tudtam bejelentkezni a Skype-ba a telefonon keresztül. A program a hálózati beállításokra panaszkodott, de azokkal nem lehetett gond, mert más alkalmazások remekül működtek. A netet böngészve akadtam arra a bejegyzésre, hogy a Microsoft letiltja a Skype használatát a Windows 8.1 telefonokra. (Olyan lassan írtam ezt a bejegyzést, hogy időközben a Microsoft teljesen kinyírta a mobilos részlegét.)

Mi van? Állítólag küldtek róla e-mail értesítőt, de miután a Microsoft saját levelező rendszere képtelen kiszűrni a Microsoft nevében küldött spameket, én minden ilyen levelet automatikusan törlök. Egy cég eldöntötte, hogy én mire használhatom azt az eszközt, amiért fizettem.

Ez a húzás olyan, mintha egy férfi azon erőlködne, hogy tökön rúgja magát. Próbálkozik, próbálkozik, de csak nem akar sikerülni. Aztán a megfeszített munka végül meghozza a gyümölcsét és akkor rájön az illető, hogy ez nem volt jó ötlet. De akkor már késő. A fájdalom valós és a pöttöm kis szerv is szépen lilul.

Mindezt az teszi lehetővé, hogy az eszközök nem képezik a tulajdonunkat. A felhő alapú megoldásokkal minden kikerül az irányításunk alól és ha az üzleti érdek úgy diktálja, akkor egy tollvonással eldönthető, hogy a felhasználók mit kapjanak.

Az operációs rendszerek leszedhetnek telepített programokat a gépemről, ha azt nem megfelelőnek találják. A játék kiadói lekapcsolhatják az online szervereket, ha nincs elég bevételük.

Nem teszünk más, mint lízingeljük az eszközöket. Egyre több olyan program lesz, ami havidíjas. Már azt is egyre nehezebb elérni, hogy a megvásárolt program látszólag a birtokunkba kerüljön.

Lehet említeni a szabadság jogokat, ahogy Stallman teszi, hogy csak szabad szoftvert/eszközt használjunk. Sírhatunk a retro életérzés elvesztéséért. De azt is tehetjük, hogy magasról teszünk az egész üzleti érdekek által kezdeményezett zsarolásra és a saját kezünkbe vesszük az irányítást. Rootolunk, visszafejtünk, fejlesztünk. A hardver nálunk van, kódot tud futtatni.

Nyilván sokkal nehezebb, mint átváltani egy másik platformra, de még mindig úgy gondolom, a nehezebb út nem feltétlenül rosszabb. Ráadásul a végeredmény tényleg az enyém lesz. Paradox módon úgy kerülhet valami a teljesen a tulajdonunkba, ha az őt létrehozó cég leveszi róla a kezét.

 

Szólj hozzá!

Címkék: filozofálás cloud computing

Rambo-szindróma

2017.10.30. 22:37 Travis.CG

Rambo a katonai kiképzés csúcsa. Szinonímája a legelitebb csapásmérő erőnek. Nekem mégis a legemlékezetesebb jelenetem az első rész végén hallható monológja, ahol elpanaszolja, hogy hiába a szuper kiképzés, békeidőben még parkoló fiú sem lehet. (Amikor a feleségem felhánytorgatja, hogy nem szeretem az érzelmes, romantikus filmeket, ezzel szoktam rácáfolni.)

Ez a Rambo-szindróma. Tünetei: Az ember azt kérdezi, miért nem csinálhatom X dolgot, ha korábban csinálhattam? Ha valamit jobban is el lehet végezni, miért kell rosszul csinálni? Motiválatlanság a kapott feladat elvégzésére, mert nincsenek megfelelő feltételek. Szélsőséges esetben dühroham a korlátolt rendszer által generált akadályok láttán.

A Rambo-szindróma könnyen összekeverhető a lusta-arrogáns magatartással. Tünetei hasonlóak, csak a lusta-arrogánsokat könnyen leleplezhetjük, ha megnézzük múltbeli teljesítményüket. Az ugyanis közel nulla. A fennálló rendszer elleni gyűlöletük abból adódik, hogy dolgozniuk kellene, de mivel lusták, ezt nem akarják. Lustaságukat arroganciával leplezik és ez a két tulajdonság egyenesen aránylik.

Az igazi Rambó-szindrómás viszont dolgozni akar. Érdekes szekvenálási projektekben akar részt venni, miután visszatért Svédországból. Esetleg Lendület pályázatot beadni, hogy bokorugróból csoportvezető lehessen. De az is lehet, hogy csak egy szuperszámítógép hozzáférést szeretne.

Kezelése még kísérleti fázisban van. Először tüneti kezelést érdemes alkalmazni, hogy megakadályozzuk a "minden pocsék" mentalitás kialakulását. Miután a páciens stabilizálódott, megkezdhetjük a folyamat visszafordítását vicces motivációs videók megtekintésével. A lelkileg megerősödött emberekben tudatosítani kell, hogy egy új élethelyzetben vannak és több energiát kell befektetniük céljaik elérésében, mint korábban.

Esettanulmányok említik, hogy a felépülés nem megy zökkenő mentesen. Gyakoriak a regressziók, aminek hatásai csökkenthetőek, ha a pácienst emlékeztetjük korábbi sikereire.

De talán a legfontosabb, hogy érezzék. Nincsenek egyedül. A problémák talán nem ugyan olyan horderejűek mindenki számára, de az érzések hasonlóak.

Szólj hozzá!

Címkék: filozofálás

Majdnem mindent az RNA-seq-ről (7. rész)

2017.10.27. 14:59 Travis.CG

Az RNA-seq analízis eddigi lépései elég mechanisztikusak voltak. Igazából némi számítógépes ismereten túl nem igényeltek komolyabb tudást. A most következő lépésekhez viszont szükség van a biológiai tanulmányokra és a kísérlet viszonylag alapos ismeretét.

A génlista hasznos, de önmagában nem ad semmi támpontot arra vonatkozóan, milyen biológiai folyamatok változtak meg. Fel kell tennünk a kérdést: miért ezt a génlistát kaptuk eredményül és miért nem egy másikat?

Amikor kezelésnek teszünk ki egy biológiai rendszert, bizonyos anyagcsere útvonalak és jelátviteli rendszerek aktiválódnak. Ezeknek a fehérjék (és rajtuk keresztül a gének) csupán építő kövei.

A nem szakmabeli olvasóimnak - amennyiben vannak - had éljek egy hasonlattal. Képzeljük el, hogy egy építményt felrobbantunk és a törmelékből kell megmondanunk, milyen épület állt eredetileg. Találunk sok szalmát, vályogot. Gondolhatjuk, hogy egy parasztkunyhó volt, de ennyi bizonyíték alapján akár egy istálló is lehetett. A downstream analízisben is előfordulhatnak hasonló bizonytalanságok.

Miért? Először is, nem ismerjük minden gén minden funkcióját. Nem ismerjük az összes anyagcsere útvonalat és az ismert útvonalak összes tagját sem. Az annotációkat folyamatosan fejlesztik, de ennek a fejlődésnek az üteme nem egyenletes minden adatbázisban, amit a munkánk során használunk. Akiben ezek alapján felmerül, hogy az így kapott eredmények nem elég objektívek, az jó nyomon jár. Itt jön elő a kísérletes validáció fontossága.

Ennek ellenére szerintem ez a legizgalmasabb lépés, mert az így kapott eredmények megvitatása sokkal közelebb áll a tudományhoz, mint a korábbiak. Hiszen a tudomány lényege nem a pipettázás, PCR futtatás vagy a szekvenciák illesztése, hanem válaszadás bizonyos kérdésekre.

Annotációk

Ontológiák

Az ontológiák közös jellemzője, hogy a kategóriákat mesterségesen egy hierarchikus rendszerbe tömöríti, majd a minden kategóriába elhelyezi a géneket. Mesterséges mivolta miatt nem mentes a hibáktól, az elnevezések nyakatekertek, de jó kezdő pont, hogy egy áttekintő képet kapjunk az eredményekről. Többféle ontológia létezik. A leghíresebb a GO, de létezik már ontológiája betegségeknek, rákos géneknek is.

Protein interakciók

Habár az egyetemi oktatásban azt a képet sugalmazzák, hogy a fehérjék amolyan magányos vadnyugati bosszúállók, azért ne feledkezzünk meg róla, hogy ezeknek a figuráknak is van lova, hatlövetűje és kalapja, amelyek nélkül nem tudják beteljesíteni végzetüket (és a rosszfiúkét sem). Ugyan így, a fehérjék is komplexekbe tömörülnek. Ezeket a kapcsolatokat is megtaláljuk olyan adatbázisokban, mint amilyen az IntAct.

Anyagcsere útvonalat

A folyamatok sorrendiségét és a résztvevő molekulák kapcsolatának jellegét az anyagcsere adatbázisok írják le. A leghíresebb talán a KEGG, de a Reactome is sok információt tartalmaz.

Online eszközök

Nem kell feltétlenül több száz soros szkripteket írnunk, ha meg akarjuk ismerni egy génlista titkait. Több weboldal is létezik, ahol csak annyi a dolgunk, hogy feltöltjük az eredményül kapott géneket és megláthatjuk a feldúsuló funkciókat.

Panther

Ez az adatbázis igazi veterán, de folyamatos fejlesztés alatt áll. Többféle gén azonosítóval is megbirkózik, a GO mellett gén családokra is kereshetünk, illetve anyagcsere utakra. Használata rendkívül egyszerű, de publikáció kész ábrákat ne várjunk tőle.

Reactome

Az adatbázis limitált vizsgálati eszközöket is rendelkezésünkre bocsát. Humán központú, ami annyit jelent, hogy a más fajból származó génlisták humán megfelelőjét használja, amit azután emberi anyagcsere utakra térképez. Értelem szerűen, ha rendszertanilag messzebb álló élőlényeket vizsgálunk, több lesz a hibás eredmény.

David

A microarray időkből visszamaradt mindenes eszköz, amit érdemes nagy óvatossággal kezelni. 2010 és 2016 között nem jött ki új verzió belőle. Előszeretettel használják csoportvezetők, ha valamit nagyon gyorsan akarnak megtudni és az egyetlen elérhető bioinformatikus épp elment aludni, nyaralni.

Enrichr

Ezt az eszközt nem használtam rendszeresen, csak egy Coursera kurzus részeként ismerkedtem meg vele. A többi eszközhöz képes puritánabb.

String

Ez az eszköz tavaly újult meg, így rajta lehet jelenlegi listánkon. Érdekessége, hogy rengeteg automatikus megoldás próbálja kitalálni, mit is akar a felhasználó, így viszonylag kevés képzés után is használható. Másik pozitív tulajdonsága, hogy a fehérjék kapcsolatának jellege állítható a merev, kísérletekkel igazolt kapcsolattól a teljesen hipotetikus szövegbányászattal talált asszociációig. Az eredmények akár XML-ben is kimenthetőek, hogy Cytoscape-pel tovább formázhassuk.

Klikkelős programok

A jól ismert programok, mint amilyen a Geneious, Golden Helix, CLC Genomics Workbencs mind képesek valamilyen szinten effajta elemzésekre, de mivel egyiket sem használtam személyesen, róluk nem írok.

Cytoscape

Ez a program a hálózati kapcsolatok fenegyereke. Beépített moduljainak köszönhetően képes génlisták elemzésére, de ami talán ennél is fontosabb, fejlett vizualizációs módszerekkel az eredményeket publikációnkba illeszthetjük. Ha van is probléma a programmal, az is inkább a hanyagul megírt bővítményeknek köszönhető, nem a főprogramnak.

FunRich

Ezt még egy kutató gépén láttam, akkor próbáltam ki. Furcsasága, hogy csak és kizárólag Windows gépeken működik (.Net alapú). Egy éve nem frissítették, így az alapját képző adatbázisok megbízhatósága kérdéses. Viszont alapbeállításokkal is képes szép ábrákat produkálni, kezelése egyszerű.

Bioconductor

Természetesen nem lehet teljes az eszközök felsorolása, ha nem térnénk ki az R-ben használható csomagokra.

gage

A gage csomag elsősorban KEGG adatok elemzésére lett kifejlesztve. Bemenete a normalizált expressziós táblázat és az összehasonlítandó csoportok. Eredménye a felülreprezentált anyagcsere utak listája, amit a pathview csomaggal meg is jeleníthetünk. Hátránya, hogy csak NCBI azonosítókkal működik.

ReactomePA

Ha már úgyis az anyagcsere útján járunk, meg kell említeni a ReactomePA-t is. Ez és a következő három csomag ugyan annak az embernek köszönhető, ezért használatuk mutat némi hasonlóságot. Az eredmények hasonló módon vizualizálhatóak. A csomag kifejezetten a Reactome weboldal információit használja, csupán R-en keresztül.

DOSE

Mint említettem, nem csak géneknek van ontológiája. A DOSE csomaggal betegségekhez asszociált géncsoportokat mutathatunk ki.

clusterProfiler

Ez a korona a programhármas tetején. Nem csak KEGG és GO feldúsulásokat kereshetünk, de kapunk hasznos eszközt a gén azonosítók megfeleltetéséhez, interfészt a DAVID webszolgáltatáshoz is és kiterjedt vizualizációs eszközöket az eredmények megjelenítéséhez. Ezt a csomagot nagyon szeretem. Hátránya, hogy a képi eredményeknek nincs jelmagyarázata, így nehéz megállapítani, hogy melyik szín milyen p-értéknek felel meg.

Összefoglalás

Az itt bemutatott eszközök egy kis biológiát csempésznek az amúgy unalmas génlistákba. De az így kapott eredményeket értelmezni is kell, amiben egyik eszköz sem fog segíteni. El kell helyezni azokat a kísérlet kontextusába, hogy végül támogassák (vagy éppenséggel cáfolják) hipotézisünket.

Szólj hozzá!

Címkék: bioinformatika

Vissza a gyökerekhez

2017.10.15. 00:44 Travis.CG

Emlékszem, mikor először tanítottak nekem bioinformatikát, a feldolgozandó szekvenciák mérete kisebb volt, mint egy Wordben megírt kérvény. Akkoriban még olyan programok is voltak (igaz, egyre csökkenő relevanciával), amelyek a szekvenciák szerkesztését próbálták meg segíteni. Igen, egy szövegszerkesztő programot kell elképzelni, amivel ATGC-t lehet beírni. Esetleg N-t.

Ebben az időben olyan programokat is használtam, amelyek különböző módon alakítgatták a szekvenciákat. Megfordították, fehérje szekvenciává alakították vagy több szekvenciában közös részeket kerestek. Ma már senki nem használ ilyesmit.

Még a Sangerben beszélgettem egy számítógépes biológussal. Olyan emberrel, aki formális képzésen sajátította el a szakmát, nem hobbiból ragadt rá valami, mint énrám. Semmit nem tudott a ClustalW-ről, Emboss programcsomagról és elmondása alapján soha nem futtatott Blastot. Az idősebbek ilyenkor azt a téves következtetést vonják le, hogy a mai fiatalok nem tudnak semmit. De igazából csak arról van szó, hogy a mi fejünk van tele idejétmúlt módszerekkel, amire a fiataloknak semmi szükségük.

De néha, ha a telihold földöntúli fénnyel világít és az árnyék világ határa eléri a mi világunkat, csak a régi tudás birtokosai vehetik fel a harcot a démonok ellen. Vagy amikor a földön kívüli inváziót csak egy múzeumból kölcsönvett csatahajóval lehet megállítani, amit szanatóriumból verbuvált legénység üzemeltet.

Pontosan ez történt ebben a cikkben. Mintha csak a kilencvenes éveket idéznénk. Összegyűjtöttük az elérhető búza szekvenciákat a GenBankből, ahol nem volt fehérje szekvencia, ott mi magunk fordítottuk le azokat. Az első szerző kézzel végignyálazta és kijavította a hibásan felvitt szekvencia leírásokat. Többszörös illesztéseket futtattunk, majd a közös részekből meghatároztuk azokat a szekvenciákat, amelyekre érdemes PCR-t tervezni.

Jópofa projekt volt, de nem valószínű, hogy az elkövetkező 10 évben újra szükségem lenne a módszerekben alkalmazott programokra.

Szólj hozzá!

Címkék: publikáció

Első nap

2017.10.08. 22:38 Travis.CG

Tyler korán kelt. Ma fog kezdeni új munkhelyén és az előtte álló másfél óra utazás megköveteli, hogy korán elhagyja az ágyat. Sötétben tapogatta ki ruháit és magában megfogadta, hogy legközelebb már este kikészít mindent. Fogadalmát meg is erősítette, mint a világosba kiérve észrevette, hogy egy narancssárga pólót vett fel, amit annyira utált, hogy csak festéshez, WC-pucoláshoz és más alantas munkákhoz vett fel, abban reménykedve, hogy talán végérvényesen tönkre megy. De a póló túlélt mindent. Már öt éve.

Nem volt sok idő, indulni kellett. A póló maradt és rohant a vonatra. Az épületet gyorsan megtalálta. Ötszintes modern építmény kártyás beléptető rendszerrel, ami mellett érthetetlen okokból egy lengőkapu volt. Tyler gondolkodás nélkül nekirontott, de az éber portás megállította.

- Maga hova megy?

- A munkahelyemre - válaszolta ártatlan képpel Tyler.

- Nincs kártyája?

- Ez az első napom.

- Hol dolgozik?

- Tumor Biomarker Csoport - de mikor kimondta, már tudta, hogy ismét eltévesztette a nevet. A portás lassan bólintott, mintha fejben számolná végig az épületben megtalálható kutatócsoportokat és beengedte Tylert. A férfi első útja új főnökéhez vezetett.

- Nekem most egy telekonferenciám lesz - kezdte a csoport vezetője - addig ülj le ehhez a géphez. Utána körbevezetlek. A fiúk - mutatott a két húszas éveiben járó PhD hallgatóra - majd segítenek.

Tyler azonnal a gép erőforrásait kezdte tanulmányozni. Négy mag, 8Gb memória. Egy jobb mobiltelefon paraméterei - gondolta magában keserűen. Reménykedve megkérdezte a PhD hallgatókat, van-e valami szerverük.

- Van, a közeli egyetemen van egy igen komoly gép. Huszonnégy mag és 32Gb memória!

Ez már talán jó lesz nekem, de akkor ti mit használtok? - gondolta Tyler. Időközben a telefonkonferencia is véget ért.

- Jó lesz az új gép? - kérdezte főnöke.

- Attól függ, mire. Vékony kliensnek megteszi.

Egy nagyon vékony kliensnek - tette hozzá magában.

- Nem kaphatnék valami komolyabbat? - kérdezte reménykedve Tyler.

- Mindent meg lehet oldani. Készülj fel, hogy közbeszerzésen keresztül megy. Három hétig fognak ülni rajta, nem csinálnak semmit. Utána megvizsgálják az igényedet, hogy ki lehet-e váltani hasonló termékkel, ami megvan a közbeszerzési listában. Ha nincs meg, új papírt kell kitölteni, újabb három hetet ülnek rajta...

- Látom, jó lesz nekem ez a gép is - törődött bele Tyler.

- Az a helyzet, hogy egyszerűbben veszek egy aranytömböt, mert azt el tudom számolni laboratóriumi vegyszernek.

- Akkor vegyél egy aranytömböt, adjuk el és vegyünk belőle számítógépet.

Főnöke csak mosolygott. Átmentek a központi folyosón, ami az északi és a déli tömböt kötötte össze.

- Bemutatlak Zsuzsának. Ha bármi problémád van, hozzá menj. Egy emelettel felettünk 70 adminisztrátor van, de nem dolgoznak semmit. Egyedül Zsuzsa csinál valamit. Csak rendszergazdából öt van. Nem is értem, miért. Van egy kutató csoportom a klinikán is. Ott kétszer annyi ember van, mint itt, de egyetlen rendszergazda meg tudja oldani az összes feladatot. Fél állásban. Itt is vagyunk. Zsuzsa már előkészítette a papírokat. Itt is hagylak vele.

Tyler nem emlékezett rá, hogy korábban ennyi papírt kellett volna kitöltenie. Nyilatkozott, hogy a papírjait lefénymásolhatják, hozzájárult, hogy az adatait az adminisztráción megismerhetik, kijelentette, hogy nem pályakezdő, nincs egyéb jövedelme. Igen, ott a 2015-öt át kell húzni és tollal fölé írni, hogy 2017. Sajnos nem kapnak új nyomtatványt. Van gyermeke? Akkor az adókedvezményes papírt is ki kell tölteni. Nem, ennyi adat nem elég, kell a gyerek TAJ száma is. Igaz, hogy nincs a formanyomtatványon rublika, a papír határa kell írni. Jaj, fekete tollal kitöltött papírt nem fogadnak el, mert az olyan, mintha fénymásolták volna. Igaz, mindenképp lefénymásolják, de akkor sem szabad feketével kitölteni. A gyerek után pótszabadság is jár, arra egy másik nyomtatvány van. Kellene az érettségi bizonyítvány is. Látom, hogy itt a egyetemi diplomája és a doktori oklevele, de akkor is kell az érettségi. Magánnyugdíj pénztári tag? Kell az igazolás, hogy nem lépett vissza az állami rendszerbe és a pénztárral kötött szerződés.

- Most szólok: az óvodai ballagáson kapott pogácsám sincs meg - jegyezte meg Tyler a végén.

Átment a tűzvédelmi oktatásra. Az oktató egy lakástűz videóval indított. A végén megkérdezte:

- Van maguknál otthon tűzoltó készülék? - az emberek a fejüket rázták.

- Miért nincs? Havonta 22 tűzeset történik, amelyek megelőzhetőek lennének egy 6 kg töltetű poroltó készülékkel!

Ezután potenciális veszélyforrásokat mutatott. Áram alatt álló USB töltő, ami nem töltött semmit, sérült szigetelésű vezeték, virágcserép a tűzoltó szekrény tetején. Az oktató minden egyes képnél hosszan ecsetelte, milyen hülyék ezek az emberek, pedig egyetemet végeztek.

A belépő kártya igénylés sem ment zökkenő mentesen. Az üzemeltetés vezetője elküldte az egyik beosztottjához, aki egyszer sem volt a helyén, pedig Tyler négyszer is kereste aznap.

- Zsóka hihetetlenül arrogáns. Nekem még egyetlen e-mailemre sem válaszolt. Azt hiszi a kutatók vannak érte - kommentálta az esetet Tyler főnöke - pedig ő van miértünk. Mégis hogy képzeli ezt? Ha én lennék a főigazgató, az első helyen rúgnám ki.

Tyler azért még kétszer visszament aznap, de négykor közölték vele, hogy Zsóka elment és már nem jön vissza. Ezután úgy döntött, letörli a Windows gépéről és Linuxot rak rá. Megkérdezte, van-e pendrive valakinél.

- Most pont nincs, mert három hónapja adtuk le a rendelést és még nem érkezett meg. De a sajátomta kölcsön tudom adni - mondta az egyik PhD hallgató.

Tyler csak sóhajtott egyet és nekilátott dolgozni.

1 komment

Címkék: irodalom

Elfeledve

2017.09.27. 10:56 Travis.CG

Szabály: Soha ne nézd meg volt kollégáid publikációit, ha nem akarsz csalódni. Az egészről az MTMT adatbázis tehet, ami annyira szerencsétlen, hogy egy külön posztot érdemelne.

Az történt ugyanis, hogy fel akartam vinni egy publikációt, de mivel cím alapján nem tudtam rákeresni, egy szerzőtársam publikációs listájából akartam átemelni magamhoz. A cikket nem találtam meg, de helyette egy másikra figyeltem fel.

A sztori röviden annyi, hogy a keszthelyi egyetem kitalálta, hogy megszekvenálják a parlagfüvet. Egészen pontosan a transzkriptómot. Referencia genom nélkül egyedül a Trinity jöhetett szóba, mint szoftver.

Mikor az egyetem dolgozói nálunk voltak egy bioinformatikai kurzuson, megkérdezték, tudunk-e segíteni nekik ebben. Mivel nekem már volt tapasztalatom a Trinityvel, el is készítettem nekik, amit kértek, még be is annotáltam a Trinotate-tel. Közben én elmentem a Sangerbe, de még utoljára egy weboldalon elérhetővé tettem az eredményeket. Itt megnézhették az expressziós értékeket, kereshettek géneket az annotáció alapján. A dokumentáció alapján ez valami egyedi webszerveren futott, aminek nem találom a nevét, de sikerült átültetnem Apache alá, ha már az futott a szerveren. Elég felhasználó barát volt.

Mindenki nagyon boldog volt, nem jöttek újabb kérések. Aztán kijött a cikk és még a köszönet nyilvánításban sem voltam benne. Végül is nem egy komoly cikk, nem fogok emiatt eret vágni magamon, de jó lecke volt arra vonatkozóan, hogy nem szabad hagyni, hogy elfeledkezzenek az emberről.

Szólj hozzá!

Címkék: publikáció

Cseppet sem objektíven: Function 2017

2017.09.18. 21:56 Travis.CG

Az idei Function is kimaradt. Jó lett volna eljutni, de mégsem sikerült. A releaseket viszont megnéztem. Lássuk mit kapott az, aki ellátogatott a partyra.

Fotó

A fotó kompó kifejezetten rossz volt idén. A legtöbb képnek az ég világon semmi értelme nem volt. Szerencsére azért akadtak, akik komolyabban vették fényképezést, kiemelkedő alkotás mégsem született.

Grafika

A grafikáktól sem voltam hanyatt esve. A dobogósok persze egy laza csukló mozdulattal nyertek, de a munkásságukat ismerve ők tudnak ennél jobbat is. Úgy tűnt számomra, hogy rutinból nyomták. Azért álljon itt Unreal kézi rajzos képe:

Zene

Ha nem számoljuk a demók zenéit külön beadva, akkor teljesen átlagos zene kompót kapunk. Kellően sokféle zene volt, amitől nem volt unalmas végighallgatni, de egyik sem dobogtatta meg a szívemet.

Wild

Ettől a ponttól kezdve mászunk ki a gödörből. Először egy igen furcsa videóról beszélnék, ez pedig a Vörös Szaturnusz megnevezhetetlen alkotása (Trityiputty, de csak a Ctrl-C és V segítségével tudtam leírni). Csodálom, hogy a videó elkészült. Miért nem kérdezte meg senki az alkotókat, hogy mit keresnek éjnek évadján baltával a kezükben egy repülőtér közelében? A gázálarcról nem is beszélve. Talán valaki el is indult, hogy megkérdezze, de a produkciót látva sóbálvánnyá dermedt.

Az igazán nagy dobás a Singular Crew 4 darab C64 összteljesítményét használó Quad Core volt. Ennek az alkotásnak az igazi értéke nem a látványban, hanem a részletekben rejlik, amiről nekem elég kevés információm van. Elég csak végiggondolni, mi kell négy gép összekötéséhez, amiket alapvetően nem hálózatra terveztek. Na, ugye!

Demo

A demók elég vérszegények voltak. Az utolsó helyezett demót annyira untam, hogy még az Esc gombot is lusta voltam megnyomni. Inkább kimentem a konyhába inni egyet. Közben a feleségem is elment vásárolni, őt is kikísértem. Mikor visszaértem, a demó még mindig ment! Fényképekre valami Parkinson-shadert raktak, amitől mindegyik remegett.

Slyspy Rainbow Clash sorozata újabb állomáshoz érkezett, de mostani produkciója csak a látható fény spektrumának 60%-át használta, szemben a korábbi 90%-al. A The Adjective mindig is egy avantgárd utat járt, de amit most készítettek, az mintha direkt arra ment volna ki, hogy elüldözze a nézőt vagy szándékosan sötétbe tartsa. Eddigi munkáikban mindig volt valami halvány narratíva. Itt teljesen elhagyták azt. Semmi nem elég hangsúlyos, pedig néhány textúrán szöveg van és egyszer mintha egy ember körvonalai bontakoznának ki. De aztán Mégse. Igazából a Nafplio jobban tetszett, mert az olyan demó szerű volt.

Ami viszont megmentette a kompót a totál kudarctól, az a poén faktor. A Super First Demo 2 például remekül bemutatja, hogyan reagálnak a veterán scenerek egy-egy újonc próbálkozásaira. Bár meg kell hagyni, Gargaj ennyire nem szőrös szívű.

Ha létezik burleszk a demók között, akkor a Foo2 Island az! Eredeti vason még viccesebb, mert nálam a targonca két kereke kitörött és csonkán teljesítette feladatát. (A YouTube verzióban strapabíróbb.)

256b intró

Nem tudom, hogy csinálják, de a 256 byte intrók egyre színvonalasabbak. Ha az első tíz alkotás bármelyike nyert volna, nem éreztem volna csalódást. Jó volt látni mindegyiket. Nagyon ötletes és változatos produkciók voltak. Túl sokat nem lehet írni róluk, meg kell nézni mindet:

Összegzés

A beadott releasek idén gyengébbek voltak, mint amit egy európai szintű demoparty nyújtani szokott. Nem tudom, ennek mi volt az oka, de remélem, hogy ez nem egy trend kezdete.

Szólj hozzá!

Címkék: demoscene

Kalandod most már tényleg véget ér

2017.09.10. 00:26 Travis.CG

Ismét Angliába készültem. Egyrészt le kellett adnom a nyakamon maradt lakást, ahol a bérleti szerződést nem lehetett felmondani, másrészt közeledett a távmunka próbaidejének a vége.

Kicsit olyan volt, mintha fedett ügynök lennék. Volt angol telefon, angol lakáskulcs, de a táskám egy másik rekeszében magyar telefon és magyar lakáskulcs.

Nem indult zökkenő mentesen az út. Eleve késve indult a gép és mire megérkezett, már egyetlen vonat sem közlekedett. Kénytelen voltam taxival menni. Az angliai otthonunk, illetve ex-otthonunk nagyon üres volt bútorok nélkül, de már nem számított. Úgyis egy hétig leszek csak itt.

Angliában nagyon kevés munkaszüneti nap van, de nekem sikerült úgy mennem, hogy az egyik belecsúszott az ott tartózkodásba. Legalább lesz egy nap pihenő, mielőtt meglátogatom a Sangert.

A Campus busz a szokásos útvonalon, szokásos időben jött, de alig láttam ismerős arcot rajta. Ismét megállapítottam, milyen gyorsan cserélődnek az emberek. Az épületbe már nem is tudtam bemenni. A kártya nem működött. Be kell surranni. Mint egy kémnek. Már csak egy csokornyakkendőbe rejtett fényképező gép hiányzott.

Megvártam, míg a kávéra megindulnak az emberek, majd, mielőtt becsukódott volna az ajtó, elkaptam azt. Bent vagyok! A laborban mindenki nagyon kedves volt, de a főnököt két hete nem látta senki. Ennek ellenére a munka feszített tempóban folyt. Én is leültem és nekiláttam dolgozni. Később elintéztem magamnak egy ideiglenes kártyát, úgyhogy nem kellett a 47-es ügynököt megszégyenítő technikákhoz folyamodni.

Másnap a lakással kapcsolatos ügyeket intéztem és vonattal mentem be. Az északi kapunál akartam bemenni, ahol csak kártyával lehet belépni. Itt derült ki, hogy az ideiglenes kártya csak egy napig működik. Szerencsére a természetvédelmi terült irányából be lehet slisszolni. Akár a Nyúllábat is ellophatnám.

Aznap volt egy megbeszélés is a szerződésemről, ahová a HR-es kisasszony mellett még két másik ember is eljött. Rossz előérzetem volt. Egy sima meghosszabbításhoz elég lenne csak a HR is. A balsejtelmem be is igazolódott. Nem kaptam szerződés hosszabbítást.

Mikor elmeséltem a munkatársaimnak, mi történt, ők azt mondták, nem tudtak semmit erről. Azért a hátralévő két napban titokban összedobtak egy búcsú partit. Kaptam egy Cambridge pólót. Majd abban fogok menőzni a demópartikon.

A búcsú után mindenki gőzerővel folytatta a munkát. Látszólag a gépezet nem fog megakadni. Mikor eljöttem Magyarországról, még hónapok múlva is kaptam leveleket, hogy ez vagy az a fájl hol van. Az egyik levélre nem válaszoltam elég gyorsan, mire valami olyasmit vágtak a fejemhez, hogy majd ha innen kell eljönnöm, akkor is ilyen hozzáállásom lesz-e.

Itt nincsenek levelek. Nincsenek elvarratlan szálak. Ha a paraszt legurul a sakktábláról, majd egy másik átveszi a helyét. Senki sem pótolhatatlan. Én meg ismét munkanélküli vagyok.

Szólj hozzá!

Címkék: életmód

Távmunka praktikák

2017.09.04. 00:33 Travis.CG

Eleinte féltem a távmunkától, mert úgy éreztem, a magánéletem és a munka végérvényesen összekeveredik és egy olyan masszát alkot, amiből a végén se nem munka, se nem magánélet nem lesz. A veszély valós, de néhány egyszerű trükkel az ember képes produktív lenni otthon is.

Szeparáció

separation.jpg

Ez talán a legfontosabb az összes közül. A szeparáció lehet térbeli (bemegyek a dolgozószobámba) vagy időbeli (mostantól délután ötig ne szólj hozzám). Nálam az időbeli szeparáció nem megoldható, mert ha a lányom meglátja, hogy a gép előtt ülök, rögtön rám szól: Apa, ne laptopozz! Kíváncsi vagyok, mit fog mondani, ha ugyan ezt kérem tőle tinédzser korában.

A térbeli szeparációt választottam, de azt is a lakáson kívül. Elmentem a könyvtárba. Jobb a net, mint sok internet kávézóban és ingyen van. Sajnos a nyári nyitvatartás nem kedvezett nekem, délután egykor el kellett hagyni az olvasó termet. Ezután kimentem a főtérre, mert ott is van ingyen wi-fi. Amikor jó volt az idő, akkor nem volt gond, de egyik nap olyan meleg volt, hogy a laptop hűtője nem tudott megbírkózni feladatával. Az egér akadozva mozgott. Nagyon érdekes volt.

Koncentráció

concentration.jpg

Hatékonyan akkor lehet dolgozni, ha a munkára koncentrálunk. Nem szabad YouTube-ot nézni, blogot írni, bevásárolni.

Ilyen szempontból a főtér nem volt ideális választás. Először is, minden féle ember dumált hozzám. A fiatal hittérítők, akik Istenhez akartak vezetni, koldusok, akik ocsmányságokat vágtak a fejemhez, ha nem adtam elég pénzt nekik. (Ilyenkor vissza szoktam kérni tőlük a pénzt, mondván, én ennyit is értékelek.). De szimplán már azért is beszóltak, hogy miért nem dolgozom. (Tudjátok, olyan félhangos beszólás, nem is neked intézve, de elég hangosan, hogy halld.) Ez nem volt gyakori, de előfordul.

A koncentrációban segíthetnek bizonyos böngésző bővítmények is. Nekem az volt a legjobb, hogy a Sangeres laptopot használtam VPN-en keresztül, tehát a Mindenható Rendszergazdák látják minden eltévelyedésemet. Más esetben egy asztalra helyezett kép a főnökről is megteszi.

Felszerelés

equipment.jpg

A melóhoz melós cucc kell. Ez egyrészt segít a szeparálásban, másrészt a koncentrációban. Ha a munkafelszerelés van nálam, akkor dolgozni akarok. A felszerelésnek pedig hibamentesnek kell lennie. Amíg a saját gépemen egy Slackware Linux van, ahol kézzel kell elindítani a grafikus felületet és egy olyan egér csatlakozik hozzá, ahol a bal gomb elég gyakran kihagy (de átállítottam bal kezesre, hogy ne okozzon gondot), addig ez megengedhetetlen a munkára használt gépen. Ott Kubuntu van és Windows. A munkára kell koncentrálni nem a felszerelésre.

Kapcsolat

connection.jpg

Senki nem dolgozik egyedül, mindig vannak munkatársak, akikkel együtt kell működni. A velük való kapcsolattartás nélkülözhetetlen. Ez első sorban az interneten keresztül valósul meg, a stabil kapcsolat elengedhetetlen.

Redundancia

ateam.png

Mi nem az A-csapat vagyunk, nekünk kell a B-terv. Ha elmegy a net, a főnöködet nem fogja érdekelni, hogy miért nem dolgozol. Nekem konkrétan a villany ment el az egyik vihar után. A laptop három órán keresztül bírta, de aztán áramért kiáltott. Szerencsére már évekkel ezelőtt vettem egy szünetmentes tápegységet és ezzel további két órát tudtam dolgozni. Utána már volt áram megint.

Ha ezt a pár dolgot szem előtt tartjuk, az otthonunkban ugyan olyan hatékonyak lehetünk, mint a munkahelyen.

Szólj hozzá!

Címkék: életmód

Azok a fránya paraméterek

2017.08.20. 23:23 Travis.CG

A paraméter miatt az alignment elveszett,
Az alignment miatt az ismétlés elveszett,
Az ismétlés miatt a kísérlet elveszett,
A kísérlet miatt a cikk elveszett,
A cikk miatt a kutatócsoport elveszett,
Máskor gondosan válaszd meg a paramétered!

Szerencsére a való életben nem ilyen sarkallatos a helyzet, de a paraméter választás sok mindent meghatároz. Ez különösen igaz azokra a paraméterekre, amelyeket a felhasználó be sem állíthat. Például olyan népszerű programokban, mint a MACS2.

A történet egy Chip-seq kísérlettel kezdődött. Mivel a Sangerben a rák genomikai csoportok nem sűrűn szekvenálnak chip-seq-et, a teljes pipeline-tt mellőznöm kellett, amit nem is bántam. Az illesztést minden mintára BWA-mem-el végeztem, ezért elég váratlanul ért, mikor az alignmenten futtatott MACS2 egyetlen egy fájlnál azt jelezte, hogy a BAM fájl érvénytelen.

Azért tudnak furcsa dolgok történni az LFS-ben (ez a közös tárterület, amit minden node elér), főleg ha több szál akarja írni ugyan azt a fájlt, vagy a fejlesztők épp frissítettek a kliensen, amiben maradt egy túlcsordulás hiba vagy időtúllépés keletkezett. Ugyancsak meglepő dolgokat képes produkálni egy több száz nodos szuperszámítógép is. Az egyik gép kiesik, nem tudja olvasni a megosztott fájlrendszert. Mindez rengeteg teret ad Bitmumusnak, hogy kiélje magát.

Az ellenőrzés viszont azt mutatta, hogy a BAM fájl teljesen korrekt, olvasható, a szükséges elemek benne voltak. Gyorsan megnéztem, találkozott-e már más is hasonló problémával, de egyik eset sem illett az én esetemre.

A gyors kacsás keresés viszont kiadta a MACS2 forráskódját, ahol a hiba keletkezett. Elkezdtem böngészni a kódot egyszerűen weben keresztül, amitől olyan érzésem lett, mint a koca dohányosnak, aki nem tüdőzi le a füstöt. Ég a cigi, ég a cigi, de hiányzik az érzés.

A hiba oka viszont megvolt. A kód beolvas 10 readet minden BAM fájlnál és az alapján kiszámolja, mennyi a readek távolsága a fragmenten. Ha az első 10 read értékelhetetlen, mert más kromoszómán vannak, 0 a távolságuk, stb. A program dob egy kivételt, hogy érvénytelen a BAM fájl. A tíz read vizsgálat pedig bele van égetve a rendszerbe.

Gyorsan megnéztem a BAM fájlomat. Valóban, értékelhető read a 30. sortól volt.

Először megnéztem, explicite be tudom-e állítani a fragment méretet. Igen, be lehet a --extsize kapcsolóval, de a BAM ellenérzés továbbra is lefut. Eljátszottam a gondolattal, hogy fordítok egy MACS2-t, ahol átírom a kérdéses sort 100-ra, de ez is csak félmegoldás, arról nem is beszélve, hogy ez további problémák forrása lehet, amire nem is gondoltam.

Ehelyett kitöröltem az első 29 BAM rekordot. A program varázslatos módon lefutott. Az ismétlés mindenképp megmenekült.

Szólj hozzá!

Címkék: bioinformatika

Ágyrács

2017.08.13. 16:47 Travis.CG

Ahogy gyermekem növekszik, úgy változnak az igényei is. Mióta lecseréltük a kiságyat heverőre, az átmeneti időszakban, amíg megtanulja, hogy ne essen le az ágyról, szükség volt valami védelemre.

Angliában, ahol az ágyak és a matracok két külön entitást képeznek, lehet kapni egy egyszerű eszközt, amit az ágy és a matrac közé kell bedugni. Itthon is kapni hasonló felszerelést, de egyik sem illeszthető heverőre, mert nem lehet megoldani a rögzítést, ha az ágy felnyitható.

Szerintem két székkel is simán boldogultunk volna, de egy túlvédő anyának, akit még a családja is támogat különféle rémtörténetekkel, ezt nehéz elmagyarázni. Helyette szükség van egy asztalosra vagy más mester emberre, akik majd megcsinálják.

Mikor jeleztem, hogy én is szívesen megcsinálnám és talán olcsóbb is lenne, csupán megvető megjegyzéseket kaptam és indokokat, miért is vagyok képtelen néhány fát összecsavarozni. Igen, ilyen egy jó, támogató család. Többször hallani, hogy a piramisokat képtelenség felépíteni az akkori technológiával. Ez is biztos hasonló mentalitású feleségekől származik. Mert ha valami nincs az IKEA-ban, akkor az vagy nem létezik vagy lehetetlen előállítani egyszerű halandónak.

Mint azt sejthetitek, ilyen könnyen nem adtam meg magamat. Mikor egy hétvégén egyedül maradtam, elmentem faanyagot vásárolni. Két darab két méteres léccel és két L alakú vassal tértem haza. Az egesz került talán 3000Ft-ba. A korábbi felújításokból marad még laminált parketta otthon, azt is felhasználtam.

A terv az volt, hogy készítek egy ágy alá csúsztatható korlátot. A koncepció megegyezett a matrac alá illeszthető változattal, csak ez magasabb volt.

agyracs1.jpg

Már az összeszerelés során láttam, hogy az eredmény nem lesz jó. A csavarok menték a lécek elfordultak. A parkettára való illesztés után pedig az egész láb rész az L alakú fém mentén nagyon kicsit rugózott. De ami csak egy kis kilengés volt a lábnál, a korlát tetejénél 5 cm-re növekedett. Egy másik probléma magával a parkettával volt. Ha csak kicsi erőhatás érte, szép lassan kicsúszott az ágy alól.

Ez nem lesz jó. A feleségem bele fog kötni a stabilitásába és még igaza is lesz. Széttörni nem volt erőm, így a tákolmányt a pince egy eldugott zugába száműztem. Nem is szóltam róla senkinek.

A kudarc eléggé frusztrált. Nem hiszem el, hogy ne lehetne ezt az elég egyszerű feladatot megoldani! Aztán rájöttem, hogy semmi nem akadályoz meg abban, hogy építsek egy újat. Most már tudom az összes gyenge pontot, csak annyit kell tennem, hogy kiküszöbölöm azokat.

Már csak egyetlen probléma volt: nem volt több magányos hétvége. A következő műveletetbe a feleségemet is be kellett vonni.

Mikor legközelebb szóba került az ágyrács, megint előhozakodtam, hogy én is megcsinálhatnám. Megint jöttek a szokásos érvek, hogy úgysem tudom elkészíteni. Ekkor elővettem a tákolmányt.

- Nézd, építettem egy prototípust. Ez nem jó, de ha vastagabb fát használnák, megerősítenénk ott, meg ott, akkor jó lenne.

- Vastagabb fa kell.

- Gyere el velem és válaszd ki, melyik lenne jó.

Innentől sínen volt a projekt. A feleségem kiválasztott egy 5x3-as gerendát, én összeszedtem a vastagabb vasakat, választottunk bútor lakkot, majd az egészet hazavittük. A projekt összköltsége így háromszorosára ugrott, ha a prototípust nem számítom, de nem bántam.

Talpnak a laminált parketta helyett lambériát választottam, mert a pincében fellelhető hulladák fák közül ez tűnt a legmerevebbnek. Az illesztési pontokat epoxi gyantával kentem be, majd szépen lelakkoztam bútorlakkal. A talp részre csúszásgátló gumikat ragasztottam.

agyracs2.jpg

A végeredmény sokkal jobb lett, mint a prototípus. Olyan erős volt, hogy még engem is kibírt. Igaz, amikor teljes erővel nekifeszültem, recsegett itt-ott. Ha harmadszorra csinálnám meg, akkor nem csak egy csavarral rögzíteném a darabokat, mert ahogy a képen is látszik, az epoxi gyanta ellenére egy kicsit elfordulnak a fák az illesztések mentén. A gyakorlatban ez nem olyan zavaró, mert az ágy alá csúsztatva nem tud elfordulni, de a végeredmény precízebb lenne.

Szólj hozzá!

Címkék: barkácsolás

Majdnem mindent az RNA-seq-ről (6. rész)

2017.08.06. 06:43 Travis.CG

A normalizálás után el kell döntenünk, hogy a gének expressziós különbségei közül melyek szignifikánsak és melyek tulajdoníthatóak csupán a véletlen művének. Ebben segít a differenciál expresszió.

Alapvetően kétféle modell létezik. Az egyik még a microarray időkből származik és lineáris regresszión alapul. A másik módszer a negatív binomiális regressziót használja. Korábban bemutattam mindkettőt és bár elég egyszerű példát használtam, egy dolgot igyekeztem kiemelni: mindkét módszer jó eredményt adhat, de érzékenységük különböző.

A szakirodalomban többször összehasonlították a két módszert és úgy tűnik a negatív binomiális regresszió pontosabb eredményt ad.

De mint az összes többi lépésnél, itt sem technikát, hanem programcsomagot választunk, amelyek képességeikben eltérnek. A leglényegesebb kérdés, hogyan tudjuk a különböző összehasonlítandó csoportokat definiálni? A differenciál expresszió meghatározásakor két csoportot jelölünk ki. Az egyik kontroll, amihez képest látni szeretnénk a változást, a másik a kezelés, ami hordozza a változást. A két csoport elnevezése a kísérlet szempontjából lényeges csak. Matematikailag ha felcseréljük őket, csupán a változás előjele változik, nagysága nem.

Az eredmény legtöbb esetben egy táblázat, ahol megtaláljuk a gének/transzkriptek nevét, használt statisztikai teszt értékeit, p-értékét és a változás mértékét (fold change). Ez utóbbit általában logaritmikus skálán.

Egyszerűbb kísérleti elrendezésnél eleve csak két csoport van, de amint a faktorok (összehasonlítási szempontok) száma növekszik, úgy lesz egyre bonyolultabb a dolgunk.

Rengeteg szoftver implementáció létezik, én most csak azokat szedtem össze, amelyeket az utóbbi két évben használtam.

Limma

Ez a csomag eredetileg microarray kiértékelésre készült. A csoportok definiálására egy matrixot kell létrehozni, ahol a sorok a minták, az oszlopok a faktorok. Ha a minta az adott kategóriába beletartozik, a cellába egy 1 kerül, ellenkező esetben 0. Az összehasonlításokat egy másik mátrix, az úgynevezett constrast mátrix definiálja. Itt megadhatjuk az összes párt. Az utolsó lépésben, ahol az eredményeket íratjuk ki (topTable), a coef paraméterrel mondjuk meg, melyik összehasonlításból szeretnénk táblázatot készíteni.

header <- c(rep("case1", 3), rep("case2", 3), rep("control", 3))
design <- model.matrix(~0 + factor(header))
colnames(design) <- levels(factor(header))
fit <- lmFit(norm, design)
contrasts <- makeContrasts(case1 - control, case2 - control, levels = design)
fit <- contrasts.fit(fit, contrasts)
fit <- eBayes(fit)
topTable(fit, coef = 1)

DESeq2

A DESeq2 egy rendkívül elterjedt program. Az általa használt negatív binomiális regresszió igen érzékeny. A használni kívánt modell mátrix felépítése eltér a Limmánál bemutatotttól. Az oszlopok különböző kategóriák lehetnek és a felvehető értékek egy kategorikus változóban vannak. Az összetartozó minták azonos értéket kapnak. A sorok továbbra is a minták. A példa kódban ez a conditions nevű változó.

raw <- as.matrix(read.table("matrix.tsv", check.names = F, sep = "\t"))
conditions <- data.frame("Day" = c(rep("D5", 3), rep("D7", 3), rep("D9", 3)))
rownames(conditions) <- colnames(raw)
des <- DESeqDataSetFromMatrix(raw,colData = conditions, design = ~Day)
des <- DESeq(des)
result1 <- results(des, contrast=c("Day", "D5", "D7"))
result2 <- results(des, contrast=c("Day", "D5", "D9"))

A program egyszerre csak egy oszlop alapján képes elkészíteni a modellt, ha tehát több faktort kell összehasonlítani, mindegyiket szerepeltetni kell az adott oszlopban. A fenti példánál maradva, ha a Day faktor mellé felveszünk egy Tissue-t is és szeretnénk a szöveteket különböző időpillanatban összehasonlítani, akkor a következő módszert használhatjuk:

cond2 <- data.frame("DayAndTissue" = c(rep("D5Blood", 3), rep("D5Bone", 3), rep("D7Blood", 3), rep("D7Bone")))

Ballgown

A Ballgown a cummeRBund leváltására tervezett program sajnos mind funkcionalitásban, mind stabilitásban elmarad a nagy elődtől. Frissítés is csak ritkán jön hozzá. A program szó nélkül olvassa a Stringtie kimenetet, más szoftverből származó adatoknál hibák felléphetnek. Csak két mintát tud összehasonlítani, többet lehetetlen kívánni tőle. Bár a dokumentáció említi, hogy saját modell mátrixot is lehet beadni neki, tudtommal ez még a jövő zenéje, nincs implementálva. A Limmához hasonlóan lineáris modellen alapul.

conditions <- read.table("conditions.tsv", check.names = F, sep = "\t")
bg <- ballgown(dataDir = "ballgown/", samplePattern = "MR", bamfiles = "ballgown", meas = "all", pData=conditions)
res <- stattest(bg, meas = "FPKM", covariate = "treatment", feature = "gene")

M3Drop

Egy sejtes RNA-seq esetén sokkal nehezebb a differenciálódó gének meghatározása. Az egyik lehetséges implementáció az M3Drop, ami Michaelis-Menten kinetikát alkalmaz annak meghatározására, hogy melyik gének expresszálódnak. A pontosságáról nehéz véleményt alkotnom, mert egy igen zajos adatszettet elemeztem csak vele. A legszoktalanabb tulajdonsága, hogy faktorok definiálása nélkül állapítja meg, mely gének expressziós változása szignifikáns. Ez viszont nagyon hasznos egy sejtes vizsgálatoknál, ahol a begyűjtött sejtek különböző fejlődési fázisban vannak és sok esetben semmilyen információnk nincs arra nézve, melyik minta hova tartozik.

raw <- as.matrix(read.table("count.tsv"))
norm <- M3DropCleanData(raw, is.count = T, min_detected_genes = 2000)
de_genes <- M3DropDifferentialExpression(norm$data, mt_method="fdr", mt_threshold=0.05)
sampleclust <- M3DropGetHeatmapCellClusters(heatm, k = 2)
marker_genes <- M3DropGetMarkers(norm$data, sampleclust)

SCDE

A másik egy sejtes adatok feldolgozására kifejlesztett program, az SCDE. Mivel a korábban említett zajos adatot dolgoztam fel vele, ennek pontosságáról sincs információm, de sokkal konzervatívabb az M3Drop-nál. Történetesen egyetlen gént sem kaptam vele eredményül. A másik szokatlan dolog vele kapcsolatban, hogy míg a legtöbb program kimenetében p-érték, log2 fold change és más megszokott elemek vannak, az SCDE z-score-t, maximum likelihoodot és más egyéb értéket tartalmaz. A fórumot böngeszve persze megtalálhatjuk az átváltáshoz szükséges összefüggéseket.

raw <- as.matrix(read.table("count.tsv"))
gr <- c(rep("control", 3), rep("condition1", 3), rep("condition2", 3))
names(gr) <- colnames(raw)
cc <- clean.counts(raw, min.lib.size = 2000, min.reads = 5, min.detected = 5)
error.model <- scde.error.models(cc, groups = gr, n.core = 1, threshold.segmentation = T, save.crossfit.plots = T, save.model.plots = T, verbose = 0)
prior <- scde.expression.prior(models = error.model, counts = cc, length.out = 400, show.plot = T)
diff <- scde.expression.difference(error.model, cc, prior, groups = gr, n.randomizations = 200, n.cores = 1, verbose = 0)

Zárszó

A differenciál expresszió nagyszerű módszer, de ha nem ismerjük pontosan a kísérlet hátterét, nagyon furcsa eredményeket is kaphatunk. Egyszer például olyan adatokkal dolgoztam, ahol az UV hatását vizsgálták egérre. Két csoport volt: Az első csoportot kis dózissal sugározták be, a másik csoportot nagy dózissal. Természetesen mindkét csoportnak volt sugárzás nélküli kontroll verziója is. Először mindkét csoportot a saját kontrolljával hasonlítottam össze, majd végeztem egy második vizsgálatot is, ahol az összes kontroll egy csoportban volt, hiszen a besugárzás nélküli állatok között minimális különbséget vártunk. Ennek ellenére drasztikus eltérés volt a két eredmény között.

Egy sejtes mintáknál még jobban kell figyelni. Hiába definiálunk csoportokat, minden egyes sejt a sejtciklus másik állapotában lesz. Ha szöveti differenciációt vizsgálunk, akkor a sejtek a feljődés különböző szakaszaiban lesznek. A szekvenálás előkészítésénél a kezdeti DNS mennyiségétől függően bizonyos gének hiányozhtnak. A káosz nem elég kifejező szó arra, amit kaphatunk.

Szólj hozzá!

Címkék: bioinformatika

QT + OpenCV

2017.07.24. 00:05 Travis.CG

Az OpenCV remek képelemző API, de a képeket meg is kell jeleníteni, sőt az sem nagy elvárás, hogy interaktívan változtassuk az elemzés során alkalmazott paramétereket. Szükség van tehát egy grafikus könyvtárra, ami biztosítja számunkra az elemeket. A highgui.h fejléc állomány biztosít számunkra egy igen limitált kereszt platformos elemgyűjteményt, de ha komoly alkalmazásokat akarunk fejleszteni, akkor sokkal több grafikai elemre lesz szükségünk.

Itt jön képbe a QT, ami egy remek kereszt platformos GUI keretrendszer. Jó lenne a kettőt együtt használni.

Alapvetően, ha mindkét könyvtárat linkeljük alkalmazásunkhoz, már használhatjuk is őket. Például készítünk egy ablakot, menükkel, majd a kép megjelenítésnél átváltunk a highgui-ra és azt használjuk. A módszer működik, nagyon ronda és kényelmetlen. Jobb lenne a két API-t közelebb hozni egymáshoz.

Alapvetően két olyan terület van, ahol adatokat kell átadni egyik könyvtárból a másikba. Az egyik a szöveges adatok, másik a képi információk.

Sztringek

Mint minden valamire való C++ könyvtárnak, úgy a QT-nek is és az OpenCV-nek is saját sztring osztálya van és egyik sem kompatibilis a másikkal. A QT QString osztályából könnyen csinálhatunk cv::string-et a következő módon:

void load(QString filename){
   Mat raw = imread(filename.toStdString());
}

Képek

Az OpenCV alapvetően a cv::Mat osztályt használja a képek tárolására. QT esetén több, különböző osztály tárolhat képet, attól függően, mi a célunk. Ha rajzolni akarunk, a QGraphicsScene osztályt használhatjuk. Ez csupán egy felület, ahová rajzolhatunk. Ha meg is akarjuk jeleníteni, szükségünk van egy felhasználói felületre is. Ez a QGraphicsView. Az OpenCV viszont csak bitképekkel dolgozik, ehhez az adatstruktúrához a QImage áll legközelebb.

Tehát ha az alkalmazásunk meg akarja jeleníteni a képeket, a következőt kell tennünk: Az OpenCV Mat osztályából a byte adatot át kell másolnunk egy QImage-be, amit elhelyezünk egy QGraphicsScene-ben, amit megjelenítünk a QGraphicsView-val. Lássuk az implementációt!

Size s = raw.size();
QImage qtimage(raw.data, s.width, s.height, QImage::Format_ARGB32);

Az adat formátuma a legkényesebb lépés. Ha rosszul választjuk meg, jó esetben hibás színeket kapunk, rossz esetben lefagy az alkalmazás. Sajnos nem minden OpenCV képformátumhoz találunk QT megfelelőt. A legkevesebb probléma a szürke árnyalatos képeknél van, azokat QImage::Format_Grayscale8 opcióval használhatjuk.

Van még egy rossz hírem. QImage nem adható QGraphicsScene-hez. Szükség van egy közvetítő osztályra a QPixmap személyében:

QGraphicsScene scene;
scene.addPixmap(QPixmap::fromImage(qtimage));

Végezetül jöhet a megjelenítés:

ui->graphicsView->setScene(&scene);
ui->graphicsView->show();

A neten található más megoldások byte-onként másolják az adatot, ami jó megoldás lehet, ha nem támogatott képformátumot használunk. Ellenkező esetben a fenti megoldás gyorsabb eredményt ad.

Szólj hozzá!

Címkék: programozás opencv

Újra itthon

2017.07.09. 23:34 Travis.CG

Sokan kérdezték tőle, milyen érzés újra itthon lenni. Többnyire röviden válaszoltam nekik, mert nem tudom összefoglalni egyszerűen.

Először is, jó újra túró rudit enni. És az is jó, hogy a felvágott, nem csak sonkából áll. De tényleg, rengeteget gondolkodtam azon, mit csinálnak az állatok többi részével az angolok, mert úgy tűnik, csak sztékből és sonkából állnak.

Az esőhöz való viszonyom is más lett. Azelőtt minden cseppnél már kapucnit húztam, most meg simán elmegyek esernyő nélkül, ha szemerkél. Látom, hogy hülyének néznek, csak nem érdekel.

Angliában érdekes módon többet mosolyognak. Még rám is. Próbálom ezt importálni, több-kevesebb sikerrel. Néha bizony lehervad az arcomról a mosoly. Például mikor valamit megpróbálok elintézni.

Épp csak leszálltam a repülőről, már hárman kunyeráltak tőlem pénzt. Egyikük nem is rejtette véka alá, hogy űrhajóra gyűjt. Elon Musk fellélegezhetsz, kereszbe tettem a konkurenciádnak.

A távolsági buszon megkérdezték, kérek-e számlát. Mivel nem vagyok papír-fetisiszta, mondtam, hogy nem kell. Ekkor hirtelen fele annyiba került a jegy. A sofőr hozzá is tette:

- Üljön ide mögém, az első sorba. Ha majd jön az ellenőr, az az én gondom lesz.

Szerencsére a sofőrnek gondtalan útja volt, leszámítva, hogy mások igenis kérték azt a fránya papír fecnit. Meg is kapták néhány keresetlen szóval együtt.

Hazaérve sem könnyebbültem meg. Az albérlőknek azért sikerült leamortizálni a lakást. Nem mondanám olyan vészesnek a helyzetet, mintha három egyetemista férfi lakott volna ott, de a falakon sötétlett a penész, a hűtő totál káros lett, két helységből eltűnt az áram. Nem is próbálták megkeresni, mi lehet a hiba oka, inkább ütöttek egy szép lyukat az egyik konnektorba és vezettek ki belőle egy hosszú kábelt végig a gázcsövek mentén a konyha másik szegletébe. A világítást pedig egy falra szerelt fénycsővel oldották meg. Azzal indokolták mindezt, hogy így legalább nem tettek tönkre semmit. Igazán megható ez a figyelmesség. De miért nem mondták korábban? Miért akkor kellett megtudnom, mikor már eljöttek?

Az elektromos rendszerrel már korábban is voltak problémák. Egy régi, a hatvanas évekből származó társasházban élek, aminek az elektromos rendszerét még alumínium vezetékekkel oldották meg. Az előző lakó ezért kábel csatornákban megpróbált bevezetni egy új, sokkal terhelhetőbb rendszert, miközben a régi, falba ágyazott rész is megmaradt.

Egy korábbi probléma kapcsán már hívtunk szerelőt, aki felhívta a figyelmemet, hogy itt kellene egy alaposabb felülvizsgálat, mert sok házi barkács megoldás van. Akkoriban a munka mennyisége és a pénztelenség miatt elvetettem a javaslatot. Gondoltam, most eljött az idő, hogy mindent rendbe tegyünk. A villanyszerelő még két év távlatából is emlékezett rám. Felmérte ismét a terepet, majd azt mondta, ez egy egész napos kemény munka lesz. Reggel kilenckor kezd többed magával, de délután négyig végezni fognak. Kicsivel több pénzt kért, mint amennyit annak idején egy hónap alatt kerestem. Gondoltam, csinálják.

A reggel 9 órás kezdés nem indult simán. 10:30-kor hívott, hogy egy órát késni fog. Fél egyre meg is érkeztek. Bizonyára a fény sebességének 10%-val közlekedhettek és ezért az ő órájuk lelassult. Addig bioinformatikai problémákon dolgoztam. Mikor megérkeztek, le kellett kapcsolni az áramot.

Az emberiségbe vetett végtelen hitem alapján úgy gondoltam, hagyhatom őket dolgozni és én is tudnék haladni a saját feladataimmal a könyvtárban. Ez utóbbi nem ment valami jól, mert az internet kapcsolat folyton megszakadt. De szerencsére nem is kellett sokat várni, mert már fél háromkor telefonáltak, hogy készen vannak.

Ez igen! Ezek tényleg fény sebességgel dolgoznak. Mire hazaértem, addigra kiderült, mégsem végeztek. Kifelejtettek egy konnektort. Azt még megvártam.

Mit mondjak? Nem voltam elragadtatva. A helységekben újra volt áram, tehát az elsődleges problémát megoldották. A fürdőszobában az egyik hibás konnektorba egy másik helyről vezették át az áramot, de a felrakott kábelcsatorna így néz ki:

kabelcsatorna.jpg

Valami miatt az egyik villanykapcsolóból kellett egy fázist vezetni a tőle 10 cm-re lévő konnektorba. Ez a drót csak úgy ott volt. Kérdeztem, ez biztonságos?

- Persze, le van szigetelve. Szeretné, hogy bevéssük?

- Igen.

- Nincs az a festő, aki azt lejavítaná.

Azért én bevésettem, és itt követtem el a következő hibát. Hagytam, hogy elmenjenek, mielőtt, mindent ellenőriztem volna. Csak azt néztem meg, ahol korábban nem volt áram. A villanyszerelő még megígérte, hogy egy év garanciát ad a munkájára. Este kilenckor vettem észre, hogy másik két helységben viszont nincs áram. Egészen pontosan csak a régi konnektorokban.

Másnap reggel telefonáltam neki, amit nem vett fel. Türelmes ember révén óránként megismételtem a telefonálást, csak, hogy érezze a törődést. Harmadszorra vette fel. Elmondtam neki a panaszomat. Azt ígérte, hogy este bejön, megnézi a problémát. Igazából én már tudtam, mi a gond, mert korábbi szerelgetéseimnél már felfedeztem, hogy a fürdőszobában van egy kötésdoboz, amiből megy a két említett szobába az áram. Ott van a bibi.

Este bizonyára elfelejtette, hogy elígérkezett, ezért másnap megint óránként elkezdtem hívogatni. Azóta nem láttam.

Tudtam, ezt is nekem kell megoldani. Összesen három konnektorból hiányzott az áram és ebből az egyik egy működő konnektor mellett van. Végül is az én szempontomból elegáns megoldást választottam, ami viszont nem biztonságos, nem szakszerű és senki nem csinálja utánam. Egy háromerű vezeték két végére raktam egy-egy villásdugót és bedugtam a két konnektorba. Ha valaki rossz végé húzza ki, akkor igen csúnya áramütést kaphat, ezért megismétlem: ne csináljatok ilyet.

Ami miatt én mégis ezt választottam, az az, hogy ha mégis sikerül visszacsalni a villanyszerelőt, nem mondhatja, hogy én belekontárkodtam a munkájába, hiszen egyetlen kötést sem módosítottam. Nekem van áramom ott, ahol kell és mivel az egész veszélyes megoldás egy szekrénysor mögött van, esély sincs rá, hogy valaki az kihúzza.

 konnektor.jpg

Komolyan elgondolkodtam egy OKJ-s villanyszerelő képzésen. Csak kétszer annyiba kerül, mint ennek a kóklernek a munkadíja! Életem során kettőnél biztos többször lesz szükségem villanyszerelésre és gány megoldásokat, mint látjátok, én is tudok csinálni.

Szólj hozzá!

Címkék: életmód filozofálás barkácsolás

A jutalom

2017.07.02. 21:24 Travis.CG

A kutatói munka nem olyasmi, mint a versenysport vagy a katonai szolgálat, ahol folyamatosan plecsnikkel adják az ember tudtára, hogy jó munkát végzett. Ez nem jelenti azt, hogy ne lenne szükség visszajelzésre. Van is visszajelzés. Minden publikáció egyfajta elismerés, hiszen más kutatók átnézik a munkánkat és azt mondják, az eredmények érdemesek a közlésre.

Ha pedig sikerül egy igazán jó lapba publikálni, az tovább növeli az elégedettség érzését. De mi a "jó" lap? Van ugye ez az impakt faktor, amit mindenki előszeretettel kritizál és nem is állítom, hogy a legtöbb kifogás nem jogos. Valóban egy mesterséges rendszer és nem mentes a hibáktól. De szerintem nem is annyira rossz, mint ahogy állítják.

Szokták mondani, hogy az idézettség többet ér. Lehet. De kérdem én, mire van nagyobb esély: idéznek egy lapot, amit mindenki olvas, vagy idéznek valamit, amit senki sem? Mit fognak inkább olvasni? Egy lapot, aminek - még ha mesterségesen is - magasan tartják a fontosságát vagy egy lapot, amibe minden szemét megjelenik?

Ezek az események hatnak egymásra és trendeket alkotnak, ahol mindig akad kivétel és mindig akad valaki, aki a rendszer gyengeségeit kihasználva jogosulatlan előnyre tesz szert. Ilyenek az emberek, akik kamu PDF fájlok segítségével eltérítették a Google indexet, mások valódi kutatók nevét felhasználva hamis cikkeket generáltak. Végezetül létezik az a legenda is, hogy egy kutató szándékosan írt egy hibás következtetést tartalmazó cikket, amit utána mindenki idézett és megcáfolt.

Az impakt faktor azért nem minden. Nekem is vannak impakt faktor nélküli cikkeim, amikre büszke vagyok. De ezek olyan újságban jelentek meg, amiket azért olvasnak. Ha jelentéktelen lapban tudunk csak leközölni valamit, az az eredményekre is rányomja a bélyegét. Senki nem mondja: nem baj, majd az idézettség bebizonyítja, milyen kiváló munkát végeztél. Hanem azt mondják: Csak ott közölték le?

Ezért is éreztem keserűséget, amikor hosszas huza-vona után végül megjelent ez a cikk. Alapvetően nem dolgoztam túl sokat vele. A szőlő fajták hierarchikus klaszterezésén és egy szimulált gélkép elkészítésén kívül nem sokat tettem. De az Acta Biologica Szegediensis... Ezt nem olvassa senki. Nem fogja citálni senki. Még hamis cikkekhez sem fogják felhasználni egyetlen betűjét sem.

Természetesen nem ez volt a célunk. A publikálás során tényleg rengeteg újságba elküldtük. Végigpróbáltunk mindent, amit lehet és senki nem kért belőle, csak az Acta Biologica Szegediensis. Ez a mi jutalmunk.

Szólj hozzá!

Címkék: publikáció

Rendszergazdák gyöngye

2017.06.18. 20:47 Travis.CG

Két év után újra meglátogattam a régi melóhelyemet és ismét találkoztam Pannal. Bizonyára ő is nagyon hiányolt, mert csak az én kedvemért előadott egy egyszemélyes performance-t.

Épp egy volt kolléganővel beszélgettem, akinek a gépére R-t kellett volna telepíteni. A beszélgetést folyamatosan hatalmas sóhajok kísérték Pan részéről, innen tudhattam, mennyire nehéz is ez a folyamat. Épp a családtagokról volt szó, amikor Pan hangosan közbevágott.

- Nem megy a telepítés. Hibát ír ki.

- Mi a hibaüzenet? - tudakoltam megértően.

- Nem tudom, nagyon sok hibát ír ki.

Teljesen korrekt. Ha nagyon sok hibaüzenetünk van, egyiket sem olvassuk el, hiszen az időpocsékolás. A legtöbb hülye fejlesztő úgyis csak viccből rakja ezeket a programokba.

- Mi az utolsó hibaüzenet? - kérdeztem ártatlanul. Nem kaptam választ. Pan ujjai erősebben koppantak a billentyűzeten. Talán azt remélte tőle, hogy a számítógép megérti, az így begépelt parancsokat komolyabban kell venni.

Közben másra terelődött a szó, mivel Pan tovább dolgozott. De mikor ismét elkezdődtek a sóhajok, sejtettem, hogy újabb nehézséggel találta szembe magát.

- Nincs hálózat - kommentálta hangosan.

- Az egész intézetben vagy csak a gépen? - tudakoltam. Elvégre, ha tönkre vágjuk a hálózatot, akkor csináljuk rendesen, ne álljunk meg egy gépnél.

A helyzet tovább eszkalálódott. A hálózat elvesztése után egyszer csak felkiáltott:

- Semmi sem működik!

- Kapcsold ki a gépet, mielőtt rászabadul a világra! - javasoltam. Nem volt vevő a megjegyzésemre. Kérte a rendszergazdai jelszót. Mikor megkapta, rögtön be is gépelte.

- Nem működik.

- Próbáld meg num lock nélkül - javasolta neki kolléganőm. A dolog működhetett, mert Pan nem szólalt meg.

- Csináljak biztonsági mentést? - kérdezte viccesen a gép tulajdonosa. Akkor még nem gondolta, hogy ez később komoly lesz.

Pan tovább folytatta azt, amit abba kellett volna hagynia. Vannak, akiket néha meglátogat Bitmumus, de rájöttem, egyesek szimbiózisban élnek vele. Talán ő súgja rendszeresen Pan fülébe, hogy belégzés-kilégzés. Nem tudom, de abban a pillanatban biztos voltam benne, hogy Pan képtelen Bitmumus nélkül élni.

- Nem merem újraindítani a rendszert, mert félek, hogy nem tud bebootolni. Kéne csinálni egy biztonsági mentést.

- Nincs annyi tárhelyem.

- A rendszer frissítése félúton elakard, elment a hálózat. Be kellene fejezni a csomagok telepítést egy CD-ről, de azt nem tudom, hogyan kell - azzal Pan otthagyta a gépet és elment erősítésért.

Én is jobbnak láttam, ha elmegyek. Később megtudtam, még két napig dolgoztak a gépen, hogy használható legyen. Most kellene írnom valami tanúságot, valami pozitív dolgot, amiből mások tanulhatnak. Legalább annyit: gyerekek, ne drogozzatok, mert ilyenek lesztek. De még ez sem adatott meg nekem. Pan teljesen tiszta.

Szólj hozzá!

Címkék: rendszergazda

Lehet, de minek: CNV targetált szekvenálásból

2017.06.11. 22:15 Travis.CG

A kópiaszám változások azonosítása teljes genom szekvenálásból nem különösebben bonyolult. Rengeteg eszközt találni rá és elég jól működik. Többségében a lefedettség változását veszik alapul. Targetált szekvenálásnál (ide értve mindent, ami nem teljes genom szekvenálás) viszont a lefedettsége önmagában nem elég. A kívánt genomi terület kiválasztására alkalmazott protokoltól függően különböző hibákat vihetünk be a rendszerbe, aminek hatása van a lefedettségre.

Mit jelent mindez? Először is, más metodológiát kell használni, másrészt az eredmény sokkal megbízhatatlanabb. Mennyire? Nagyon.

Az intézetben a CNVKit-et használják a legtöbben, de az egyik kutató megkért, hogy használjam a CopywriteR-t, mert a kooperáló partnerek szerint az a legjobb. A projekt vezetője viszont - teljesen jogosan - tudni szerette volna, melyik módszer ad megbízhatóbb eredményt.

Az összehasonlítás alapjául egy korábbi, megközelítőleg 500 sejtvonalon elvégzett microarray szolgált, amit később megszekvenáltak. Egy egyszerű Pearson korrelációval megnéztük, melyik módszer ad jobb megoldást. A CopywriteR esetén az együttható értéke 0,1 volt, de a CNVKit sem teljesített fényesebben a maga 0,3-jával.

Az eredmény nem ért teljesen váratlanul, mert olvastam ezt a cikket. Ebben található a következő ábra:

Vegyük észre, hogy az ábrán a 0,5 a legmagasabb érték, amit egyetlen eszköz sem képes elérni. Mit jelent mindez? A megtalált CNV variációk több, mint fele fals pozitív! Ez egy őszinte cikk. Sokszor látni publikációkat csupa ragyogó értékkel, de mikor az ember maga kipróbálja az adott programot, csak szemetet kap vissza. Még az Excavator korábbi verziójának leírása is ilyen. Itt viszont nyoma sincs semmi ilyesminek. Az eredmények tükrözik a saját tapasztalatot.

Ezek alapján azt javaslom mindenkinek, aki valóban tudni szeretné, milyen kópiaszám változások vannak a mintáiban, futtasson egy alacsony lefedettségű teljes genom szekvenálást is.

Szólj hozzá!

Címkék: bioinformatika

Kalandod itt véget ér...

2017.06.05. 02:58 Travis.CG

Az interaktivitás hajnalán, még a szerepjátékok elterjedése előtt voltak a Kaland Játék Kockázat könyvek. A történetet olvasva időről időre kérdéseket tettek fel, hogyan folytatódjon a sztori és a megfelelő oldalra lapozva olvashattuk döntésünk következményét. Elméletileg a harcjeleneteknél dobókockával kellett volna némi bizonytalanságot (és ezzel együtt izgalmat) csempészni az események folyásába, de senkit nem ismertem, aki betartotta volna ezt a szabályt.

Személy szerint én utáltam ezeket a könyveket, mert a döntésnek csak az illúzióját adták. Emlékszem például, hogy az egyik kaland során valami titkos szektát fedeztem fel egy régi, elhagyatott ház pincéjében. A csuhás nézők közé elvegyülve egy ember áldozatnak voltam a szemtanúja. A könyv fel is tette a kérdést: ha meg akarod menteni a lányt, lapozz X oldalra, ha végignézed a halálát, lapozz Y-ra. Természetesen a megmentést választottam. A mentő akció abból állt, hogy ordítva az oltárra ugrottam, felfedve magamat. A túlerő legyűrt és végül egy döntést hozhattam: álló vagy ülő ketrecbe zárjanak halálomig. A könyv még nagyképűen oda is írta nekem: "mégis, hogy képzelted, hogy megmentheted?". Biztosan nem úgy, hogy ordítva odaugrok. Le akartam kapcsolni a villanyt, hogy a sötét megzavarja a ceremóniát. Be akartam indítani a tűzjelzőt vagy én magam tüzet gyújtani. Kihívni a rendőrséget, katasztrófa védelmet. Túszul ejteni a szekta vezetőjét.

Minden ilyen zsákuca után leírták az ikonikus mondatot: kalandod itt véget ér. Ez volt a legtöbbet olvasott mondat, könyvtől függetlenül.

Most nekem is véget ér egy kalandom. Mikor ezt olvassátok, már nem leszek a Sanger alkalmzásában, hanem utazom vissza Magyarországra. A családom már egy ideje nincs itt, csak én varrom el a szálakat. Próbálom eladni az ocsmány bútorokat, amiket már én is használtan vettem, javítom a bérelt lakásban általunk okozott károkat.

Azt hiszem, az egyik legjobb döntésem ebben az életben, hogy eljöttem ide. Az időjárás kiszámíthatatlan, a kaja förtelmes. Nem lehet egy jót kirándulni, mert minden nyomorult zöld terület körbe van kerítve, legfeljebb másfél méteres ösvényeken lehet csak közlekedni. A legtöbb beszélgetés a helyiekkel felületes és semmit mondó, kimerül az időjárásban. De a meló kárpótolt mindenért. Nem azt éreztem, hogy bármi is visszafog, hogy közém és az eredmény közé állna. Gyakorlatilag a limitáló tényezők saját korlátaim voltak, hogy nem ismerek elég matematikai modellt, amivel az adatokat kiértékelhetem, nem látom át az összefüggést vagy nincs meg az a programozói tudásom, hogy hatékonyabb kódot írjak és ne kelljen 200 évet várni az eredményre.

Nem is tudom, hol olvastam, hogy a kommandósok brutális kiképzésének nem az a célja, hogy a kiképzők kiélhessék szadista hajlamaikat, hanem, hogy az egyén megismerje saját korlátait. Mi az, amit meg tud csinálni és mi az, amit nem. Ez pedig szerintem fontos lenne mindenkinek. Nem egy bioinformatikust/programozót láttam, akik visszajelzés vagy komoly kihívás hiányában azt hitték, hogy ők a szakma csúcsa.

A másik hasznos dolog, amit itt láttam, az információ akadály nélküli áramlása. A sok idegesítő meeting egyik kellemes mellékhatása, hogy nyugodtan fel lehetett vetni bármilyen problémát, rögtön mondtak rá megoldási javaslatot. Nem láttam olyan titkolózást, mint máshol, ahol szintén eljöttek segítséget kérni, de közben nem mondták el az igazi problémát, csak úgy körülírták azt. Mint amikor úgy beszélünk az orvossal, hogy "a barátomnak van egy olyan baja...". Nonszensz, felesleges és nem hatékony.

Természetesen a tudomány élvonalában maradni nem lehet áldozatok nélkül. Ha egy csoport probléma felvetése, módszerei nem voltak elég előre mutatóak, szívbaj nélkül kigyomlálták őket. Mikor a rák genom projekt vezetője kijelentette, hogy megtalálták az összes gént, ami a tumorok 50%-ban előfordul, az egész program átalakult. Néhány klinikai onkológus el is kezdett szállingózni innen.

A másik véglet, amit az egyetemen láttam. Egyes tanszékek tökéletesen elvoltak saját világukban. Konkurencia, elvárások nem voltak. Aki oda bekerült, onnan ment nyugdíjba, akkor is, ha csak a kötelező oktatást csinálta meg. A publikálás pedig kimerült néhány konferencia kiadványban megjelent összefoglalónál. Lehet szidni az elitizmust, de ez utóbbi szerintem sokkal rosszabb.

Lehet szomorkodni a múlton, de minden kaland vége egyben egy újnak a kezdete. Közhely, de ettől még igaz. A kötelék az intézettel még nem szakadt meg, mostantól konzultáns leszek és távmunkában folytatom, amit elkezdtem. Időről-időre visszatérek és beszélek az emberekkel. A konzultáns egyébként is egy remek név. Kellően titokzatos és úgy hangzik, mintha értenék is valamihez.

1 komment

Címkék: életmód

Állatok a Sangerben

2017.05.29. 21:55 Travis.CG

Ha nem számoljuk az egereket (modell organizmus), szúnyogokat (malária csoportok kedvenc állata), különböző élősködőket (parazitológia csoportok), akkor is sokféle állattal találkozhatunk az intézet területén.

A képet Stefancsik Raymond készítette a COSMIC csoportból. Ez a sas komoly munkát végez. Hetente egyszer látogatja az intézetet és röpköd egyet az épületek körül. A cél, hogy a galambok és varjúk kártevő munkáját megszűntessék. Ha végzett, visszarepül a gazdájához.

Az intézethez tartozik egy természetvédelmi terület is, aminek az állományát rendszeresen felmérik. Megtalálhatóak itt a vizisiklók, békák, különböző madarak és pillangók. Én a pillangók megfigyelésében veszek részt. Ez abból áll, hogy keddenként, ha az idő megfelelő, ebédidőben kimegyünk a területre és összeszámoljuk a pillangókat. A többiek már nagyon profik, néha a repülési stílusból tudják, hogy milyen lepkéről van szó. Én csak néhányat ismerek fel, a többinél meg az "ott van valami" felkiáltással másokra hagyom a beazonosítást.

comma.jpg

Egy C betűs lepke (comma). A következő képen egy kis rókalepke (small tortoiseshell) van.

tortershell.jpg

A Sulston épület néhány ablakából rá lehet látni egy mesterséges tóra, ahol vadkacsák és szürke lúdak úszkálnak. Szép látvány, de mikor kimennek a gyepre, akkor elaknásítják azt.

goose.jpg

Van még egy élőlény, aki nagyon szeret az intézet területén lenni, de jelenléte néha problémás. Ő Qiuncy, a macska. Quincy a közeli faluban él, de képtelen ellenállni a tudománynak, igaz csak az ebédlő teraszán és más naptól felhevített területen műveli azt. Fekve. Rendszeresen megpróbál belógni valamelyik épületbe. A biztonságiakat szerencsére alaposan kiképezték, így időben fellépnek, ha Tom Cruise-t megszégyenítő módon belóg. A potenciális humán kollaboránsokat köremailben térítik jobb belátásra.

 quincy.jpg

Quincy újabb beszivárgási kísérlete a Morgan épületbe.

Szólj hozzá!

Címkék: életmód

Cseppet sem objektíven: QBParty 2017

2017.05.25. 08:53 Travis.CG

Még egyetlen QBPartyn sem voltam, de követem az eseményeket. A beszámolók és releasek alapján számomra is úgy tűnik, a QBParty egyre jobb lesz. Szemezgessünk minden kategóriából egy kicsit.

Grafika

A Retro Time című kép enyhe deja-vu érzést váltott ki belőlem. Nem azért, mert a szobámat idézte, hanem mert hasonló témájú képet mintha láttam volna, csak Amigaval. Valljuk be, a C64 joystick ide jobban illik, mint egy PC mellé. Természetesen nem mehetek el szó nélkül a hím Saturnia pyri mellett. Egészen gyönyörű.

Intrók

A Paradyze 20 egy retro PC-s hangulatot idéző intro, ahol greetingeltek minket. Igaz, le kellett lassítanom YouTube-on a demót, hogy lássam, de tényleg ott vagyunk. The specificationról nehéz eldönteni, hogy egy kijavítatlan bugot vagy absztrakt látványvilágot látunk. Nem tudom eldönteni. A Crystalline lord pedig határozottan hangulatos, ahogy a hasábok emberré állnak össze.

A legjobb produkciókat mégis 256b-ban kell keresni. A Torus inside a nagyobb méretkorlátos intrók világát hozza el. Logót és két jelenetet mutat be, ami igen impozáns ebben a kategóriában. A Mind evolves fraktál és zenél egyszerre, nálam nagyon bejött.

Demók

Az oldschool kategória csupán jelképesen képviseltette magát. A vicces vonalat ismét a Tesco Gazdaságos Demócsapat vitte a Kacsák és kockák demójukkal. A Minden Gargaj 2-nek is beillő Gargaj 9001-t teljes értetlenséggel fogadtam. Ez az a fajta humor, ami sör nélkül nem vicces. Manapság divatos emlegetni, hogy az AI elveszi (vagy el fogja venni) ennek vagy annak az embercsoportnak a munkáját. A Los Angeles Lamers már most eljutott arra a szintre, hogy egy nem túl okos mesterséges intelligenciával hasonló stílusú releaseket lehetne gyártani. A Too wierd to Die egy színpadi produkció volt, amit a SceneSat felvételéről néztem meg, de nem tudom megmondani, mit is láttam. Olyan volt, mint egy David Lynch film: többféle értelmezése is lehet és nem biztos, hogy a látott kép bármit is jelent. Amit láttam, az egy világító szemű druida, aki maga tákolta elektronikus hangszeren játszott. Az Abstr'One lézershowja már egy más dimenziót képviselt. Xerxes zenéjével igen kellemesre sikeredett.

Ha pedig a technikai felkészültségnél tartunk, akkor nem mehetünk el szó nélkül a Rebels impozáns demója, a Dark Side mellett sem. Environment mappelt golyók ezrei vagy tízezrei mozogtak részecske rendszerként és alkottak felületeket, formákat.

Szólj hozzá!

Címkék: demoscene

Majdnem mindent az RNA-seq-ről (5. rész)

2017.05.15. 00:28 Travis.CG

Nincs két egyforma szekvenálás. A kapott read mennyiség futásról-futásra változik. Ha csupán összeszámoljuk a vizsgált egységre (génre, transzkriptre, exonra) eső readeket, nem tudjuk összehasonlítani az expressziót más szekvenálásokkal. Szükség van olyan eljárásokra, ahol a szekvenálásból eredő, technikai jellegű különbségeket eltűntetjük. Ez a normalizálás.

Normalizálás után minden különbség, amit találunk, feltételezhetően a biológiai rendszerek különbségeiből adódik. Mint oly sok problémára a bioinformatikában, a normalizálásra is többféle megoldás létezik. Szerencsére nem kell választanunk a különféle eljárások közül. A legtöbb alkalmazás eleve elkötelezi magát egyik vagy másik módszer mellett, tehát ha programot választunk, azzal eleve meghatározzuk, milyen normalizálást fogunk használni.

A legjobb szándék ellenére sem tudom összeszedni az összes létező eljárást, de megpróbálok annyit leírni, amennyivel csak találkoztam. A másik fontos megjegyzés, hogy egy-egy módszer fejlődik az idők során, nem biztos, hogy úgy implementálták azt az alkalmazott programokban, ahogy én itt leírom, de az elv nagyon hasonló.

CPM

Ez a legegyszerűbb eljárás, miRNS-ek esetén ezt használják. A génre (transzkriptre, exonra) eső readszámot elosztják a teljes readszámmal, majd megszorozzák egymillióval, hogy ne kelljen túl kicsi számokkal dolgozni. Innen ered a neve is (count per million).

FPKM/RPKM

Ez nem egy eljárás, hanem egy eljárás család. A kiszámítás módja úgy kezdődik, mint a CPM esetén, tehát egymillió readre normalizálnak, de a teljes readszám mellett a gén hosszára és a read hosszára is normalizálnak. A különbség, hogy miként határozzák meg a read hosszát (a read pár mindkét tagját, vagy csak egyik tagját számolják) és a gén hosszát (teljes gén hossz, effektív hosszúság). A kezdetek kezdetén nem foglalkoztak a readek méretével, csak a gén teljes hosszával osztottak. Később rájöttek, hogy a hosszabb readekből kevesebb illeszkedhet a vizsgált egységre, ezért gén hosszából levonták a readek hosszát. (Úgy is mondhatnánk, a gén hossza helyett azzal számoltak, hogy hány pozícióra illeszkedhet egy read, anélkül, hogy lelógna.) Később tovább módosították a metódust, mert a PacBio szekvenálás miatt a readek hosszabbak lehetnek, mint egy gén.

TPM

A TPM esetén a számolás nagyon hasonló az FPKM-hez, de számolás sorrendje fordított. Először normalizálnak a gén hosszára és csak másodsorban a readek mennyiségére. Miért teszik ezt? Bármilyen szekvenálást is veszünk, a gének TPM normalizált értékének összege azonos lesz. Ha például sejtvonalakat szekvenálunk nagy mennyiségben, akkor nem tudunk hagyományos differenciál expressziót számolni (nincs kontroll, kezelés, a mindent-mindennel összehasonlítást pedig nehéz kiértékelni), de tudunk klaszterezni és kereshetünk mintázatokat. Ezen analízis pontossága szerintem kérdéses, de kivitelezhető és a TPM normalizálás a legjobb választás ilyen esetben.

TMM

Ezen eljárás során abból a feltételezésből indulunk ki, hogy a gének nagy tömege nem mutat differenciál expressziót. Tehát ha vesszük az összes gén expressziójának mediánját, akkor attól magasabb vagy alacsonyabb értékek egy bizonyos százalékáról kijelenthetjük, hogy nem mutat expressziós változást. Ezen gének expresszióját felhasználva kiszámolhatunk egy szorzó faktort, amivel az expressziókat átválthatjuk egy másik minta expressziós értékére. Mivel egy kisérlet több mintát is tartalmazhat, önkényesen kijelölnek egy referencia mintát, majd ehhez számolják ki a szorzó faktort. A módszer nagyon hatékony, de mint említettem akkor, ha a gének egy része nem mutat differenciál expressziót. Ha tehát egy normál egeret akarunk hasonlítani egy genetikailag módosított, mutagénnek kezelt, stresszelt állattal, akkor számíthatunk rá, hogy kevésbé lesz hatékony. A másik potenciális vagy inkább filozófiai eredetű probléma, hogy a referencia nem esik át semmilyen módosításon. Tehát ha a módszerből bármilyen eltérés adódik, akkor ez a minta mentes lesz tőle.

DESeq

Ennek a normalizálásnak nincs külön neve, de mivel a DESeq és a DESeq2 ezt használja, rendszerint így hivatkoznak rá. Nagyon hasonlít a TMM-hez, de ahelyett, hogy önkényesen jelölne ki egy mintát referenciának, mesterségesen kreál egyet. Vagyis minden minta kap szorzó faktort.

TC/UQ/Med

Ez a három módszer nagyon hasonló. Az egy génre eső readszámot elosztják egy számmal, majd megszorozzák az összes minta teljes readszámának átlagával. Hogy mi ez a szám, az a módszertől függ. TC (total count) esetén ez az adott minta teljes readszáma. UQ (upper quartile) esetén a nullától különböző readszámok felső kvartilise, míg Med (median) esetén ez a közép érték lesz (ugyan csak a nullánál nagyobb read számokat véve alapul).

SCRAN

Ez szintén nem egy módszer neve, hanem egy programcsomag egy sejtes RNA-seq elemzéshez, de tartalmaz egy normalizálási eljárást is, direkt ehhez a fajta szekvenáláshoz. A fenti módszerek legtöbbje nem használható egy sejtes adatok esetén, mert sok génről egyszerűen nem keletkezik read. (Bár nekem egy EBI-os fickó azt mondta, nyugodtan használjam a CPM-t) Ez a módszer az úgynevezett spike-in kontrollok használatával igyekszik orvosolni a problémát. A spike-in egy mesterséges RNS szekvencia, amit ismert koncentrációban keverünk a mintákhoz. Mivel mesterséges, a róla képződő readek csak ide illeszkednek és mivel ismert koncentrációban adjuk hozzá, a különbség csak is technikai lehet. Ezzel természetesen még nem oldódott meg a probléma teljesen, mert egy sejtes szekvenálásnál a sejt ciklust szabályozó gének különböző mértékben aktívak, de ez a csomag ezt is megpróbálja orvosolni.

Összefoglalás

Megpróbáltam minél több normalizálási módszert összeszedni, de a lista nem teljes. Újabb és újabb (és bonyolultabb) módszerek jelennek meg, rengeteg cikk hasonlítgatja a különböző módszereket, különböző eredménnyel. Egy dologban minden cikk egyetért: normalizálni kell. Nem tudom, melyik a legjobb, az egyetlen tanács, amit adhatok: elsősorban programcsomagot kell választani. Ha olyan programot választunk, ami a legtöbb igényünket kielégíti, támogatott, sokan használják, akkor nem kapunk túl rossz eredményeket és a kéziratba nem fognak belekötni a bírálók (legalábbis a módszerekbe nem. Vagy nem nagyon.)

Szólj hozzá!

Címkék: bioinformatika

süti beállítások módosítása