HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: Oh... néha eszembe jut, hogy az EBI után esetleg vissza kellene menni valamennyire az akadémiai vo... (2025.03.18. 16:58) Pontos, jól behatárolt célok
  • legyen úgy: Szia, Értem és köszönöm a válaszodat! T. (2025.02.24. 18:23) Expose CTF
  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup
  • sdani: Nagyon jók ezek a bejegyzések! Feszültséggel teli, fordulatos, mint egy jobb krimi. :D Abba ne hag... (2024.04.29. 10:35) Wgel CTF
  • sdani: @Travis.CG: Egy kis szerencse sosem árt. :D (2024.03.01. 13:19) A bioinformatika helyzete 2024-ben

MikroRNS elemzés mirDeep-P-vel

2016.02.13. 23:05 Travis.CG

Ha a klikkelős, bugos, zárt forráskódú mikroRNS elemző programokból elegünk lesz, érdemes megnézni, milyen alternatívákkal dolgozhatunk. Az egyik ezek közül a mirDeep-P. A telepítése nem igényel különleges előkészítéseket. A Bowtie legtöbb bioinformatikus kelléktárában már megtalálható, a Vienna package pedig egyszerű C programok halmaza.

Az első komolyabb lépés a szekvenciák átalakítása egy redundanciától mentes formára, ami így néz ki:

>azonosito_xszam
szekvencia

Mivel a szekvenciák elég rövidek, célszerű azt használni azonosítónak is, mert az eredemény fájlokból könnyen meglesz a szekvencia is. Ezzel az egyszerűsítéssel a szekvenciák átalakítására elég egy parancssori szkript:

awk '{if( (NR-1) % 4 == 1)print}' input.fastq | sort | uniq -c | awk '{print ">"$2"_x"$1"\n"$2}' >input.fasta

Mit is csinál ez? Az első awk kiszedi minden negyedik sort a második sortól kezdődően. Sorba rendezzük, megszámoljuk mennyi van, majd a második awk a fenti formátumra hozza ezt.

A vizsgált élőlény genomját beindexeljük Bowtie-al. Ez elég egyszerű lépés, de akadhatnak problémák. Például a búza genomja olyan nagy, hogy az index nem fér bele a 32 bites számábrázolásba. Az egyik lehetőség a bowtie2 használata, ami támogatja a 64 bites indexeket, vagy az A, B, D genomonkénti indexelés.

Szükség lesz még a potenciális r/t/s/snoRNS-ek helyére GFF formátumban. Jól annotált élőlényeknél ezt könnyű letölteni, de előfordulhat, hogy nekünk kell elkészíteni. Az RFam adatbázisból letölthetőek az ismert RNS-ek, egy Blast segítségével magunk is készíthetünk közelítő megoldást.

Miután minden feltétel teljesült, ideje futtatni a szkripteket.

bowtie -p 6 -a -v 0 bindex -f input.fasta >align_to_genome.tmp

Sok magyarázatot nem kell fűzni. A readeket illesztjük a genomra.

convert_bowtie_to_blast.pl align_to_genome.tmp input.fasta reference.fasta >align

A Bowtie kimenetet táblázattá alakítjuk.

filter_alignments.pl align -c 15 >depth.filtered

Szűrűnk lefedettség alapján.

overlap.pl depth.filtered data/ncRNA.gff -b >overlap_ncrna

Megnézzük mely illesztések fednek át más RNS típusokkal.

alignedselected.pl depth.filtered -g overlap_ncrna >noncrna

Kiszűrjük, a szükségtelen illesztéseket.

filter_alignments.pl noncrna -b input.fasta >candidate.mirna.fasta

A filter_alignments másodszori futtatásával a readeket szűrjük. Ez a kimenet majd egy későbbi lépésnél lesz fontos.

excise_candidate.pl reference.fasta noncrna 250 >precursors.fa

Meghatároztuk a prekurzorokat.

cat precursors.fa | RNAfold --noPS >hairpins.txt

Az RNS prekurzor térbeli struktúráját határozzuk meg. Ez a lépés a leglassabb és itt érdemes párhuzamosítani. Először is a prekurzorok lehetnek redundánsak, különösen egy repetitív elemekkel gazdagított növény esetén. Ha a prekurzos szekvencia nukleotidra pontosan megegyezik, felesleges kétszer lefuttatni ugyan azt az algoritmust. A következő szkript eltünteti a redundanciát:

grep -v "^>" precursors.fa | sort -u | awk '{print ">"NR"\n"$1}' >precursors.nored.fa

Ha van lehetőség, hogy farmon vagy több gépen elosztva futtassunk, akkor célszerű a precursors.nored.fa fájlt több darabra szétszedni és úgy futtatni. A térszerkezetek megfeleltetése az eredeti kandidáns mikroRNS prekurzoroknak egy kicsit nehezebb, több kódolást igényel.

bowtie-build -f precursors.fa bindex/precursors

Készítünk egy Bowtie indexet a prekurzorokból.

bowtie -a -v 0 bindex/precursors -f candidate.mirna.fasta >align_to_precursors.tmp

Emlékszünk még a kandidáns miRNS szekvenciákra? Itt az idő, hogy felhasználjuk őket és a prekurzorokra illesszük őket.

convert_bowtie_to_blast.pl align_to_precursors.tmp candidate.mirna.fasta precursors.fa >align2

Régi ismerősünk, a Bowtie kimenet konvertáló ismét akcióban.

sort +3 -25 align2 >signatures

Ez kell, azt mondja a dokumentáció. Gondolom egyszerűbb volt külső programot használni a rendezésre. Rendezett adatokra pedig hatékonyabb kódot lehet írni.

miRDP.pl signatures hairpins.txt >prediction

Végül az egész folyamat megkoronázásaként jöjjön a végső program. Növények esetén van még egy opcionális lépés, ami egy megmondó ember kritériumai alapján meghatározza, mi lehet "igazi" miRNS. Tényleg nem akarom kissebbíteni Meyers érdemeit, de bármelyik szaktekintély állíthat fel kritérium rendszert, amit majd egy következő szaktekintély félresöpörhet. A reference.len a referencia szekvencia azonosítói és a szekvenciák hossza.

rm_redundant_meet_plant.pl reference.len precursors.fa prediction nr.prediction filter.prediction

Az eredményeket végül felhasználhatjuk, hogy megírjuk a következő nagy cikkünket.

Szólj hozzá!

Címkék: bioinformatika

Helpdesk, segíthetek?

2016.02.01. 00:51 Travis.CG

Ezen a héten én voltam a helpdesk. A hétfői reggeli megbeszélésen az egyik régi motoros csak ennyit mondott: sok szerencsét. A helpdesk egy olyan pozíció, amit senki nem csinál szívesen, ezért minden héten más viszi.

A "büntetősarok" a kutatók irodájában van, mert így nekik is egyszerű elmondaniuk, mi is a probléma. Szó szerint a sarokban van. Egy elég rossz monitor, egy Mac billentyűzet és egy egér az összes felszerelés, amivel csatába küldenek. A saját gépünket használjuk, de ez szerintem nem is baj. Mivel valószínűleg én vagyok az egyetlen PC-s az egész csoportban, még kevesebb eszközt tudtam használni. Hamar kiszúrtam a felesleges perifériák gyűjtőhelyét, ahol minden hiányzó alkatrészt beszereztem és nekiláttam dolgozni.

A kérések egy úgynevezett ticket rendszeren érkeznek. A kutató nem tudja, kinek küldi a panaszát, csak annyit ír, helpdesk. Az aktuális ember nézi ezekt és magához rendeli a feladatot. A rendszer rengeteg opcióval van felruházva, de a legfontosabb, hogy a kéréseknek nyoma van.

A minták szekvenáló készülékből a laborosok szervereire vándorolnak automatikusan, ahol illesztik őket, meghatározzák a minőségüket, majd ha minden rendben van, átkerül a rákos csoportok szervereire. Itt minden lényeges adatot egy Oracle adatbázisban tárolnak, a BAM fájlok pedig egy elosztott fájlrendszerben csücsülnek. A kutatók egy webes felületen klikkelgetve kiválasztják, mit is akarnak a mintákkal és elindul a feldolgozás a számítógép farmon.

Természetesen Murphy nem unatkozik ez alatt, ahol tud, beleköp a levesbe. Itt jön a képbe a helpdeskes, akinek az egyik feladata, hogy Murphy-nek kiossza a napi tockost és kézzel mindent visszatereljen a megszokott kerékvágásba. Először is, ellenőrizni kell, hogy a feldolgozó programok futnak-e. Második lépés, ellenőrizni a megszakadt folyamatokat. Jobb napokon 7-10 munkafolyamat szakad meg, rosszabbakon 140. A leggyakoribb ok, a program több memóriát akar használni, mint amennyit beállítottak neki. Ezt könnyű orvosolni, a weben van adminisztrációs felület, ahol láthatóak a naplófájlok és néhány paraméter állítási lehetőség.

Ha egy teljes projekt hullik darabokra, az már érdekesebb feladat, mert ekkor irány a konzol és lehet javítani a projekt összes futásának paraméter állományait. Szerencsére az évek során elég sok szkript gyűlt össze a tipikus hibák javátására.

A csoport saját wiki oldala is részletes leírásokat tartalmaz a hibák megoldására. Mivel elég sok lapból áll a wiki is, ezért néha elég nehéz megtalálni a releváns információt, de nem lehetetlen. Végezetül ha tudjuk, hogy az adott megoldás jobban fekszik valamelyik kollégának, akkor simán át lehet passzolni neki.

A héten két olyan eset volt, ami globális katasztrófához vezetett. Az egyik esetében sikerült egy perjelet csempészni a minta nevébe. A weboldal ettől megdöglott, ha projektre klikkeltünk. A GBrowser teljesen kinyiffant, amikor megpróbálta letárolni a mintát, a feldolgozó programok mind megakadtak.

A wiki szerint ki kellett volna törölnöm a mintát, eltávolítani az adatbázis bejegyzéseket és másik néven importálni, majd hagyni, hogy az egész rendszer észhez térjen. Természetesen a kutatónak délutánra kellettek volna az eredmények. Ha kitörtlöm a mintát, akkor azok is megsemmisülnek. Először megkérdeztem a kutatót e-mailen, hogy ez elfogadható-e neki. Válasz persze nem jött, mert megbeszélésről megbeszélésre rohangált. Végül úgy döntöttem, végigcsinálom a procedurát, mert a GBrowser hiánya mindenkit érintett.

Szépen végigcsináltam a lépéseket, majd észrevettem, hogy már a szekvenáló labor szerverein elszúrták a minta nevét. Ahhoz nincs hozzáférésem. Az importálással nem javítok ki semmit. Oké, megyek a veteránokhoz. Elmondtam, mi a hiba, mit ír a wiki. A veterán meghallgatott, majd közölte, hogy a dokumentáció rossz. Szemem láttára írt egy 8 soros SQL-t 15 másodperc alatt, majd kijavította a hibát. Én meg nevettem egyet.

A másik armageddon egészen ártatlanul indult. Egy kutató jelezte, hogy az SNP keresés megszakadt. Megnézte a logokat, de semmi hibát nem talált benne. Tudnék-e segíteni? Én is megnéztem a naplót. Észrevettem, hogy a feladat ütemező olyan paraméterrel hívja meg a feldolgozó programot, amit az nem ismer. Egyből tudtam, hogy ezt nem tudom megoldani. Lementem a profikhoz, megmutattam, mit találtam. Két perc ellenőrzés után kiderült, hogy az SNP kereső program fejlesztői verziója van kint az éles szerveren és ott csücsül lassan másfél hete.

Pillanatok alatt odacsődült mindenki. Ment a jajveszékelés rendesen. Mindjárt hárman kezdtek el dolgozni az ügyön. Rohangáltak, gépeltek és kiáltoztak egymásnak. Én csak konstatáltam, hogy itt már felesleges vagyok és otthagytam a káoszt.

Szólj hozzá!

Címkék: bioinformatika

Nyelvi nehézségek

2016.01.25. 08:12 Travis.CG

Nem vagyok egy nyelvzseni. Amikor tudományról van szó, azt rendesen megértem, de amikor hétköznapi dolgokról beszélnek, olyan vagyok, mint Banderas a wikingek között. Egyszer tíz percig hallgattam egy beszélgetést, mire rájöttem, a rögbiről van szó.

Rendre elő is fordulnak kisebb félreértések. Minden reggel például beszámolunk az előző napi tevékenységünkről pár mondatban. Jorge, az őrült spanyol rocker egy időben a kacsacsőrű emlős variációkkal dolgozott. Reggel, ha rá került a sor, elmondta, milyen nehézségei voltak a kacsacsőrű emlős mutációival. Nekem elkezdte fúrni az oldalamat a kíváncsiság, hogy egy humán rákkutatónak miért kell a kacsacsőrű emlős genomja? Végül is korábban a tasmán ördög genomjával is kalandoztak. Lehet, hogy most a kacsacsőrű emlős a kulcsa egy betegségnek? Ezért mikor egy lazább megbeszélés volt, odamentem Jorge-hoz, és megkérdeztem tőle, miért érdekes a kacsacsőrű emlős? Azt mondta, nem tudja. De akkor miért dolgoztál vele? Ő nem dolgozott soha kacsacsőrű emlőssel. De minden reggel azt mondtad, hogy a kacsacsőrű emlős variációkkal dolgoztál! Á, nem az a Plathypus program volt, amivel kereste a variációkat.

A második eset a Rák Nap programtervezetével történt. Emailen körbeküldték, mire számíthat az ember. Délelőtt előadások voltak, szendvics ebéd, majd délután kvíz és jégtörés. Ezt utóbbit kicsit furcsálltam. Kint nem is volt olyan hideg. Biztos ez is valami modern változata valami barbár ünnepnek, amikor a férfiak kimentek a fagyott tóra és léket vertek, hogy horgászni tudjanak. De az is lehet, hogy a -80 fokos hűtőből kell előbányászni egy mintát, ami egy régi PhD hallgató hagyott hátra. Mint kiderült, ez csak közösségi játékot jelent, amivel a munkatársak közötti jeget törik meg. (Embereket öltöztettek Karácsony fának. Nem is tudom, akarok-e írni róla.)

A harmadik eset nem hozzám kapcsolódik, de elég vicces. Minden hónap utolsó péntekén van egy órás kötetlen beszélgetés a kampusz teljes tagjai között. Hoznak egy csomó rágcsát, üdítőket és beszélgetnek. Az egyik munkatársam felesége gyereket vár, és mesélni kezdtem neki, hogy nálunk van egy Tejfakasztó buli. Nem tudtam, mi a fakasztani, ezért körülírtam. Az apa a haverokkal jól beiszik, hogy az anyának legyen teje. A munkatársam bólogatott. Náluk is van ilyen, úgy hívják, megöntözni a gyerek fejét. Ott volt egy indiai csóka is. Nagyon komolyan figyelte a diskurzust, majd azt mondta: Nem értem. Hogyan befolyásolja az anya tejtermelését, az apa alkohol fogyasztása?

Szólj hozzá!

Címkék: életmód

Rémálmaim projektje

2016.01.11. 00:52 Travis.CG

Megszületett életem eddigi legkellemetlenebb, legzűrösebb, legutálatosabb, legmegalázóbb munkájából a cikk. Az egész 2012-ben kezdődött, amikor visszatértem az akadémiai szférába. Ez volt az első projekt, amibe bekapcsolódtam és itt szereztem meg a rutint a mikroRNS-ek elemzéséhez. Minden nagyon szépen indult. Több csoport összedobta a pénzt és a Nicotiana benthamiana-t mint modellnövényt megszekvenálták. Volt transzkriptóm, kisRNS és még degradóm is. Hetente összeültünk, hogy megbeszéljük a projekt alakulását, ami nagyon üdítő volt számomra, mert hétről-hétre láthattam, miként közelítünk a célhoz.

Ahogy telt az idő, szép lassan ezek a heti találkozók átalakultak a bioinformatikai csoport számonkérésévé. Például az egyik részfeladat az volt, hogy az azonosított mikroRNS-ekből ki kellett szűrni a konzervált, vagyis a már leírt RNS-eket. Ezt úgy csináltuk, hogy a miRBase adatbázis rekordjaira illesztettük a mi szekvenciáinkat és megengedtünk 2 nukleotid eltérést. Következő héten közölték velünk, hogy amit csináltunk, nem jó, mert még akadnak benne konzervált mikroRNS-ek. Meg is mutatták, melyik. Mondtuk, hogy azért nem találtuk ezt meg, mert ez 3 eltérést tartalmaz. Futtassuk le 3 nukleotid eltéréssel? Igen. Következő héten még mindig maradt konzervált mikroRNS a listában, mert míg mi 3 eltéréssel szűrtünk, addig 4-el “ellenőriztek”. Mondtam is nekik, hogy valahol húzzuk meg a határt, mert ha elérjük a 21 eltérést, akkor csak ismert szekvenciákat fogunk találni.

De a ta-si RNS keresés sem ment sokkal jobban. Egyesek a csoportból annyira nem bírták a kiképzést, hogy sírva fakadtak.

Azért voltak szép pillanatai is a munkának. Például a transzkriptóm annotálása egyfajta tudományos katarzis volt számomra. Egy pillanatig úgy éreztem, valami pluszhoz juttattam az emberiséget, hiszen egy olyan növényről volt szó, aminek a genomja több tízezer scaffoldból állt.

De az esetek többségében ostoba, értelmetlen táblázatokat kellett generálni. Az egyik ezek közül egy olyan Excel volt, aminek 125 lapja volt (tényleg, 125 darab táblázatot akartak velem bepakoltatni egyetlen Excelbe). Mikor végül elkészültem vele, közölték, hogy ez átláthatatlan és nem kell.

Az összes felesleges munkát megcsináltuk, amit kértek, mégis a folyosói pletykák során egyre több olyan hír jutott vissza hozzánk, hogy elégedetlenek a munkánkkal és legközelebb inkább Angliába küldik az adatokat elemzésre (ezt meg is tették egy másik projekttel). Kezdetben még a “nagy emberek” is meglátogattak minket, amikor valami olyan jutott az eszükbe, ami kimaradt a hétfői regulából. A vége felé már csak a PhD hallgatókat küldték hozzánk. Többször próbáltam kideríteni, hogy igazából mi volt a baj, mitől mérgesedett el a viszony, de mindig csak kitérő válaszokat kaptam.

Végül 2013 őszére elfogyott az összes kérés és csak annyit hallottunk, hogy most nagy erőkkel írják a cikket. Eltelt 2014 minden látható változás nélkül. Az élet akkor kezdett felpezsdülni benthamiana fronton, amikor bejelentettem, hogy elmegyek. Bizonyára rájöttek, hogy még egy ilyen balekot, mint én, nem találnak, ezért ismét záporozni kezdtek a kérések. Az eltelt egy év alatt a generált táblázatok egy része “eltűnt”, ezért azokat újra akarták generáltatni. Szerencsére a Wiki még működött és meglepődve tapasztalták, mennyi minden van kész.

De továbbra is jöttek a kérések: legyen nagyobb, a zöld legyen kevésbé élénk. Nem lehetne másik betűtípus? De minden egyes kívánság azután jött, hogy legeneráltam az összes képet. Mint a régi szép időkben, webfejlesztő koromban. Egy piszkálódós hangulatomban meg is jegyeztem, hogy ugyan ezt eljátszani az angol kollégákkal nehezebb lesz. Rögtön jött is a válasz: ők már elsőre cikk minőséget produkálnak.

Erőltették a UEA Workbench használatát, mert egy régi haver csoportjában csinálták. Az elején még tetszett is, de ahogy egyre több hiba került a felszínre, a vele való munka kezdett fájdalmassá válni. Végül kiderült, hogy igazából ott sem használják ezt a vackot. De akkor nekünk miért kellett? Ennyire kell az idézettség?

A logisztikai nehézségekről még nem is beszéltem. Az ismeretlen mikroRNS-eket valahogy el kellett nevezni, ezért a cseppet sem kreatív mymirxxx fomát választottuk, ahol az xxx egy sorszám volt. Az idők során ez átalakult canmir-xxx-é. Ez a szájhagyomány útján terjedt a laborosok között. Tőlem többször kérték más, kapcsolódó projektek esetén, hogy futtassak ezt-azt ezen a listán. De mikor kértem tőlük a listát, akkor soha nem tudták odaadni. Végül kiderült, hogy a lista egy hazai konferencián bemutatott pószteren található. Mire megkaptam, addigra közölték, hogy ez már elavult, mert a Northern hibridizációval nem sikerült mindegyiket visszaigazolni.

De ez az azonosító forma sem volt hosszú életű, mert az egyik telihold után nb-mirxxx-é változott. A fluktuáció folytatódott, ahogy a kísérletek cáfolták egyik-másik mikroRNS létét. Ilyenkor, hogy ne legyen hézag a számozásban, a nagyobb sorszámú szekvenciák egyel előre ugrottak. Csak nekünk felejtettek el szólni. Mi csak annyit láttunk, hogy hirtelen az nb-mir452 nem ezt, hanem egy másik mRNS-t szabályoz vagy megváltozott a szekvenciája. Ezután csak szekvenciákkal voltam hajlandó dolgozni. (Természetesen, amikor eltűnt egy miRNS a sűlyesztőben, az összes ábrát újra kellett generálni.)

Akkor voltam a legproduktívabb, ha nem csináltam semmit. Ilyenkor megspóroltam egy köztes verziót, ami úgysem lett volna jó.

Valahogy a végére értünk mindennek és elkészült a kézirat. Amikor olvastuk, hogy ki mivel járult hozzá a nagy mű egészéhez, kiderült, hogy csak segédkeztünk a bioinformatikai elemzésben. Ez volt az utolsó csepp. Elfogadom, ha bajuk van velem, de a munkám ne degradálják le. Az UAE olyan erőforrás éhes, hogy az egész intézetben csak nálunk volt olyan számítógép, aminben elég memória volt a futtatásához.

Beküldték a kéziratot, én közben átvergődtem Angliába és szép lassan a bírálók is olvasni kezdték. Túl sokat nem kötözködtek, de kérték a mikroRNS targetek GO azonosítóit és a konzervált mikroRNS-ek MFEI értékét. Az első rész még egyszerű volt, hiszen az annotálás során a Trinotate a gén ontológiai besorolást is megcsinálja, de a második kérés érdekes problémákat vetett fel. (Hehehe, végül tényleg Angliába küldték az adatokat.)

Az UEA Workbench ugyanis úgy keres ismert mikroRNS-eket, hogy illeszti a readeket a genomra és a miRBase-re. Nem határoz meg prekurzort, nem számol szabad energiát. Első körben a MirCat eredményekből bányásztunk ki prekurzorokat, de nem volt meg mindegyik. Néhány cikk az EST szekvenciákat használta prekurzor keresésre, ezért mi az RNA-seq eredményeket vettük alapul. Még így sem találtuk meg az összeset. Végül a miRBase konzervált prekurzorait Blastoltuk a genomra. (Ekkor tűnt fel, hogy a miRBase-ben a prekurzorok nagy része pontosan 60 nukleotid hosszú. Természet anyácska nem colstokkal jelöli ki a prekurzorok hosszát, inkább gyanítok emberi hibát.)

Mivel nappal a rákos genomokkal játszottam, csak hétvégén és este volt időm a cikkel foglalkozni. De folyamatosan jöttek a levelek, hogy mikor lesznek eredmények. Képeket is könnyebben generáltam újra, mert már megvoltak a jól bejáratott R szkriptek, de a folyamatosan szakadozó net nem volt a segítségemre.

Végül elkészült. A szívás/impakt faktor arány itt volt a legnagyobb. Remélem a jövőben semmi nem közelíti ezt meg.

Szólj hozzá!

Címkék: publikáció

Az előző év összefoglalása

2016.01.03. 00:51 Travis.CG

A múlt év elég mozgalmas volt. Megjelent négy cikk, ötödikek lettünk az NVScenen, elhagytam az országot, csak, hogy a lényeget említsem. A blog is kicsit felpörgött, hála annak, hogy az Oxford Nanopore rátalált. A keménykedésük lett egyébként a legolvasottabb cikk ebben az évben. Utána jött egy kudarcba fulladt annotálás története, majd a Blast bemutató. Értetlenkedésem a metaanalízisről is előkelő helyet foglalt el a népszerűségi ranglistán.

Ez el is gondolkodtatott. Tényleg a kudarcaim a legérdekesebbek? Nem kell félni, lesz utánpótlás idén is.

Most kellene azt írnom, mi minden lesz még idén (nyeremény játékok, még több poszt, videoblog), de inkább maradjon minden változatlan.

 

Szólj hozzá!

Oszd meg és egyél

2015.12.25. 23:54 Travis.CG

Karácsony közeledtével a csoportok különböző eseményeket szoktak szervezni, ezek közül a legnépszerűbb a "bring and share", aminek a lényege, hogy mindenki készít valami finomat, amit bedob a közösbe, és a többiek esznek belőle.

Még mindig két csoportnak vagyok a tagja, ezért én két ilyen eseményre is hivatalos voltam. Az "igazi" csoportomnak, a Pre-cancer csoportnak palacsintát akartam készíteni. Ki is kevertem a tésztát. A feleségem mindig megszólja a művemet, mondván, túl sok lisztet használok, amitől nagyon száraz lesz a végeredmény. Elhatároztam, hogy kevesebb lisztet és több tojást fogok használni. Szódavizet vagy szódabikarbónát nem találtam a boltokban, de volt egy kis sütőpor szerűség, aminek a 80%-a szódabikarbóna volt, gondoltam jó lesz a tészta könnyítéséhez.

Nekiálltam sütni. A kevés liszt miatt nem állt eléggé össze és leragadt. Ekkor vettem észre, hogy az olcsó palacsintasütő fekete része minden, csak nem teflon. Nem baj, anyám is tudott palacsintát sütni egy vas serpenyőben: olajat öntött alá. Liszttel besűrítettem, öntöttem alá olajat. Továbbra is leragadt. Öntöttem még egy kis olajat, de így meg tocsogott az egész tészta. A közepén továbbra is leragadt, mikor megfordítottam, szétszakadt, nem bírtam mindkét felét megsütni.

Feleségem azt javasolta, öntsem ki az egészet, de nem akartam elpazarolni a sok összetevőt. Helyette a termeltem a selejtet, amit senkinek nem volt kedve megenni. Végül beláttam, ebből nem lesz normális palacsinta. Tartalék tervként a feleségem készített almás pitet.

Nem tudtam, mi a szokás, ezért egy dobozzal összekészítettem, majd elvittem.

A többiek nagyon komolyan vették a feladatot. Mikor megláttam, hogy a spanyolok behoztak egy egész tepsi kaját, a japán nő kirakja a nagy dobozokat és a lengyel PhD hallgató egy óriási rekeszből pakol ki, tudtam, hogy ez nagy leégés lesz.

Az előétel cékla leves volt. Lengyel barátaink ezt eszik Karácsonyra. Ránézésre elég szokatlan volt, de nagyon finom, egyáltalán nem édes, mint ahogy vártam. Állítólag a jó leveshez 10 napig kell érlelni a céklát. A jó alapanyagok érdekében a hallgató a lengyel boltból rendelt. Ettünk valami, aminek a nevét  "humusznak" értettem. Ez leginkább a sárgaborsó főzelékre emlékeztetett. Kaptunk szusit is. Japán munkatársunk azt mondta, a halat Japánból rendelte, mert itt angliában nincs megfelelő. Kézzel festett dobozból szolgálta fel az ételt, amit különleges alkalmakra tartogatott.

Két nappal később volt a Cancer IT közös evészete. Többnyire angolok, többnyire férfiak, többnyire kockák. Keksztekercset akartunk készíteni. Túró nem kapható, ezért tejszínnel helyettesítettük. Darált kekszet sem lehet kapni, de találtunk egy keksz márkát, ami hasonló az Albert kekszhez, azt reszeltem le.

Nem tudom, mi történt, de minden szétfolyt, mint valami folyékony Terminator. Nemhogy feltekerni, de még egy kupacot sem tudtunk rakni belőle. Szerencsére ízre nagyon finom volt. Végül a feleségem kitalálta, hogy muffin papírba adagolja. Rátettük egy nagy tálcára, és bevittem.

Reggel a buszon panaszoltam, hogy az előző eseményre mindenki hogy készült, importálták az alapanyagot, én meg odaállítottam egy doboz almás pitével. Azt javasolták, mondjam most én is azt, hogy ez a keksztekercs úgy készült, hogy a darált keksz különleges méret szelekción esett át és egyenesen Magyarországról érkezett.

A legtöbben nem erőltették meg magukat. A legtöbben egyszerűen kirakták a boltban megvásárolható dobozos csokis sütit. Az egyik főnök két fürt Tescos paradicsommal járult hozzá az ebédhez. Meg is jegyezték, hogy előző este biztos sok időt töltött a konyhában, míg mások az ízléses csomagolást dícsérték.

Mikor meglátták a csillogó muffin papírban kiporciózott sütit, el sem bírták képzelni, hogy mi az. A szerencsétlen, konyhai praktikákban járatlan nyelvtudásom sem segített jobban megértetni, mi is akar ez lenni. Ettől nagyon rejtélyes lett és az utolsó darabig megették.

Kellemes Karácsonyt minden olvasómnak.

Szólj hozzá!

Címkék: életmód

Szekvencia tömörítés

2015.12.21. 00:05 Travis.CG

A szekvenált adatok tárolása nehéz feladat. Lehetne beszélni a növekvő költségekről, a környezeti terhelésről és használhatnánk egyéb marketing szagú kifejezéseket, de frappánsan megfogalmazva ez mind annyit jelent, hogy sosem elég a tárhely.

Az egyik megoldás, hogy a szekvenciákat tömörítjük. Rengeteg tömörítési eljárás van, ami nem veszi figyelembe a tömörítendő adat felépítését, de ha FASTQ fájlokról van szó, akkor érdemes kiaknázni a rögzített struktúra adta lehetőségeket.

A témával kapcsolatban sok cikk megjelent. Közös jellemzőjük, hogy fognak egy humán szekvenciát, betömörítik, és megmutatják, hogy az ő megoldásuk a legjobb. Röviden szólva, az egyszerű esetekre koncentrálnak. A humán referencia genom az egyik legjobb minőségű, a tesztekhez felhasznált szekvenciák közel tökéletesek (vagyis a minőségi mérőszámok is magasak). Nincs semmi kontamináció vagy bármi, amivel komolyan meg kellene birkózni.

Ezért ebben a tesztben Arabidopsis mikroRNS-eket fogok tömöríteni. Eredetileg egy olyan növényt akartam, amiből csak scaffoldok vannak, de sajnos a laptopomon futó virtuális Linux tárhelye limitált. Azért a mikroRNS-ek így is 100% adaptor szennyezettek, ami reményeim szerint alaposan megizzasztja az algoritmusokat.

A felhasznált szekvenciát innen töltöttem le. A referencia a TAIR 10 volt. Tömörítési időket nem mértem, mert azt nem érzem akkora problémának, mint a tárolást, ráadásul egy virtuális gépen mért időnek nem sok relevanciája van.

A nyers szekvencia 1597952192 bájt.

GZIP

gzip SRR2135656.fastq

A jó öreg gzip a szegény ember szekvencia tömörítője. Előnye, hogy azonnal tömöríthető, zcat-al azonnal kitömöríthető és csővezetéken küldhető a feldolgozandó programoknak. A legrosszabb tömörítési aránnyal bírt: 411159400 bájt lett az eredmény.

Brotli

bro --quality 11 --input SRR2135656.fastq --output SRR2135656.fastq.bro

A Google új tömörítője volt a leglassabb. Bár nem mértem, de kétszer is hibernáltam a gépet, mielőtt eredményt kaptam volna. Igaz, a legjobb tömörítési arányt választottam, de így is 317665851 bájt lett a végeredmény.

BZIP2

bzip2 -9 SRR2135656.fastq

A bzip2 sem mai darab, de még így is jobb eredményt produkált, mint a Brotli. A futási idő pedig messze jobb volt a Google szupersztárjánál. 306455232 bájtjával az általános célú telepítők között ez volt a legjobb. Még nem lesz nyugdíjazva egy ideig.

BAM

bwa mem ref/tair10.fasta SRR2135656.fastq | samtools view -b - >tmp.bam
és
samtools sort -o SRR2135656.bam -T tmp -O bam -l 9 tmp.bam

A BAM elsődleges célja nem a szekvencia tömörítés, de a végeredmény viszonylag jó és több információt tartalmaz. Itt a Sangerben is ez volt az elsődleges tárolási formátum. Az illesztőprogram által kiadott BAM 346133963 bájtot, míg koordináták szerint rendezve 341639813 bájt helyet foglalt a merevlemezen.

CRAM

samtools sort -o SRR2135656.cram -T conv.tmp -O cram -l 9 --reference ref/tair10.fasta tmp.bam

A CRAM a BAM-ot hivatott leváltani. Még nem tekinthető teljes értékűnek, noha egyre több eszköz támogatja. A specifikáció is változik, de szerencsére a samtools elég jól követi ezt. A Sangerben az újabban szekvenált eredmények már CRAM-ban is elérhetőek, de volt már olyan, hogy hexeditorral nyomoztam, miért nem tudom használni a fájlokat. Kalandoroknak kötelező, de még nem ipari szabvány. 264964747 bájt a V3 verzióval.

Referee

Ezen poszt megjelenése emiatt a program miatt csúszott. A cikk csupa jót zeng róla, de kétlem, hogy valódi referee látta volna. A letölthető kód alapból nem fordul le, a Makefile szerkesztése után sikerült valahogy lefordítanom, de rögtön segmentation fault-al elszállt. Nem nyomoztam tovább, mi lehetett a baj. A szerző nem sokat dolgozott a kódon az utóbbi időben. Nem tartom valószínűnek, hogy épkézláb program lesz belőle. Virtuális fekete pont jár neki és annak is, aki bírálta.

Leon

leon -c -file SRR2135656.fastq -lossless
vagy
leon -c -file SRR2135656.fastq -seq-only

A Leon igazi profi. A de-novo összeszerelők logikáját használja. Képes veszteség mentes tömörítésre, de ha tudjuk, hogy bizonyos elemekre nincs szükségünk (például az eredeti szekvencia azonosítókra), akkor tovább gyömöszöli a fájlokat. Veszteségmentes módban 84766251 bájt bináris és egy 193442831 bájtos fájl a minőségi mutatóknak. Ha viszont "vesszen a férgese" módban futtatjuk (nincs azonosító, nincs minőségi mutató), akkor 59751380 bájt a végeredmény.

comp.png

Szólj hozzá!

Címkék: bioinformatika

Pillantás a jövőbe

2015.12.06. 00:35 Travis.CG

Egy előadást és egy bemutatót szeretnék megosztani. Mindkettő valamilyen szinten a jövő trendjeit igyekszik bemutatni. Mivel minden jóslás nehéz, különösen, ha a jövőről van szó, így kérem kellő óvatossággal kezeljétek az itt leírtakat.

A jövő számítógépe

A HP egyik előadásában felvázolták a nemes egyszerűséggel The Machine-nak nevezett koncepciót. A mai, CPU központú számítógépes architektúra fejlesztése nem tartható, nemsokára annyi tranzisztort kellene egy lapkára zsúfolni, hogy a kvantummechanikai hatások miatt a számítási teljesítmény romlani fog. A CPU-k energiafogyasztása is egyre nagyobb, ami a fenntartható fejlődés egyik gátja. Mielőtt a felvázolt sötét kép miatt rituális öngyilkosságot követnénk el, lássuk, milyen megoldást javasol a HP. Először is, a sok, redundáns tárolóhelyet, mint memória, merevlemez, elsődleges cache össze kell vonni egyetlen entitássá, ami perzisztens, mint egy mai winchester, de az elérési sebessége a legújabb DRAM-okat is veri. Nem, nem is az SSD-kre gondolnak, annál sokkal nagyobb tárolókapacitást vizionálnak, nagyobb adatbiztonságot és titkosított adatfolyamot. Erre a központi memóriára ülne rá több processzor, amelyek konkurens módon érnék el az adatokat. Mint valami hatalmas videokártyán.

A rendszer előnye, hogy megszűnne az adatok mozgatása a különböző hierarchián elhelyezkedő tárolóhelyek között. A CPU-k specializálódhatnának, a perzisztens tárolóhely kevesebb áramot igényelne. Természetesen problémák is akadnak szép számmal. Először is, nincs operációs rendszer, ami képes lenne elfutni rajta. Az olyan egyszerű dolgok, mint a "nem működik, újraindítom" hatástalan, mert a memória kikapcsolt állapotban is megőrzi tartalmát. A titkosításról nem is beszélve, ami jól hangzik, de egy hardver szinten alkalmazott megoldás mennyire tud lépést tartani a technikai fejlődéssel (ha pedig lépést tart vele, hogyan biztosítják a kompatibilitást?)

Az impozáns terv 2020-ra érhet kézzel fogható állapotba. Legalábbis most így gondolják. Az előadás után több olyan kérdés is elhangzott, amire az előadó egyszerűen nem tudott válaszolni. Annyit mondott, hogy továbbítja a kérdést az illetékesekhez. Érdekes koncepció, majd meglátjuk, mi valósul meg belőle.

Virtuális valóság genom böngésző

Egy cég virtuális valóság böngészőt készít. Csináltak egy kis bemutatót, amit ebédszünetben megnéztem. Először ezt a videót nézhettem meg:

Egy fejre helyezett Samsung mobiltelefon volt a forrás, amihez hasonlót a Unity Meetupon is kipróbáltam. Ez a videó szerintem elmegy egy ismeretterjesztő filmben, de egy kutatóintézetben elég unalmas. Feltették a fejemre a kütyüt, a szemem előtt pedig megjelent egy menü. A fejem forgatásával irányíthattam egy célkeresztet, de arra nem sikerült rájönnöm, hogyan tudok klikkelni. Azt mondták, a halántékomnál van egy gomb, de csak a hangerőt tudtam változtatni. Végül megnyomtam valamit, amitől elindítottam egy demót, amiben egy hűtőszekrény belsejében találtam magam. Másodjára valami autóban ültem. Ezután a szervezők nem engedték, hogy bármit is megnyomjak... Egy másik kutató véletlenül valami horror bemutatót indított el. Mikor levette a szemüveget, csak annyit mondott: Ez félelmetes volt. Vártam a géneket, de egy szörny jelent meg.

A megjelenítésről az Unreal Engine gondoskodik. Az én demoscene-hez szokott szemem elég puritánnak találta a bemutató minőségét. Bioinformatikus felemet sem győzte meg, hogy cseréljem le az IGV-t.

A második bemutató valódi virtuális valóság volt. Egy hatalmas sisakot viseltem, két kezemben joystic-szerű vezérlő volt és lépkedtem a géneket reprezentáló gömbök között. A grafika ismét elég gagyi volt, ráadásul folyton beleakadtam a kábelekbe, amelyek összekötötték a szemüveget a számítógéppel.

Utána elindítottak valami játékot, ahol két vezérlővel robotot kellett szerelni. Az egész olyan volt, mint egy számítógépes játék első pályája, ahol begyakoroltatják a játékosokkal az alapvető műveleteket. Öt percig bénáztam valami ajtó kinyitásával, aztán átadtam másoknak a terepet.

A bemutatónak mégsem ez volt a legnagyobb hibája, hanem az, hogy a fejlesztőknek érezhetően fogalmuk sem volt, mire is akarják használni a technológiát. Azt akarták, mi mondjuk meg, mire használható mindez, miközben folyamatosan hangoztatta, hogy ne a szokványos 2D-ben gondolkodjunk.

Nekik is elmondtam, hogy a munkám legnagyobb része nem az, hogy nézegetem a genomot. Rengeteg mintát kell feldolgozni, nincs idő mindegyiket megnézni. A másik probléma az összes eddigi genom böngészővel, a különböző mérettartományok egyidejű ábrázolása. Egy SNP nagyon kicsi, de a genom óriási. Ha a nagy léptéken kitesznek egy pontot, az több millió nukleotidot is jelenthet. Ha belenagyítunk, nem látjuk például a szomszéd géneket.

Ezt úgy tudnám elképzelni, ha nem egy kész alkalmazás lenne, hanem egy platform, ahova betölthetnék bármilyen táblázatos adatot és én mondanám meg, hogy melyik tengely milyen adatot mutasson. Egyfajta vizualizációs platform, mint a Processing, csak 3D-ben.

Végül egy gyakorlati buktató: Itt a Sangerben elég nagyok az irodák, de ha három bioinformatikus sisakkal a fején elkezd rohangálni, hogy megnézzék a legújabb illesztést, annak elég csúnya vége lenne.

Szólj hozzá!

FGSB 2015

2015.11.23. 00:00 Travis.CG

Itt a Sangerben minden hétre jut egy konferencia, de a legjobb az egészben, hogy amennyiben a létszám nem teljes, az itt dolgozókból töltik fel a résztvevőket. Kaját, tollat és szép szatyrot nem kapunk, cserébe látogathatjuk az előadásokat, beszélhetünk az emberekkel és megnézhetjük a pósztereket. Így vettem részt idén a Functional Genomics and Systems Biology: From model organisms to human health című konferencián.

Mivel munka mellett látogattam az előadásokat, sajnos szelektálni kellett, de azért elég érdekes dolgokat hallottam, amit most meg is osztok.

Tim Hughes: DNA and RNA binding motifs for decoding gene regulation
A DNS-en a kötőhelyek azonosítására még mindig a motívumokat használnak. A CIS-BP adatbázisban is rengeteget lehet fellelni, viszont az emberi transzkripciós faktor kötőhelyek feléhez nincs egyértelmű motívum rendelve. Ezek legtöbbje C2H2 cink-ujj protein. Ezek a moduláris felépítésű fehérjék kevésbé konzerváltak és a Chip-seq adatokból is hiányoznak, mert RNS-t is köthetnek. Az eddigi adatokból úgy tűnik közvetlenül kötik a DNS-t. Legtöbbjük a transzkripciót szabályozza, de akadnak aktiválók és represszálók, sőt olyan is, amelyik mindkettőt tudja.

Biola-Maria Javierre: Long-range control of gene expression
Vannak promóter elemek, melyek messzebb helyezkednek el a transzkripciós start helytől, de lényeges szerepet töltenek be a szabályozásban. Példaként a sonic hedgehog fehérjét mutatták be. Ezek az interakciók sejt specifikusak is lehetnek, ami miatt a GWAS-al nehéz kimutatni őket. Az előadó szerint a 3C/4C és Chia-PET módszerek nem elég jók, túl kicsi a jel/zaj arányuk. Ezért fejlesztették ki a promoter capture eljárást. Itt szintén egy kereszt kötést hoznak létre a térben közeli pozíciók között, ugyancsak emésztenek és adaptorokat ligálnak. Ami más, hogy hibridizálják a HindIII-al emésztett promótert is. A HICUP és CHICAGO peak kereső programokat használták. Nagyon nagy különbségek jöttek ki szövetenként, de találtak sejttípus független kötőhelyeket is. eQTL-el találtak kapcsolatokat olyan SNP-el, amelyek messze vannak, mégis beleszólnak a génszabályozásba. Ismert SNP-khez új target géneket is találtak. Végezetül sikerült nekik anyagcsere útvonalakhoz rendelni SNP-ket.

Ines Fonfara: Biology of CRISPR-Cas9: a game changer in genome engineering
Ez a bevezető jellegű előadás bemutatta a címben említett rendszert. Egy mondatban: a Cas9 fehérje egy RNS segítségével programozható, hogy a DNS-t egy specifikus helyen vágja. Felépítése: egy Cas operon, illetve egy CRISPR tömb, ami különböző domainekből épül fel, amelyeket határoló szekvenciák választanak el. In vivo a baktériumokban a vírusok elleni védelmet látja el, mert a domainek határozzák meg, hogy milyen vírus RNS-t inaktiváljon a rendszer. Öt nagy típusa van, de a gyakorlatban a II-es típust használják, mert a targetet az RNAz III vágja, ami a CRISPR rendszertől független elem. Olcsó és hatékony módszer, de vannak nem specifikus vágások és toxikus is. Ez utóbbi nem tudom, mit jelent.

Andreas Gschwind: Genetic perturbation of human chromatin activity and its impact on transcription
A genotípus és a fenotípus kapcsolata még mindig nem tiszta. Ennek kiderítésére csináltak RNA-seq-t, és ötféle Chip-seq-t különböző hiszton fehérjékre. Főkomponens analízissel meghatározták, hogy mely genetika variációk befolyásolják a gén expressziót, majd egy Bayes-hálóval igyekeztek meghatározni, hogy a variációk közvetlenül hatnak a génexpresszióra, vagy a kromatin módosításán keresztül. A vizsgált esetek 78%-ban a génexpresszió a kromatin módosításán keresztül érvényesült, míg 18%-ban a genetikai variáció közvetlenül hatott a génexpresszióra. A fennmaradó esetben az expresszió és a kromatin egyszerre változott meg. Az előadás többi részében a PU1 kötőhely példáján mutattak be konkrét eseteket.

Judith Zaugg: Local and distal genetic variants regulate chromatin states and expression in humans
A kódoló régiókban előforduló SNP-k mellett a nem-kódoló régiók szerepe is fontos. Az itt található variációk a gén regulációra is hathatnak. A promóter régióban fellelhető variációk mellett a távoli, enhancerekben előforduló SNP-k felderítése még nagyobb kihívás. Az előadásban bemutatták, hogy 75 emberből származó Chip-seq adatból próbáltak keresni ilyen variációkat. A hiszton modifikációval összefüggésbe hozható SNP-ket azután további analízisnek vetették alá. Érdemes megjegyezni, hogy ezek az SNP-k legtöbbször nem is a Chip-seq csúcsokban helyezkedtek el. Fejlesztettek egy Bioconductor csomagot is. Az eredményeket HiC módszerekkel ellenőrizték és az SNP annotációval a fenotípusra is próbáltak következtetni. Az előadás végére spekulatívabb gondolatok jutottak: a génexpresszió változásához egy vagy több SNP-re van-e szükség? Nincs egyértelmű bizonyíték, de az előadó szerint a több felé mozdul a mérleg nyelve.

Roderic Guido: The human transcriptome across tissues and individuals
A GTEx adatbázis a normál expressziós mintát igyekszik bemutatni több, különböző szövetben. A szövetek egy biobankban elérhetőek, a mintákat a halál beállta után egy órával vették. Az életkor 21 és 70 év között van, 176 egyénből 1641 RNA-seq mintát tartalmaz. Összehasonlításként volt microarray is élő szövetből. A két adat között volt eltérés, de a főkomponens analízis után jelentős eltérést nem tapasztaltak. Általánosságban elmondható, hogy nagyjából 100 gén dominál a transzkriptómban. Sok gén mitokondriális eredetű, és nagyon kevés gén mutat kizárólagos szövet specificitást. A szövetek között nagyobb eltérést tapasztaltak, mint az egyének között. Az egyének között a legnagyobb különbséget az Y kromoszóma génjei és az immun gének mutatják. Az etnikumok között a legnagyobb különbséget a lncRNS-ek mutatják. Találtak a korral korreláló géneket is. A férfiak és nők között szöveti szinten 10-20 gén különbség mutatható ki, kivéve a mellszövetben, ahol 700 gén esetén tudtak differenciál expressziót kimutatni.

Lasse Sinkkonen: Cell type-selective disease-association of genes under high regulatory load
A hálózat alapú megközelítésnél a betegséget okozó gének általában magas fokszámmal rendelkeznek, mert a kutatók ezeket szeretik vizsgálni. Sok gén, ami potenciálisan betegséget alakíthat ki, így nem kerül a vizsgálatok középpontjába. Ilyenek lehetnek a transzkripciós faktorok és enhancerek. Az előadó csoportja ezért vette a publikus Chip-seq adatokat és hipergeometrikus tesztekkel igyekeztek új betegséget okozó géneket keresni. Azt vették észre, hogy a sok transzkripciós faktorral szabályozott gének inkább okoznak betegséget. A módszert ezért megfordították és a túlszabályozott géneket kikiáltották betegség okozó géneknek, majd igyekeztek ezt a hipotézist alátámasztani.

Tom Freeman: Development of a graphical and computational platform for the analysis of complex biological pathways and systems
A biológiai útvonalakról rengeteg adat érhető, de ezek nem kompatibilisek egymással. Ezt az előadó úgy fogalmazta meg, hogy a „biológusokat nem tanították meg a logikus gondolkodásra”. Ezért terveztek egy olyan rendszert, ami szabványos leíró nyelvet használ az útvonalak leírására (Edinburgh Pathway Notation), ami természetesen módosítottak a saját igényeiknek megfelelően, amitől így inkompatiblis lett minden eddigi formátummal. (És még a biológusok nem logikusak) Ezután PhD hallgatókkal elkezdték konvertálni a sok útvonalat a saját rendszerükbe.

Marcelo Coba: The signalling network landscape of psychiatric disease
A skizofrénia poligénes betegség, a posztszinaptikus kapcsolatokban fellépő hibák vezetnek a kialakulásához. A posztszinaptikus kapcsolatokért 1500 protein felelős. Ezek kölcsönhatása szövet és időfüggő. A fehérje domainek enrichment analízise során két nagyobb csoportot tudtak elkülöníteni: intra- és intermoduláris domaineket. Még ezen eredmények sem elégségesek, hogy teljesen megértsük a posztszinaptikus kapcsolatokat, de legalább van 100 újabb target génünk.

Stefan Wiemann: MicroRNA induced apoptosis resistance and escape from NK cell immunosurveillance in aggressive breast cancer
A mellráknak több altípusa is van, és ezek túlélési esélye eltérő. A vizsgálatok során csak a Mir519-re fordították a figyelmüket, mert magasan expresszál és tumor szupresszor gének kifejeződését gátolja. Jelenlétében a sejt ellenáll bizonyos kezeléseknek, valamint az NK sejtek sem képesek elpusztítani. Ez a mikroRNS többek között a Casp és a Trail géneket gátolja, amelyek egy olyan jelátviteli úton helyezkednek el, ami az NK-sejtek felismerését gátolja.

Alvis Brazma: The structure of human transcriptome
Az előadó arra kereste a választ, a transzkriptóm eredmények mennyire konzisztens a proteómmal. Az expressziós atlasz egy könnyen kereshető weboldal, ahol a normál szövetekben lehet keresni különböző gének expresszióját. Az adatokat standard módszerekkel dolgozták fel, majd nézték, hogy a proteóm és transzkriptóm adatok mennyire fednek át. A korreláció mértéke 0.47 és 0.62 között mozgott. Ha egy transzkript RPKM értéke ötnél nagyobb volt, akkor már nagyon jól egybevágtak az eredmények. Azt is nézték, a gének különböző transzkriptjei milyen expressziós változásokat mutatnak. Azt vették érszre, hogy a legtöbb génnek egy domináns transzkriptje van, ami igen erősen expresszál, a többié pedig logaritmikusan csökken. Feltételezik ebből, hogy van egy kapcsoló effektus, ami meghatározza, mi legyen a domináns transzkript.

James Sharpe: How gene regulatory networks control cells to build organs
A drosophila szárnyfejlődésénél nézték a szárny méretét és a szárnylemez területét, majd SNP-ket kerestek és az eredményeket keresztezésekkel erősítették meg. Az SNP-k klaszterezése után azt kapták, hogy az eredmények nagyon kicsi szórást adtak, vagyis a környezeti hatást sikerült minimalizálniuk. Meghatározták a szárnyméretet befolyásoló fehérjéket, vizsgálták a GO és protein-protein interakciókat. A korábbi előadással ellentétben ők azt találták, hogy az SNP-k egyértelműen meghatározzák az RNS expressziót, ami pedig a fehérje szintet befolyásolja és ezen keresztül meghatározza a fenotípust. Az előadás második részében a Down-szindrómáról beszélt, ahol az extra kromoszóma szakaszról expresszálódó transzkripteket vizsgálták. Az innen származó mRNS-ek mitokondriális és riboszómális proteinek szintjét változtatják meg.

Anne-Claude Gavin: Expending the interaction space: protein-lipid networks
Sok lipid vesz részt szignál folyamatokban, ezért a hálózatokat célszerű kiterjeszteni rájuk is. Különböző kromatográfián alapuló módszerek segítségével igyekeznek meghatározni a fehérjékhez kötődő lipideket, majd osztályozzák őket aszerint, hogy milyen fehérjékhez kötődnek.

Anastasia Baryshnikova: Global functional annotation and visualization of the 2015 yeast genetic interaction network
Az élesztő funkcionális annotálása nagy erőkkel folyik. Az összes lehetséges génpárból dupla mutánsokat állítanak elő, majd nézi a túlélési esélyeket. 2010-ben az összes lehetséges kombináció 30%-a volt meg, idén az esszenciális gének 82%-t, a nem esszenciális gének 55%-t előállították. A hálózatokat alhálózatokra bontották, majd topológiai hasonlóságokat kerestek. GO segítségével funkcionális feldúsúlásokat kerestek. A GO hierarchikus felépítéséből adódó problémát úgy oldották meg, hogy a GO meghatározásokból kivették a kötőszavakat, majd az első 5 leggyakoribb szóval helyettesítették azt. A furcsa módszerről csak annyit mondott az előadó, hogy működik.

Sarah Teichmann: Understanding cellular heterogeneity
Az egysejtes vizsgálatokból származó RNA-seq a sejtpopuláció heterogenitásáról ad információt. Az eljárás szenzitivitásáról és specificitásáról ez a cikk ad részletesebb felvilágosítás. A cikk szerint a kvantifikációról kevés adatot ad, de igen/nem jelzésre jó a módszer. Az egysejtes módszereknek számtalan típusa létezik, ezek pontossága eltér. A T-sejtek receptor variációinak felderítésénél például a Salmonellával fertőzték a sejteket és nézték a klónok fejlődését, illetve mely gének aktiválódnak a fejlődés során. Előadás végén elhangzott, hogy a Genome Biology-nak lesz egy egysejtes különszáma és jövőre rendeznek egy konferenciát is a témában.

Marc Friedlander: miRNA functions in single cells
A Caenorhabditis és az ember protein kódoló génjeinek száma majdnem megegyezik, de a nem-kódoló RNS-ek száma sokkal több az emberben. Az RNS-szekvenálás során t/rRNS-eket is kapunk vissza és a miRDeep segítségével azok is feldolgozhatóak. A readek eloszlása más miRNS-ek esetén, mint t/rRNS-eknél. Ez a fajta módszer közelebb áll az RNS-ek biológiai jellemzőihez, ezért az előadó szerint jobban működik, mint a gépi tanuláson alapú algoritmusok. Az eredmények ennek ellenére is elég zajosak voltak, amiért a miRNS-ek lehetnek a felelősek. A legtöbb miRNS kiütése nem okozott fenotípusos változást, de az expressziós „zajt” csökkentette. Az előadó feltételezte, hogy a miRNS-eknek ezért egyfajta puffer hatásuk van.

Markus Ralser: A functional metabolic map reveals metabolic gene regulation and novel gene function on the genomic scale
A KEGG adatbázisban található anyagcsere utak túl vannak egyszerűsítve. Dupla mutánsok és differenciál expressziós vizsgálatok után találtak összefüggéseket az expressziós profil és a metabolikus útvonal között. Ellenőrzésnek az aminosav profilt is vizsgálták, hogy visszaadja-e a differenciál expressziós eredményeket. Módszerükkel a riboszómális struktúrát is fel tudták építeni. Az ismeretlen gének 83%-hoz így tudnak annotációt rendelni.

Szólj hozzá!

Címkék: bioinformatika

Internet

2015.11.20. 00:11 Travis.CG

- Hallo, Szuper Gyors Internet?
- Igen, a nevem Segítő Orsi, miben segíthetek?
- Szeretném megrendelni Önöktől a GigaSebes Net 2.0-t.
- Értem, köszönöm, hogy megtisztelt minket bizalmával. Megkérdezhetem, miért cégünket választotta?
- Meggyőzött a reklámjuk, amiben azt a comb-vastag kábelt mutogatták, szemben a konkurencia két szál drótjával.
- Igen, a „varázslat a kábelünkben van”. A marketingeseink hónapokig gondolkodtak rajta. Szeretne televíziót is az internet mellé?
- Köszönöm, nem. Csak internetet szeretnék.
- Had hívjam fel a figyelmét, hogy csomag ajánlataink sokkal olcsóbbak. Ha megrendeli a GigaSebes Net 2.0-t az UncsiCsatorna csomaggal, akkor a ingyen megkapja a telefont, amivel hálózaton belül ingyen hívhat mindenkit.
- Van mobiltelefonom, miért kellene nekem hagyományos telefon, amit csak otthon használhatok?
- A vezetékes telefon rengeteg előnnyel jár...
- Mégis mivel? A vezetékes telefonok legtöbbjében még rendes címregiszetere sincs. Tehát ha kapok Önöktől egy telefont, továbbra is kell a mobilom, amiben tárolom a telefonszámokat.
- Minden kedves telefon előfizetőnk füzetet kap, ajándék tollal.
- Füzetet? Mégis minek? Mégis hol tároljam?
- A szikratávíró tökéletes hely.
- De nekem nincs szikratávíróm!
- Aki az internet és TV mellé telefont is kér, automatikusan megkapja a szikratávírót a füzet tartó polccal, amin elfér az ajándék toll és füzet. Díjnyertes formaterv.
- Soha nem tanultam Morse-kódot, nem tudom használni a távírót. Lehet, hogy maguknál nem tűnt fel, de már senki nem használja ezeket.
- A kimutatás szerint a mi ügyfeleink igen nagy száma rendelkezik szikratávíróval.
- Persze, mert maguk adják, ha kell, ha nem. Mégis mit akar még rámtukmálni, galambokat?
- Olvasta az apróbetűs részt is a prospektusunkban? Fehéret vagy szürke színt parancsol?
- Egyiket sem! Nem akarom, hogy galambok piszkítsák be a lakásomat, nem akarok szikratávírót, nem akarok tárcsás telefont! Nem akarok UncsiCsatornákat! Internetet akarok. Én a jelenben élek, nem a múltban. De tudja, mit? Már internetet sem akarok. Adjon tüzet és füstjelekkel fogok kommunikálni.
- Sajnálom, a füstöt levettük termékpalettánkról. Túl sok baleset történt a nem rendeltetésszerű használatból kifolyólag.

2 komment

Címkék: irodalom

Vizelet dinamika

2015.11.09. 00:22 Travis.CG

A kutatóknak sem kell a hülyeségért a szomszédba menniük. A Sangerben minden pénteken megy egy köremail cikkekről, ami érdekelheti az itt dolgozókat. Külön ki szokták emelni, ha az eredmények itt születtek és egyszerű tematikába rendezik azokat.

Van egy "egyéb" szekció, ahol nemrég ezen akadt meg a szemem. Először azt hittem, valami vicc az egész és Ig Nobel-díja hajaznak a szerzők, de ahogy olvastam a cikket, tényleg belemerültek a témába. Persze csak képletesen.

Röviden arról van szó, hogy kutatók egy csoportja munkaidőben vizelő állatokat nézett a YouTube-on. Azután vizelő állatokat filmeztek méreg drága kamerával, végül matematikai modelleket állítottak fel.

Konklúziójukban kiemelték, hogy a húgycső alakja befolyásolhat egyéb biológiai aktivitást is, például az ejakulációt, úgyhogy méltán reménykedhetünk, hogy további érdekfeszítő tanulmányok jelenhetnek meg a szerzőktől.

Szólj hozzá!

Címkék: filozofálás

Ez már nekem sok

2015.11.05. 00:14 Travis.CG

Egyes biológusoknak nehezen megy a statisztika, mint tudományos módszer elfogadása. Már volt pár hiábavaló harcom ezen a fronton, pedig ha jól belegondolok, nem is értek hozzá. Amit tudok, az néhány recept, és tudom, mikor kell használni őket.

Azt, hogy miért akkor kell használni, elhiszem a hozzáértőknek. Másoknak viszont ez nem megy, és én nem értettem soha, miért hadakoznak kézzel-lábbal ellene.

Óhatatlanul eszembe jut a nagy Pauling esete a kvázi-kristályokkal. Megnézett minden kísérletet, külön neki bemutatták az eredményeket. Elismerte, hogy egyikben sincs hiba, de a következtetést, hogy léteznek kvázi-kristályok, továbbra is tagadta.

Tegnap viszont megértettem, mit is érezhetnek ezek az emberek. Egy előadást hallgattam a meta-analízisről. A meta-analízis lényege a bioinformatikában, hogy a nyers adatok ismerete nélkül, csupán a végső statisztikai eredményeket felhasználva további összefüggéseket derítsenek fel.

Ez érdekesen hangzik. Elsőre nem értettem, hogy miért nem lehet visszanyúlni a nyers adatokhoz, de megtudtam, ha páciensek adatairól van szó, személyiségi jogokra hivatkozva vagy nem közlik a nyers adatokat, vagy megváltoztatják az azonosítókat, hogy ne lehessen konkrét személyekhez kötni az eredményeket.

Ezután az előadás rátért a konkrét módszertanra. A GWAS eredményekből egyedül a p-értéket tartják meg és azok segítségével számolnak korrelációt. Először azt hittem, a nyelvtudásommal lehet valami gond. De nem, a diákon is ugyan ezt láttam. Innentől csak egy dologra tudtam gondolni: ez hülyeség. Ez nem lehet igaz.

A fonalat akkor vesztettem el teljesen, mikor a normál eloszlású számok helyett csak azok előjelével kezdett dolgozni. Körbenéztem, de egyetlen hitetlenkedő arcot sem láttam. Az ember csak magyarázott, magyarázott, nekem meg csak ellenérvek jutottak az eszembe

Az előadás végén senki nem kérdezett, még Richard Durbin sem. Még nem hallottam itt előadást kérdés nélkül. Később rákerestem a hivatkozott cikkre. Elolvastam, de továbbra sem értem. Nem tudom elfogadni. De legalább értem, mi játszódhat le a statisztika gyűlölők fejében.

6 komment

Címkék: filozofálás bioinformatika

Nyílt levél minden leendő bioinformatikusnak

2015.10.18. 00:47 Travis.CG

Kedves barátom. Most, hogy belekósoltált a bioinformatikába, bizonyára elérkezettnek látod az időt, hogy alkoss valami nagyszerűt és rászabadítsad a világra. Tetszik az ifjonti lelkesedésed! De mielőtt megnyitnád a vim-et (hiszen mi mást is használnál), nem árt kicsit körülnézni.

Először is, tényleg szüksége van a világnak rá? Tudom, tudom, hogy amit te fogsz csinálni, az lesz a csúcs, de mi támasztja mindezt alá? Példának okáért megnézted, mennyi hasonló termék van már a neten? Ugye, ugye!?

Hogyan? De a tiéd tartalmazni fogja X funkciót? Azért az egy új funkcióért érdemes egy teljesen újat létrehozni? Nem lenne elég egy foltot küldeni valamelyik már létező megoldásnak?

Látom, még dacolsz. Helyes, van benned kitartás. Szükséged is lesz rá! Nézd csak meg példának okáért a sikeres alkalmazásokat, azon belül is a genom böngészőket. (Ugye nem azt akartál készíteni?) Az IGV például ronda, de nagyon egyszerűen kezelhető. Minél jobban megismered, annál inkább látni fogod, hogy minden megvan benne, ami kell. Hogyan érték el mindezt? Folyamatos fejlesztéssel. Ha kíváncsi vagy, töltsd le az első verziók egyikét. Mintha egy másik program lenne, igaz? A Release Notice-ban megnézheted a dátumokat is. De említhetném a Blastot is. A legújabb funkcionalitásban messze túlszárnyalja az eredetit.

Ezeket több ember csinálta, te viszont egyedül vagy? A Mira-t is egyetlen ember fejleszti. Figyeli és teszteli az új szekvenátorokat, hogy beépítse a támogatást a következő verzióba. Követi a konkurenciát és vezeti a levelező listát. Meghallgatja az embereket és segít nekik, hogy használni tudják a programját. De ami majdnem ilyen fontos: nem akar több lenni, mint ami. Nem akar humán genomokat összerakni, nem akar metagenomikában kitűnni. Ha mégis valaki erősködik, másik programot ajánl neki.

Ezen a ponton érdemes elgondolkodni, elég tiszták-e a céljaid? Nem vágod-e túl nagy fába a fejszéd? Ott van például a Galaxy. Minden akar lenni egyszerre. Ha illeszteni akarod a szekvenciákat, harminc program ugrik az arcodba (a különböző verziószámokról nem is beszélve), egy futtatás után az átmeneti fájlok elborítják az előzményeket. Egy teljes feladatsor esetén pedig reménytelen megtalálni, hogy mi a ki- és mi a bemenet.

De sokkal kisebb feladatok is okozhatnak nehézséget. Elég csak az iRAP-ot megnézni, ami nemes egyszerűséggel RNA-seq mindenes, "egyszerű" felülettel. Elmondom neked, hogy a telepítés során egy kisebb bioinformatikai ökoszisztémát kell felraknod, az adataidat egy szabványosított könyvtár struktúrába kell helyezned. Ha nem így teszel, több órás futás után kapsz csak hibaüzenetet. Ha viszont idősoros adatod van, az alkalmazás nem tud mit kezdeni vele.

Még mindig meg akarod valósítani a terved? Szemernyi kétséged sincs? Akkor nincs más hátra, vágj bele!

Mi az, hogy nem vim-et használsz?

Szólj hozzá!

Címkék: bioinformatika

Feltámad a gonosz

2015.10.14. 14:48 Travis.CG

Mindenkinek megvan az ősellensége. Sherlocknak Moriarty, Bondnak Blofeld, nekem az Excel. A legnagyobb baj ezekkel, hogy feltámadnak. Bond is azt hitte, nyugodtan nászutazhat, aztán bumm! Blofeld keresztül húzta a számításait.

Én is azt hittem, hogy itt a Sangerben megszabadulok a rácsos programtól, hiszen itt mindenki Linuxot vagy Mac-et használ és van IT meg minden. Lebecsültem a kis rohadékot.

Egy csoport megbeszélés után történt. Az egyik PhD hallgató megkérdezte, hogy tudnék-e írni neki egy feldolgozó programot. Én naívan azt feleltem, hogy igen. El is kezdte magyarázni, hogy az egyik mikroszkópot vezérlő program, ami Windows alatt fut és Excelt okád ki, nem képes két különböző beállítás mellett ugyan olyan sorrendben kiadni az eredményeket. Össze kellene fésülni őket. Nem vettem észre a csapdát, azt feleltem, mentse ki CSV-be az adatokat, pár perc múlva küldöm az eredményt.

Kiderült, nagyon sok adaton kellene lefuttatni ezt a programot, sőt a jövőben is kell majd használni eleget. Még mindig nem gyanítottam semmit. Azon gondolkodtam, végül is van Visual Studio a gépemen, talán nem olyan nagy ügy összerakni egy CSV beolvasó progit. Ekkor robbant a bomba.

A további elemzés is Excelben történik. Milyen jó is lenne, ha nem kellene elhagyni a megnyugtató rácsos felületet. Bumm! A csapda bezárult. A lehetőség: Azt mondom, nem, nem tudom, hogyan kell Excel makrót írni (ami hazugság lenne). Többet nem nyaggatnak vele. Valószínűleg semmivel sem nyaggatnak ezután. Elkönyvelik, hogy rám nem lehet számítani. B lehetőség: Megcsinálom, bebizonyítom, hogy profi vagyok.

Ami azt illeti írtam már Excel makrót. Az egyetem alatt volt egy biometriának nevezett tantárgy, ami gyakorlatilag Excel oktatást jelentett. Baromi unalmas volt. A csoport háromnegyed részének hatalmas problémát jelentett a különböző varázslókra klikkelés, ezért lassan haladtunk. Mivel akkoriban nem volt minden gép internetre kötve, semmivel nem tudtam elütni az időt órán, elkezdtem ostoba makrókat gyártani. Az egyik ilyen alkalommal egy gombot helyeztem el, amire ha ráklikkeltek, begördült a képernyőre egy autó. (Mondhatnánk, hogy demót csináltam, de akkoriban azt sem tudtam, mi az)

A tanár össze-vissza rohangált a hallgatók között és próbálta rávenni őket, hogy a Next-re klikkeljenek, ne a Cancelre. Én épp teszteltem a kódot. A tanár egyszer csak megáll mögöttem. Az autó beúszik a képernyőre.

- Az Excel ilyet is tud?

Ez után azt csinálhattam órán, amit akartam.

Szólj hozzá!

Címkék: életmód

iRAP: RNA-seq feldolgozás EBI módra

2015.10.12. 00:05 Travis.CG

Az iRAP-al úgy kerültem kapcsolatba, hogy az itteni csoport is fejleszt egy RNA-seq feldolgozó alkalmazást és az egyik megbeszélésen kiderült, az „túloldal” is csinál valami hasonlót. Engem ért a megtisztelő feladat, hogy kipróbáljam.

Telepítés

A megszámlálhatatlan függőség telepítésére az egyik megoldás az oly népszerű virtuális gép. Aki türelmetlen, nyugodtan használja. Aki szereti a kihívást, próbálja ki a manuális installálást. A normális C programokkal nincs is gond, de a számtalan, olykor egymással is inkompatibilis Perl modulokkal annál inkább. Biztos vagyok benne, hogy a legtöbbre nincs is szükség, csak ha már telepít az ember, akkor nem árt frissíteni a CPAN-t és az összes unit teszt modult, különben nem mennek fel a csomagok. Nekem a Bio::DB::Sam csomaggal voltak gigászi küzdelmeim, mert ennek a telepített samtools túl új volt, az automatikus telepítő pedig ezzel nem tud mit kezdeni. Megoldás: kézzel felrakni a modulokat, majd szintén kézzel futtatni a scripts/irap_install.sh -s . -x data és scripts/irap_install.sh -s . –v

Ezzel fel is áll a rendszer.

Használat

A dokumentációban minden le van írva. Kivéve, hogy az annotációs GTF-nak a következő dolgokat kell tartalmaznia: gene_id, transcript_id, exon_number, gene_name. Teljesen véletlenül az UCSC-ről pont ezt tölthetjük le, de ha az NCBI-ról szerezzük be a fájlokat, akkor nem lesz szerencsénk. A könyvtár struktúra sem lehet tetszőleges. Egy E. coli genom BWA-val indexelve mindenkép kell (contamináció detektálás). Ha hiányzik, nincs eredmény. A readeket a raw_data/fajnev könyvtárban kell elhelyezni. A referencia szekvenciát pedig a reference/fajnév könyvtárba. Már csak annyi a dolgunk, hogy eldöntsük, milyen eszközöket válasszunk a feldolgozáshoz.

Eredmény

A program nagyon-nagyon sokáig fut. Négy napig csak a referenciával bíbelődött (4 szálat használtam). Az annotációt ugyanis R szkriptekkel dolgozza fel, ami megmosolyogtat. Az egymással inkompatibilis programok ki- és bemenetét saját szkriptekkel konvertálja át, ami szintén rossz hatással van a sebességre. Létezik egy LSF ütemezőt használó része is, de nekem nem sikerült működésre bírni, könnyebb volt írni egy saját wrappert.

A rendszer előnye, hogy viszonylag hibatűrő. Ez alatt azt értem, hogy a hiba nélkül lefutott részeredményeket a program felhasználja és ott folytatja a munkát, ahol a működése megszakadt. Ebből adódóan, ha egy új analízist akarunk végezni és van átfedés az előző munkafolyamattal, akkor a program csak a szükséges lépéseket hajtja végre.

Programok összehasonlításához ezért ideális. Megnézhetjük például, hogy a STAR illesztő a cufflinks2-vel vagy a HT-seq-el ad-e jobb eredményt. A kimenet könyvtárak szerkezete is követi ezt a koncepciót. Az illesztő program nevével jelzett könyvtárban találjuk az illesztéseket és alkönyvtárakban fogjuk megtalálni a rá épülő lépések eredményeit. A fenti példánál maradva a star/cufflinks2 könyvtárban találjuk az expressziós értékeket.

Összegzés

A rendszer egyszerűbbé teszi a különböző programok használatát, mert képes megoldani a konverziót közöttük. Lassan fut, de a részeredmények perzisztensek. Ebből adódóan rettenetesen sok tárhelyet felemészt. Mint minden programnak, ami könnyebbé akarja tenni az emberek életét, ennek is a legnagyobb hibája, hogy nem képes kezelni az egyedi kísérleti elrendezéseket. Viszont a szokványos differenciál expressziós kísérleti felálláshoz tökéletes.

Szólj hozzá!

Címkék: bioinformatika

Az angliai ügyintézés

2015.10.05. 02:23 Travis.CG

Az úgyintézés kapcsán egy régi vicc jut eszembe. Ha ismertétek, bocsi: Parasztbácsit elviszi a fia egy vadászrepülővel. Gondolja a fiú, mutat pár trükköt az apjának. Csinálnak egy dugóhúzót. Bácsi csak ennyit mond:
- Hát öszt gondutam.
A pilóta meg akarja mutatni, hogy ő azért érti a mesterségét, utánégetővel éles jobb kanyart vesz. Bácsi még mindig csak ennyit mond:
- Ezt is gondutam.
A fiúnak elönti a méreg az agyát, fejtetőre állítja a gépet.
- Na, eztet nem gondutam.
Leszállás után megkérdezi a fiú az apját.
- Miért mondta, amiket mondott?
- Tudod fiam, először behúgyoztam. Ezt gondutam. Aztán betojtam. Ezt is gondutam. De, hogy mindez a nyakamba ömlik...

Most én a nem gondoltam fázisban vagyok. Még otthon elkezdtem olvasni a különböző fórumokat és beszélgettem emberekkel, akik már megjárták Angliát, hogy mire figyeljek. Azt tanácsolták, először bankszámlát nyissak, utána ügynökségen keresztül lakást keressek, aztán a többi.

Már egy héttel a munkakezdés előtt kijöttem, hogy legyen mindenre időm. Még otthon foglaltam egy szobát, hogy onnan induljak ügyintéző portyára. Igyekeztem a legolcsóbbat választani, ami sikerült is. Az ablakok nem voltak zárhatóak, a zuhanyzóban nem volt melegvíz (később rájöttem, hogy melyik másik zuhanyzóba kell menni), a reggelinél pedig megsúgta a szintén magyar származású alkalmazott, hogy a szalámiból inkább ne egyek. Tisztára, mint a Harcosok Klubbjában. De ez minimális kellemetlenség. Ez egy több napos kirándulásnál is előfordul.

Másnap be is mentem egy bankba, ahol nagyon örültek, hogy náluk akarok számlát nyitni, de kell nekik NI szám. Ok, ha az kell, akkor az kell. Nincs mese. Azt csak telefonon lehet elintézni, ami délután már teljesen foglalt. Ezért másnap reggel felhívtam őket. (Persze nem tudtam, hogy aktiválni kell a roamingot, annak kiderítése is időbe került). A telefonnál közölték velem, hogy kell cím, különben nincs NI szám. Rendben, akkor címet szerzek. Bementem egy ügynökséghez, ahol elkérték az összes adatomat. Adtak egy katalógust, ahonnan böngészhettem. Találtam egy igazán jó házat. Másnapra megbeszéltünk egy találkozót, hogy személyesen is megnézzem.

Másnap már egy órával a találkozó előtt ott voltam. Nézegettem a környéket, néztem, milyen messze vannak a boltok, buszmegálló, stb. Minden ideális volt. Több, mint fél órát vártam az ügynökre, amikor kezdtem sejteni, hogy itt valami átverés történt. Visszamentem hozzájuk és kérdeztem, miért nem volt senki a megbeszélésen. Természetesen azért, mert már kiadták. Elkérték az összes elérhetőségemet, de arra képtelenek voltak, hogy felhívjanak. Szerencsére még van 10 másik ügynökség.

A másodiknál én szúrtam el a találkozót. Ott is megbeszéltük, mikor találkozunk, de a gondos tervezés ellenére eltévedtem és nem találtam oda. Ingyen wi-fit sem találtam, ezért még a gugli térképre sem támaszkodhattam. Még így is van 9 ügynökség.

Az idő közben fogyott, már csak egy pénteki nap volt, jövő héten meg kezdődik a munka, akkor tuti nem lesz időm ilyesmire, Ezért elkezdtem módszeresen végigjárni az ügynökségeket. A következő kettőnél nem volt olyan, amit ki tudtam volna fizetni, vagy már elkeltek. A harmadiknál már szerencsével jártam. Több lakás is volt, ami tetszett, de csak egy tűnt olyannak, amit érdemes kivenni. Az ügynök viszont felhívta a figyelmemet, hogy a leírás nem tartalmazza a fűtést, annak még szeretne utána járni. Mondtam, rendben. Telefonált, majd közölte, hogy a lakásban nincs fűtés és a gyermekemmel inkább nem menjek oda. Fenébe.

Ez elég elkeserítő volt. Az ügynök viszont javasolt, amit korábban elvetettem, mint lehetőséget, mert nem Cambridge-ben volt, hanem Great Shelfordban. Ott volt a szállásom, tudtam, hogy ott nincs még egy rendes bolt sem. Az egész egy végeláthatatlan lakóövezet. Ezt el is mondtam, de az ügynök rögtön megmutatta a térképen, hogy de, van bank is, bolt is. A ház ráadásul szigetelt, jobban megfelel egy kisgyereknek. Végül beadtam a derekam. Szombaton meg is nézhetem.

Hangot adtam annak is, hogy félek, hogy elviszik előlem, de megnyugtattak, hogy ha több jelentkező is van, a tulaj dönti el, ki kapja. Ez elég fairnek hangzik. Nem bíztam semmit a véletlenre. Csináltam offline térkép profilt, memorizáltam, mint állat, megnéztem utcaképen. Már egy órával előbb ott voltam. Láttam az ügynököt is megérkezni. A ház tényleg jó volt, ezért le is stoppoltam. Adtak egy rakás papírt és mondták, hogy várni kell, amíg a tulaj elfogadja a jelentkezésemet. Hétfőn közölték is telefonon a jó hírt, a tulajnak megfelelek. De le kéne tenni a foglalót. Levonhatják-e telefonon keresztül? Egy feltöltő kártyás telefonom volt nálam 5000 Ft-al. Mondták, hogy akkor be kellene jönni, mert már mások is meg akarják nézni.

Fenébe. A Sangerből bejutni Cambridge-be nem egyszerű. Kint voltam a semmi közepén. Szerencsére egy munkatársam felajánlotta, hogy bevisz a vasút állomásig. A vonat kb. 10 perc alatt Cambridge-ben volt, de ehhez negyed órát kellett autózni, mert pont akkor volt torlódás az utakon. Szerencsére viszonylag keveset késtem és kifizethettem a foglalót is. Egyébként nem értem: ugyan annak a háznak a foglalója egy házaspár esetén kétszer annyi, mint ha csak egyetlen felnőtt veszi ki.

Ezután küldtek még egy csomó papírt, amit szerencsére elektronikusan alá lehetett írni. A kis tableten szépen aláírtam mindent, és a feleségem is otthon. Ekkor derült ki, hogy kell biztosítás is, mert a tulaj ragaszkodik hozzá. Természetesen semmi gond, mert az ügynökség kapásból tudott biztosító társaságot, akik már el is küldték a szerződést, amit szintén elektronikusan aláírhattam. Nem is tudom, mit csináltam volna tablet nélkül.

Eljutottam abba a fázisba, amikor kérték a referenciákat. Erre a lépésre fel voltam készülve. Volt nálam számtalan elektronikus számla, de kiderült a feleségemtől is kell valami. Neki persze semmi nem jön e-mailen, ráadásul elutazott otthonról. A papírok miatt visszautazott, de otthon nem volt net, mert még indulás előtt kikapcsoltattam (mondván, minek, ha úgysem vagyunk otthon). Nem tudta elküldeni a papírokat, közben az ügynökség nem érte el a Sanger HR-s ügyintézőjét, mert szabadságon volt, nekem meg ki kellett költözni a szállásról. Addig meg nincs beköltözés, míg mindent le nem ellenőrzött az ügynökség. Ez volt nekem az a pillanat, mikor fejtetőre állt a repülő.

Munka után visszamentem a szállásra és mondtam, hogy szeretnék még maradni. A recepciónál a tulaj volt. Leült a gép elé és elkezdte nézni a foglalásokat. Egyre aggodalmasabb képet vágott, nagyon ráncolta a homlokát én pedig arra gondoltam: rendben, essünk túl rajta. De nem, még mindig nagyon gondolkodott, mintha ettől hihetőbbé válna a produkciója. Végül elkezdte mondani, hogy már van foglalás arra a szobára és ha áthelyezi azt a vendéget, akkor kénytelen neki drágább szobát adni, de ő már kifizette a teljes összeget, nem kérheti, hogy fizessen még. Végül kibökte, amit már tudtam, hogy ki fog: fizessem ki én a különbözetet. Szóval megkaptam ugyan azt a szobát drágábban.

Az elkövetkező napokban vándoroltak a papírok oda-vissza és elsimultak a gondok. Miután sikerült beköltözni és a szerződést is aláírtuk, gondoltam nyithatok bankszámlát. Elmentem egy másik bankba. Ott is nagyon örültek, hogy náluk akarok számlát nyitni. Kérdezték, voltam-e már másik banknál. Mondtam, hogy voltam, de holtvágányra jutottunk az NI szám hiánya miatt. Elkezdtük a papírokat kitölteni, Bemutattam az útlevelem, mutattam a munkáltató papírját, a lakászszerződést (pdf-ben elküldtem az ügyintézőnek ott helyben). Közben meghallgattam a milyen-fasza-bank-vagyunk mondókát, amit már a netes vizsgálódásaim során olvastam is. A fickó el is ment, hogy kinyomtassa és lefénymásolja az útlevelemet. Tíz perc múlva vissza is jött. Elkezdte nézni a lakászszerződést megakadt a szeme a tulajdonoson, akinek a keresztneve Mohammed. Egy percre ledermedt, majd elkezdett hadoválni, hogy ő azt hitte ügynökségen keresztül megy a lakásbérlet, nem közvetlenül bérlem az ingatlant. Mert akkor kell még egy csomó más papír. Megpróbáltam megmagyarázni neki, hogy ügynökségen keresztül megy minden, nézze meg, ott a nő aláírása, aki Mohammed nevében eljár. Nem sikerül meggyőzni. Ismét felkapta az útlevelem, a frissen kinyomtatott lakászszerződést, meg amit még az asztalon talált, hogy ezeket most beszkenneli. Elrohant. Nekem meg az járt az eszemben, hogy ez most azt hiszi terroristákat pénzelek lakásbérlet címén. Végiggondoltam, a netes kalandozásaim során mi olyat csináltam, ami felkeltheti a GCHQ figyelmét. Megnéztem egy Crimson Jihad demót! Most biztos bekerülök a rendszerbe.

Negyed óra múlva visszatért. Egészen nyugodtnak tűnt és közölte, hogy náluk nem kell NI szám, de az NI visszaigazoló levél viszont igen vagy valami számla. Négy napja költöztem, milyen számlám lenne? De igaz is, miért nem kaptam visszaigazoló levelet? Másnap újra telefonáltam a JobCenter-be, elmondtam a panaszomat, mire közölték, hogy nem foglaltam időpontot. Én bűnöm, de határozottan emlékszem, hogy úgy indítottam a beszélgetést. Két nap múlva meg is érkezett a visszaigazoló levél. Azzal ismét bementem a bankba, majd ismét nyomtatás, ismét szkennelés, aláírás, szkennelés. Egy órát voltam bent, de az idő nagy részében csak ültem, az ügyintéző meg valahol kószált. Majd megjött a rohadt kártyával. El nem tudom mondani, mennyire örültem annak a nyavajás plasztik lapnak. Mert meg kell hagyni a magyar kártyával az esetek nagy részében tudtam fizetni (vonat automata például soha nem fogadta el), de mindig felhívták a figyelmem, hogy plusz két százalék díjat számolnak fel.

Már csak egy dolog hiányzott a teljes boldogsághoz, egy angol mobiltelefon. A bankban is mondták, hogy most még rendben van a számla, de amint lesz telefon, sürgősen jöjjek vissza. (Egy külön bejegyzés lehetne az ágy beszerzése is, de legyen elég annyi, hogy azért késtem le a házhoz szállítást, mert ők nem hívnak fel külföldi telefont. Ezt az adataim felvételénél nem jutott eszükbe közölni.) Szóval kell teló is.

A telefonról annyit, hogy az árak szinte pennyre pontosan megyegyeznek. Első látásra úgy tűnik van különbség, de amikor az összes költséget összeadjuk, ezek eltűnnek. Bementem egy plázába és négy üzletet végigjártam, adtam a hülye külföldit és szájbarágósan elmondattam velük mindent. Végül az alapján döntöttem, hogy kinél volt raktáron az adott modell.

Tehát aki nem akar szívni, az először telefont szerezzen, utána lakást, NI számot és bankszámlát.

Szólj hozzá!

Címkék: életmód

Első benyomások

2015.09.27. 14:29 Travis.CG

Kint vagyok. Majd írok az élet kezdési nehézségekről, de most először lássuk, hogyan is zajlik az élet a kampuszon.

Először is minden hatalmas. Az irodák akkorák, hogy kényelmesen elfér benne gép, ember. Maga a Sanger akkora, hogy külön szín kódolás van a padlón, hogy az ember tudja melyik fordulóban jár. Ugyanis három Z alakú folyosól áll, ezért amikor az épület egyik végéből átmegyek a másikba, mást sem csinálok, mint balra, majd jobbra fordulok. Balra, jobbra, hosszú egyenes. Balra, jobbra hosszú egyenes. A kampuszon már sikerült eltévednem.

A feldolgozni való adat is rettenetesen sok. Százas mennyiségben szekvenálják a humán genomokat. Ha valakinek csak pár mintája van, azzal nem is foglalkozik bioinformatikus. Bár pár mintája senkinek sincs. Saját szekvenáló apparátus van, saját fejlesztésű feldolgozó programokkal. Valahogy senki nem akar tudomást venni a BaseSpace-ről. Több bioinformatikai csoport is van, engem a rákkutatók közé helyeztek, amíg megértem a rendszer működését. A csoport egyrészt támogató segítséget nyújt a kutatóknak, másrészt fejleszti a feldolgozó programokat. A támogató segítség úgy néz ki, hogy van egy helpdesk-es. Ez minden héten a csoport egy másik tagja, hogy a saját kutatástól ne vegye el az időt. Milyen jellegű segítséget nyújtanak? Hogyan kell futtatni a szkripteket, milyen paraméterei vannak az illesztő programoknak, miért nem fut a kutató saját fejlesztésű szkriptje. Semmi Blast futtatás, semmi Excel generálás. A legtöbb kutató képes használni a Unixot, maga futtatja a programokat, sőt elég sokan szkripteket is írnak. Ha mégis megakadnak, ott a bioinfo helpdesk. Ha frissen érkezett jövevény nem boldogul a Linuxal, akkor az IT részleg rendszeresen tart kurzusokat, ahol megtanítják az alapokra.

A számítógépekkel sem kell bíbelődni. Van egy teljes IT gárda, akik telepítenek, rendben tartják a farmot, végzik a webfejlesztést. A kéréseket ticket rendszeren keresztül kapják. Úgy kell elképzelni, mint a sorszám húzást a Postán, csak az egész elektronikusan megy. Én beküldöm a problémámat, majd a számtalan rendszergazdi közül egy magához rendeli, megoldja és visszajelez nekem. Mindennek van nyoma. Így jól látszik, amikor három napig senki nem foglalkozik vele :-) Azért az ügyintézés elég lassú, de legalább nem kaotikus. Vagy ha kaotikus is, abból felhasználóként nem látok semmit. Erre is jó a ticket rendszer.

Rengeteg megbeszélés, szeminárium, kajával egybekötött beszélgetés, munkaebéd, stb van. Mindig lehet tudni, ki mivel foglalkozik, mégha olyan messzi csoportokról is van szó, akik nincsenek egy épületben. Nekem már kicsit sok is ennyi megbeszélés.

Van a csoportnak saját Confluence rendszere, de más csoportok üzemeltetnek Wiki oldalakat is, Természetesen már vannak közöttük elavultak, de az információ tekintélyes része megvan. Hogyan kell használni az egyes tecnológiákat, kitől kérjünk segítséget, milyen programokat használjunk.

Természetesen van intranet is és számtalan levelező lista. Nem bombáznak mindenkit paradicsomlé vásárlással, mint egyes hazai kutatóintézetekben. Elég komolyan veszik a spammelést, mert nem akarják, hogy az intézet tiltó listán legyen. Figyelik a netforgalmat is.

A felszerelés egyébként hihetetlen. Csak a csoportnak van 5000 CPU-s farmja, amivel csak mi garázdálkodunk. Ezen kívül még 30 ezer CPU-t lehet használni, de mivel sok kutató van rá, ezért nem ritka a hosszú várakozás. A tárhely valami petabyte tartományban van, de mindegy is, mert úgysem elég. Annyira nem elég, hogy illesztett BAM fájlokat nem is tárolnak. Feldolgozás után azonnal törlik. Fastq fájlokat is ritkán látni. BAM-ban tárolják a szekvenciákat, mert ez kisebb helyet foglal. Sőt, BAM helyett is újabban CRAM-t használnak, hogy még több helyet spóroljanak.

A rendszer LSF ütemezőt használ. Legalább van még egy ütemező, amit megtanulhatok. Milyen érzés ekkora teljesítménnyel dolgozni?

Többféle tárhely van. A farm gépei Lustre-t használnak. A lényege, hogy nem kell foglalkoznia a felhasználónak, hogy fizikailag hol vannak a fájlok. Úgy lehetne elképzelni, mint egy hálózaton létrehozott RAID-et. Támogatja a fájlok több fizikai hordozón való elhelyezését, ami akkor hasznos, ha több program is olvassa azokat párhuzamosan. Ezen kívül van még NFS, szalag és még számtalan egyéb adattároló.

Ezt látva kezd kicsit átértékelődni bennem a bioinformatikus, mint fogalom. Bioinformatikus az, aki inkább a számítógépes infrastruktúrával foglalkozik, mint a biológiai adatok feldolgozásával vagy elemzésével. De meg kell hagyni, ez csak egy csoport. Mások talán máshogy állnak a munkához.

Szólj hozzá!

Címkék: bioinformatika

Cseppet sem objektíven: Function 2015

2015.09.20. 22:41 Travis.CG

Ez az első Function, amit kihagyok. Mikor beszélgettem néhány itteni magyarral, azt mondták, hogy fog majd hiányozni a húsleves meg a rántott hús. Nem volt igazuk. EZ hiányzik. Kénytelen vagyok beérni a streammel.

Végighallgattam a zenekompót, és a tablet szánalmas hangszóróján keresztül az volt az érzésem, hogy itt trónfosztás lesz. Vincenzó, Teo, Slyspy is indult, de a legjobb zenék mégsem tőlük jöttek, hanem (számomra) ismeretlen zenészektől. Kérdés, a nagy név elég-e a győzelemre, vagy a közönség is hallja, hogy vérfrissítés kell. Kiderül.

Grafika. Kevés, de minőségi munka jellemezte a kézi rajzokat. Dorcyy képe annyira élethű volt, hogy rá kellett nagyítani, hogy látszódjon, ez nem fotó. Unreal mostani képe kicsit befejezetlennek tűnt. A szörny lába olyan elnagyolt volt. A freestyle grafikák között már elég sok selejt akadt. Sajnos én nem kedvelem a fotómontázsokat. Számomra olyan, mint Unityvel demót készíteni.

Fotó: Elég szokásos felhozatal, inkább poénok voltak, mint komoly képek. Ketyere képe persze kiemelkedett. Szép, hosszú expozíció volt, gondolom technikailag is nehéz volt kivitelezni a fényviszonyok kiegyenlítését. A pucér nős fotónál persze nagyon hangos taps volt. Buzavirag képe is szép volt a perspektíva miatt.

Wild/Animáció: A LAL végre nem PC zúzós demót csinált. Amin meglepődtem, hogy még értelme is volt. Cserébe a Crimson Jihad bemutatott egy PC éltető demót. A Dron Captures pedig megmutatta, hogy egy dron segítségével is lehet kreatív tartalmakat készíteni. A Perfekt sajnos túl hosszú lett, pedig teljesen kiszámítható volt. De üdítő látni ilyen alkotásokat, aminek van mondanivalója.

Demók: Most a változatosság kedvéért nem azokat az alkotásokat mutatom be, amelyek tetszettek, hanem azokat, amelyek minél jobban igyekeztek szakítani a hagyományos demókkal. Természetesen van átfedés a két halmazban, de nincs 1:1 megfeleltetés. Ami a legkevésbé igyekszik újítani, az a lights.off. Azért még felfedezhető benne a kronológikus rendezés és a különböző részek, amelyek átmennek egymásba. Emlékeztek a Toy Story első részében a tönkretett játékokra? Bizonyára az inspirálta az Elégtelen című demót. Sem nekem, sem másnak fogalma sincs, mit is akar jelenteni az a sok eklektikus elem együtt. Direkt akartak valami szokatlant, ami sikerült is. Ami viszont magasan viszi a pálmát, az a GodTV Satoritól. Itt olyan mértékben keverték az elemeket, hogy már azt is nehéz eldönteni, hogy tényleg ilyenre akarták, vagy csak bugos volt a shader kód.

Nagyon sajnálom, hogy ki kellett hagyni az idei Functiont. Különösen, hogy még palacsinta is volt. Itt, ahol a gasztronómiai kultúra szinte teljes egészében hiányzik, ez még fájóbb.

2 komment

Címkék: demoscene

Felvételi eljárás

2015.09.20. 14:40 Travis.CG

Elkészítettem a pipec kis önéletrajzomat (természetesen LaTeX-ben) és elkezdtem kitölteni a webes oldalukat is. A Leets-i Egyetem oldalához képest nagyon könnyű volt, csak három lapból állt.

Egy héttel később kaptam egy levelet, amiben közölték, hogy kapok egy próba feladatot egy előre meghatározott időpontban, a megoldást pedig két órán belül vissza kell küldenem. Az ajánlott időpontot efogadtam. Percre pontosan küldték is a levelet. Először kellett küldeni egy választ, amiben megerősítettük, hogy a levelet megkaptuk, majd néztem a feladatokat.

Perl, Java, Ruby jöhetett szóba, ezért a Perl mellett döntöttem. Az első feladatnak kaptam egy két oszlopos fájlt, amiben ló nevek voltak és a rájuk tett tétek. Olyan programot kellett írni, ami minden lóra kiírja az tétek összegét. A második feladatban ugyan ezt kellett kiírni, de tétek szerint sorba rendezve. A harmadik feladatban egy többoszlopos állomány második oszlopának egyedi azonosítóit kellett kiírni. A negyedikben meg kellett számolni, hányszor fordul elő minden egyes azonosító a harmadik oszlopból. Az ötödik már egészen bioinformatika-közeli feladat volt. Be kellett olvasni egy többszörös fasta fájlt és kiírni, hogy az egyes szekvenciákhoz milyen azonosítók tartoznak.

Összességében annyira könnyű feladatotokat adtak, hogy szerintem senkit nem szűrtek ki ezzel. Két órát adtak, de ötven perc alatt megcsináltam. Sajnos az egyik kódot túl sokáig debuggoltam.

Majd jött a Skype interjú. Ettől tartottam a legjobban, mert nem vagyok túl jó angolból. Bent maradtam a melóhelyen, bezártam az ajtót, hogy ne jöjjenek be, kétszer ellenőriztem a hangerőt és elkezdődött az interjú. Kérték, hogy meséljem el, hogyan végzem a munkámat, dolgoztam-e rákos genomokkal, mi az erősségem, gyengeségem. Kíváncsiak voltak, melyik a "legjobb" programozási nyelv, szerintem, dolgoztam-e nagy gépeken, sok adattal. Tudakolták, milyen operációs rendszereket használok. Közben annyi nyelvtani hibát vétettem, hogy még nekem is feltűnt.

Szerencsére a kapcsolat sem szakadt meg, mindvégig tiszta volt a vonal. De kétségtelen, hogy számomra az egész procedúra legnehezebb része ez volt.

Valahogy ezen is túljutottam. Két héttel később értesítettek, hogy személyes interjúra is kell menni. Angliába. Ez már döfi! Jó egy órával előbb érkeztem, de ez nem volt gond, tíz perccel az érkezésem után már beszélgettünk is. Itt jegyezném meg, ha valaki hasonló helyzetbe jut, nyomtasson ki minden minden e-mailt, amit a HR-től kap. Nagyon megkönnyíti az életét. Én is először rossz épületbe mentem be és nem tudták, hova irányítsanak. De azért megoldottam.

Az interjú követte a Skype interjú menetét, de a kérdések már inkább arra irányúltak, miként tudok beilleszkedni a csoportba. Kérdezték, inkább kutatnék-e vagy csak robot módjára parancsot hajtanék végre, mi volt a legnagyobb kutatási élményem, visszamennék-e pipettázni?

A beszélgetés után jött egy teszt. Ilyen tesztet sem töltöttem még ki. Kaptam egy Mac laptopot, amin megnyitottak egy Google Formot. Minden egyes klikkelésemet ketten nézték. A teszt nyolc részből állt. Minden egyes rész elején megkérdezte, végig akarom-e csinálni. Igen válasz esetén jöttek a kérdések.

Az első rész Unix használat volt. Kérdezték, mivel helyezek át fájlokat, melyik paranccsal változtatom meg a jogosultságokat, milyen jogosultságokat állítanék be bizonyos fájlokhoz.

A második bioinformatika volt. Hogyan nézem meg egy BAM fájl rekordjait, kaptam egy szekvenciát, aminek a koordinátáit meg kellett határozni a humán genomon. (Valami olyan szekvenciát adtak, ami az NCBI Blaston nem adott találatot, sejtettem, hogy valami átverés lesz, ezért megnéztem UCSC-n is, ahol rögtön kijött a találat)

Harmadik Perl programozás volt. Adtak egy rövid programot, amiben deklarálás nélkül használtak egy változót, use strict mellett. Kérdezték, lefut-e a program, ha nem, mit kellene megváltoztatni. Különböző paramétereket adtak meg és kíváncsiak voltak, mit ad a program eredményül.

A negyedik Java programozás volt. Fel kellett sorolni az összes mező módosítót, kérdezték mi a különbség az absztrakt osztály és az interface között,

Az ötödik C programozás volt. Írni kellett egy függvényt, ami BED formátumú sztringet generál a paraméterekből, kaptam egy struktúrát, aminél le kellett írni, hogyan helyezkedik el a memóriában.

A hatodik R programozás volt. Fel kellett sorolni fájlba író függvényeket, kérdezték hogyan szedek ki egy mátrixból adott sorokat, mi a különbség a data.frame és a mátrix között.

A hetedikben SQL-el kapcsolatos kérdések voltak. Adtak egy tábla sémát és az alapján kellett lekérdezéseket írni, fel kellett ismerni egy left joint, kérdezték, hogyan lehet SQL injection-t megelőzni. Adtak egy példa lekérdezést, kérdezték mennyire biztonságos a használata.

A nyolcadik a verzió követő rendszerekről szólt. Az első feladatnál be kellett jelölni, melyik verzió követő rendszerrel milyen mélységben boldogulok. Az ezt követő kérdéseket tetszőleges verzió követő rendszer szintaktikájával kellett megoldani. Itt én váltogattam az SVN-t és a Gitet, attól függően, melyikre emlékeztem. Volt még két általános kérdés, hogy mivel segíti a fejlesztést a verzió követő rendszer és mikor érdemes branch-elni.

Lefáradtam rendesen, és minden kategóriában legalább egy kérdést elszúrtam. Ilyenkor derül ki, a különböző IDE-k mennyire lustává teszik az embert. Utána kérdezték még, hogyan szoktam fejleszteni (írok-e unit tesztet), mikor cégnél dolgoztam, hogyan fejlesztettünk. Megjegyezték, hogy még nem találkoztak olyan emberrel, aki mind a nyolc kategóriába belekezdett volna.

A végére alaposan lefáradtam. Ebédeltünk egyet, majd délután egyenként beszéltem a csoport minden tagjával. Mindenki elmesélte, mivel járul hozzá a kutatás nagy egészéhez. Szerencsére itt voltak átfedések és igyekeztem nem elaludni. Talán még értelmes kérdéseket is intéztem mindenkihez.

A végén megkérdeztem, hány jelentkező volt eddig, de nem kaptam választ, helyette a laborvezető azt ecsetelte, hogy milyen nagyon meg volt velem elégedve, a tesztet is jól megoldottam. Utána arról beszélt, mennyi lehetőség van itt, milyen sok pályázati pénzük van. Annyira udvariasan beszéltek, hogy az volt az érzésem, nem is én kuncsorgok az állásért, hanem ők kuncsorognak nekem, hogy ide jöjjek.

Délután, mikor repültem vissza, a szememet már nem tudtam nyitva tartani.

Szólj hozzá!

Címkék: életmód

Tanácsok külföldi munkahely kereséshez

2015.09.13. 14:40 Travis.CG

Az első és legfontosabb kérdés, amit el kell dönteni, miért is akarunk külföldön munkát vállalni. Tapasztalat szerzés? Pénz keresés? Impakt faktor gyűjtés? Ha ezt eldöntöttük, máris könnyebb lesz szűrni a potenciális ajánlatok közül.

Ha tudjuk, nézzük meg a csoport eddigi munkáit. Olvassuk el a cikkeiket, nézzük meg a csoportvezető önéletrajzát. A ResearchGate, Linkedln és más oldalak segítségével elég sok információt szerezhetünk potenciális munkaadóinkról. De ugyan ilyen fontos, hogy mi magunk is kitűnjünk a tömegből. A különböző oldalakon mások megerősíthetik, hogy tényleg értünk az önéletrajzban leírt területekhez. Az önéletrajzba is betehetjük a linkeket. Minimális munkával kattinthatóvá tehetőek a PDF-ben létrehozott hivatkozások, megkönnyítve a HR és a csoportvezetők dolgát.

Néhány jel, ami arra utal, hogy ne jelentkezz a hírdetésre:

  • Azonnal keresnek valakit. Valami sürgős munkájuk akadt, esetleg az utolsó pillanatig húzták egy szerződés teljesítését. Bármi legyen is mögötte, a kiírás egyet jelent a túlórával, teljesíthetetlen határidőkkel.
  • A csoport 2 éve nem publikált értelmes cikket. Ez azt jelenti, hogy amíg ott vagy, te sem fogsz.
  • A csoport tagjai között nincs egyetlen bioinformatikus sem. Ez két élű fegyver. Egyrészt jó lehetőség, hogy hős legyél a csoport szemében, ha mindent jól megcsinálsz. Másrészt nem leszel egy hullámhosszon a többiekkel. Nem értik meg a problémáidat, nem tudsz tanácsot kérni senkitől, nem tanulsz semmi újat.
  • Hibás terminológia a kiírásban. Fogalmuk sincs, kit keresnek és mire. Valahonnan átvették a kiírást, de nem értik, mi mit takar.

Különböző egyetemek különböző stratégiákat használnak a sok jelentkező feldolgozására. Sok egyetem előre elkészített webes oldalak segítségével teszi egységessé az adatokat, feleslegessé téve a hagyományos önéletrajzokat. Ezen oldalk kitöltésére akár több nap is rámehet. Nem árt, ha már van előre elkészített ajánlás is. Volt olyan oldal, ahova még azt is be kellett írnom, miért gondolom, hogy alkalmas vagyok a poszt betöltésére. Tehát az interjúk sablon kérdései is előfordulhatnak.

Személyes vélemény, de aki jól viseli a kudarcot, az célozzon meg minél jobb lehetőséget és csökkentse az igényeit később. Agilisebbek megkereshetnek olyan laborokat is, akik nem írtak ki állást. Ha felkeltettük az érdeklődésüket, megoldják, hogy odakerüljünk.

Én színvonalas kutatásba akartam kerülni, ezért akadémiai szférában keresgéltem és olyan csoportot néztem csak, akiknek az elmúlt 3 évben legalább egy Nature/Science cikkük volt. Így figyeltem fel a Sanger Intézetre.

Szólj hozzá!

Címkék: életmód

Érdekes ember lettem

2015.09.10. 23:22 Travis.CG

Egy külső ember számára a bioinformatika se nem érdekes, se nem látványos. Úgy gondolom, sok biológus számára sem az. Ezt egyrészt tapasztalom a saját bőrömön is, ahol előfordul, hogy házon belül is küldenek egy e-mailt, hogy gyorsan kell valami, majd miután megkapják, amit akarnak, annyit sem mondanak, hogy köszönöm.

Ehhez én már teljesen hozzászoktam. Ezért is ért váratlanul, hogy hirtelen mindenki velem kezdett el foglalkozni.

Egy csoportmegbeszélésen jelentettem be, hogy a nyár vége felé szeretném kipróbálni magamat külföldön is. Gondoltam, ezzel adok elég időt, hogy találjanak egy másik e-mail címet, amire elküldhetik a "van két táblázatom, csinálj belőle egy harmadikat" típusú kéréseket.

Két dologgal nem számoltam: Az egyik, hogy a pletyka gyorsabban terjed, mint a fény. Még kutatóknál is. A másik, hogy a pánik furcsa dolgokat hoz elő az emberekből.

A csoportmegbeszélés után fél órával, mikor jöttek segítségért, már kérdezgették: tényleg elmész? A legfurcsább az volt számomra, hogy olyan emberek is odajöttek, akik nem is velem végeztetik a bioinformatikai elemzést, hanem kiküldik Angliába azt. Délután már telefonon is felhívott egy régi barátom, aki már fél éve egy e-mailt nem volt képes írni, hogy hétvégén feltétlenül találkoznunk kell, mert hallotta, hogy el fogok menni.

A főigazgató, aki olyan elfoglalt, hogy egy aláírásáért sorba kell állni, a folyosón megállított, hogy "üljünk le beszélgetni, miért is akarok elmenni".

A főnökömet berendelte egy intézetvezetőkből álló bizottság, ahol neki vázolnia kellett, hogyan fogja megoldani a "helyzetet".

Nincs semmi titok. Egyszerűen arról van szó, hogy minden post docnak szüksége van külföldi munka tapasztalatra. Ezt rögtön a PhD megszerzése után szokták meglépni. Én egy kicsit később léptem meg.

Természetesen, ahogy elmúlt az újdonság, úgy váltam ismét ismét unalmassá. Végül kezdtek megjelenni a levelezésembe a "futtasd már le ezt a Blastot, nekem nem megy" és "jó ez a heatmap, de nem lehetne a skálát megfordítani?" típusú levelek.

Szólj hozzá!

Címkék: életmód

Hello Sanger

2015.08.31. 01:59 Travis.CG

Az utóbbi időben elég nehezen jelentek meg tartalmak a blogon. Ennek nem az volt az oka, hogy már nincs miről írni, esetleg elfáradtam. Mint azt sok olvasóm már tudja, szeptembertől a Sanger intézetben folytatom a munkát a Pre-Cancer csoportban. Mivel a családnak egy új életet kell felépíteni, ez többlet munkát jelentett nekem. Még nem tudom, mikor lesz internet, megfelelő számítógép és blog alapanyag, ezért várhatóan egy hónapig nem írok új posztot.

De van egy jó hírem! A kijutás folyamatáról írtam pár posztot, amit időzítve fog megjeleníteni a rendszer. Tehát lesz olvasnivaló, csak nem demó, programozás vagy bioinformatika tárgykörben. (Igen, a villanybojler javításról sem lesz semmi.)

Nézzétek el, ha nem reagálok minden kommentre azonnal és a levelekre is későn válaszolok.

Szólj hozzá!

Címkék: életmód

Cseppet sem objektíven: Assembly2015

2015.08.31. 01:45 Travis.CG

Már régen elmúlt az Assembly, de nekem most sikerült csak feldolgozni a releaseket. Ráadásul a hamvaiból feltámadt Scene.hu is remek összefoglalót adott a partiról. Szerencsére maradt egy kis hely az én írásomnak is.

Zenék

Szerencsére az idei zenei felhozatal is adott elég hallgatni valót. Fast kategóriában nem meglepő módon nem volt semmi maradandó, hiszen itt a zenék nagyon rövid idő alatt készülnek. Természetesen vannak meglepő alkotások, de ezek inkább azért meglepőek, mert hihetetlen, mire képesek egyesek 90 perc alatt. Például ez:

Az biztos, hogy néha hasznát tudnám venni ennek a tudásnak. A Dance kategóriában vannak az igazi adrenalin bombák. Ezt az első helyezettnél nem éreztem, de a második Runaway A.I.-nál már lehet érezni:

Bevallom, nem tudom, mi volt ez a Tom Cruise poén a Le-Veli-től, de a negyedik helyezettként is ezzel a témával jött elő:

Aikapallo ismét nagyot alkotott, amivel Listening music szekcióban első lett. Szerintem teljesen megérdemelte:

Még valami ír zenei beütést is sikerült belevinnie, amitől nagyon egyedi hangzást ért el.

Grafika/Fotó

Erre nincsenek szavak:

Mad Max vs. Kiber T-rex. Ha megfilmesítenék, tuti kasszasiker lenne. Vagy a második helyezett:

Egyszerűen fenomenális! Szokták mondani, hogy mellekkel mindent el lehet adni. Demoscene körökben ez úgy fest, hogy Amigaval mindent meg lehet nyerni. Így történt a fotó compó esetén is. Be sem illesztem, annyira semmilyen kép. Bezzeg a 11. helyezett!

Ez már mindjárt más.

Animáció/Wild

Az animációk idén nagyon gyengék voltak. Egy viccesnek szánt videó volt csak, de azt sem értettem. Ez kicsit csalódás volt. De ugyan ez elmondható a wildokról is.

 Intrók

Az 1k-val az a baj, hogy ahhoz nem elég nagy, hogy igazán kreatív lehessen az ember, de nem is elég kicsi, hogy emlékezetes legyen az alkotás. A legtöbb 4k sem mutatott túl sokat. Nem voltak többek színesebb 1k-nál. Nem volt igazi dizájn, nem volt jó zene, csak amolyan kóder szórakozás. Kivéve a Hydrokinetics. Az is elég egyszerű volt, de legalább változatosan állítgatták a paramétereket. Ettől kevésbé volt monoton.

Demó

Elég érdekes koncepciókat láthattunk a demók között. Kezdetnek ott volt a Watercolour Space, ami személy szerint nekem nem tetszett, de mindenképp ötletesnek tartom. Szerintem nem aknázták ki az ötletből az összes potenciált.

A Ratavah megtestesíti mindazt, amit egy effekt demótól elvár az ember. Minőségi grafika, sok látványelem, jó zene. Pici sztori. Szerintem semmi baj nincs az ilyen alkotásokkal. Fairlight úgy csinált Amiga demót, hogy nem csinált Amiga demót. Mit értek ez alatt? Ha valaki PC-n készít Amiga éltető demót, akkor legtöbben megragadnak a gép adta látványvilágnál. Ettől az alkotás felemás lesz, mert egy mai PC nevetve megjeleníti azt, amit egy Amigával csak trükkök garmadájával lehet a képernyőre varázsolni. Ezért sem a látvány, sem a kód nem nyűgözi le az embereket. Az eredmény pedig fikázás. Ezt kerülték ki ügyesen a Hold and Modify-ban. A demó mai hardverekre készült, de rengeteg utalás tartalmaz az Amigára. Most kicsit ellentmondok önmagamnak. Amigával talán mégsem lehet mindent megnyerni, mert ez az alkotás is csak harmadik lett.

A Monolith egy kicsit inkoherensre sikeredett. A mélységi kamerák képeit ügyesen használják, de a témák nem logikusan követik egymást. Például van egy születés-fejlődés-halál motívum, de egy magzat már korábban is szerepel. Ezektől az apróbb hibáktól eltekintve hozza az elvárt ASD színvonalat.

A végére hagytam a legellentmondásosabb demót, a demo2-t. Grafikailag kiemelkedő, ötletes, tele van tartalommal. Akkor miért ellentmondásos? Mert Unreal Engine-el készült, a tartalmak egy részét pedig a netről töltötték le. Összességében tehát a hozzáadott munka viszonylag kevés, de az eredmény elég volt, hogy megelőzzön egy Fairlightot. Én személy szerint semmi rosszat nem találok egy játékengine használatában. A netes tartalmakkal sincs semmi gond, ha korrektül jelezzük a szármázás helyét. Olyasmi ez, mint amikor filmrészleteket szinkronizálnak át és vágnak össze videobloggerek. Ha van egy mondanivalónk, amit el szeretnénk mondani, akkor minden elérhető eszközt meg kell ragadni, hogy kifejezhessük azt:

A scene.hu cikke a demókról 1. rész.
A scene.hu cikke a demókról 2. rész.
A scene.hu cikke az Amigás demókról.

Szólj hozzá!

Címkék: demoscene

Álláshirdetés

2015.08.10. 10:58 Travis.CG

Akinek a blogon leírtak felkeltették az édeklődését, az csatlakozhat hozzánk és velünk vállvetve harcolhat a bioinformatika frontján. Vannak nyulak, temérdek munka, vicces emberkék. Egy cégnél jobban fizetnek, de itt nagyobb a szabadság, mind a munkamódszerekben, mind a munkaidőben és ez szerintem legalább olyan fontos. Tudományos előmenetel szempontjából ez a legjobb intézetek egyike. Elég széles kapcsolati hálónk van, nem kell attól félni, hogy rutin munkát kell csinálni.

A hivatalos, de semmitmondó kiírás itt található.

Szólj hozzá!

Címkék: bioinformatika

Mennyit ér a munkánk?

2015.07.29. 14:37 Travis.CG

Habár, mi emberek szeretjük hangoztatni, hogy van, amit nem lehet pénzben kifejezni, a gyakorlat azt mutatja, hogy a pénz igenis fontos mértéke ezeknek a dolgoknak. Vegyük például a szeretetet. Nem tudjuk megmondani, mennyibe kerül egy édesanya szeretete, de ha karácsonyra nem kap elég értékes ajándékot, akkor a szeretet ünnepe durcás hallgatásba sűlyed. A szerelem sem hord árcédulát, de ha az eljegyzési gyűrű egy műanyag karika, akkor nem kell sok jóra számítani.

Szerencsére a munka nem ilyen, azt egzaktul ki lehet fejezni pénzben. Nemrég tanúja voltam egy megbeszélésnek, ahol pont az én munkámról, illetve annak értékéről volt szó. A fizetésem két csoport pályázatából tevődik össze (vagy háromból, a részletek zavarosak nekem), de volt egy fél év, amikor X csoport fizetett, de többet dolgoztam Y csoportnak. Persze emellett besegítettem még Z és W csoportnak is, de ez most mellékes. A lényeg, hogy X csoport vezetője kompenzációt akart arra az időre, amikor Y-nak is dolgoztam. A megbeszélés ennek a kompenzációnak a mértékéről szólt.

Az első ajánlat egy nyomtató volt. Ez elég lehangoló volt, még akkor is, ha tudom, hogy csak a fizetésem kompenzációjáról volt szó (pontosabban a feléről). Az sem enyhített a dolgon, hogy a nyomtató fénymásolni is tudott volna. De azután fordulópont következett! Már nem egy nyomtatót értem, hanem egy laptopot! Ez már jobb kedvre derített, egészen addig, amíg meg nem tudtam, milyen laptopról van szó. Amolyan Fukar/Hülye vagyok laptop. Műanyag zsanérokkal, beépített padló fűtéssel (ami szétégeti az ember combját, ha megnéz egy 2004-es demót), visító, béna ventillátorokkal.

Ha tehát kezdünk elszállni magunktól és túlértékeljük saját fontosságunkat, csak nézzük meg, melyik műszaki cikket ér a munkánk és máris helyre billen az egónk.

Szólj hozzá!

Címkék: életmód filozofálás

süti beállítások módosítása