HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup
  • sdani: Nagyon jók ezek a bejegyzések! Feszültséggel teli, fordulatos, mint egy jobb krimi. :D Abba ne hag... (2024.04.29. 10:35) Wgel CTF
  • sdani: @Travis.CG: Egy kis szerencse sosem árt. :D (2024.03.01. 13:19) A bioinformatika helyzete 2024-ben
  • Travis.CG: Szóval az akadémiai szféra mazochistává tett, amit a Pinephone-al élek ki? Hmm, érdekes összefüggé... (2023.10.05. 18:23) Új barátom az Informatikai titkárságról
  • Travis.CG: Túl nagy a hype körülötte, ezért túlzó elvárások vannak vele szembe. Ha a korábbi chatbotokhoz kép... (2023.02.28. 06:28) chatGPT, a bioinformatikus

Galaxy - a bioinformatika jövője akar lenni, de nem az

2022.10.25. 08:03 Travis.CG

Kevés a nagy teljesítményű számítógép? Utálod a rendszeradminisztrációt? Gőzöd sincs, hogyan kell parancssorban dolgozni? Nem tudsz programozni? Bioinformatikát akarsz csinálni? Lehet, azt hiszed, ezek a feltételek kizárják egymást, de tévedsz! Ott a Galaxy! Még telepítened sem kell. Ha van akadémiai email címed, amivel bizonyíthatod, hogy csóró vagy, akkor regisztrálhatsz a usegalaxy.eu-ra. Kapsz 250GB tárhelyet, ami elég a legtöbb munkához. de ahhoz a három génhez, amivel foglalkozol, biztosan.

Az egész a felhőben fut, mégsem kell érte fizetni. Feltöltöd a cuccaidat, lefuttatod az elemzést, majd letöltöd az eredményeket. Mindenki ezt használja. Bármelyik kontinensen is vagy, van egy Galaxy csomópont a közeledben, hogy a számítógépkezelés nyűgét-baját levegye a válladról. Mint a mesében, nem igaz? És az örömöd addig is fog tartani, mint egy mese.

Kezdjük az elején. A kezdeményezés jó, hogy biztosítsunk egységes, határokon átívelő felületet a bioinformatikai munkának. Ez az új belépőket segíti, hiszen ha elakadnak, akkor könnyű a jó irányba navigálni őket. A Galaxy elméletileg erre született. Ott vannak az eszközök, vannak előre összeállított munkafolyamatok.

Sajnos a futó folyamatokról egyetlen visszajelzést sem kapunk. Miután elindítottunk, az fut. Ha megszakad a futás, azt nagyon nehéz nyomon követni. A képernyő jobb oldalán található History bonyolult számozással mutatja csak a részeredményeket, ráadásul egyes lépések rejtettek. Ha pedig bekapcsoljuk a rejtett lépések láthatóvá tételét, akkor a nem-rejtettek tűnnek el, tehát a teljes folyamatsort soha nem fogjuk látni.

Rengeteg tutorial van a Galaxy használatáról, és a munkafolyamatok is részletesen le vannak írva. Ez minden olyan program esetén nagyon fontos, ami széles felhasználói bázisra törekszik. Az egyetlen gond, hogy a munkafolyamatok és a belőlük készült dokumentációk nincsenek szinkronizálva. Én például napokat töltöttem azzal, hogy megpróbáljam kitalálni, egy munkafolyamat eredményei között miért nem találok egy fájlt, amit a dokumentáció szerint meg kellene találnom. Végül rájöttem: a munkafolyamat nem tartalmaz olyan kimenetet.

Aprópó munkafolyamatok. Elméletileg ezek azért vannak, hogy egy tevékenységet egységesített módon kezeljenek, hogy ne kelljen a rengeteg programmal és azok paraméterezésével bíbelődni. De erre képtelenek. Például nekem is javasolták, hogy a Galaxyban futtassam le a VGP munkafolyamatot. Nos, VGP pipeline nem létezik. Helyette van 3 különböző VGP pipeline. Egy, ha van Bionano adatunk, egy, ha nincs bionano adat és van egy scaffoldingra. De egy számomra érthetetlen oknál fogva, ebbe nem integráltak egy nagyon fontos kezdeti lépést, a Genoscope2-t. Enélkül pedig lehetetlen lefuttatni a többit.

Az alapértelmezett paraméterek rosszak. Például mondja el nekem valaki, egy dedikáltan gerinces genom-összeszerelőben, miért egy féreg génkészlete alapján mondja meg, hogy jó-e az összeszerelés? Persze, be lehet állítani akár emlőst is, de miért nem a gerinces az alapértelmezett, ha már gerincesre lett optimalizálva?

Ha elindítottunk egy munkafolyamatot, akkor semmi nem tárolja, hogy milyen paramétereket használtunk. Ez pedig a megismételhetőség egy elég komoly akadálya.

Nem akarom azt mondani, hogy a parancssor a jövő, mert nem igaz. A különböző low-code megoldások, mint amilyen a Snakemake is, nagyon népszerűek, és nyilván a kevesebb gépelés felé mutatnak a trendek. De a Galaxy jelen pillanatban még nem áll azon a szinten, hogy teljesen kiváltsa a csúnya fekete képernyő előtti matatást.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr4917957676

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása