HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Geneious: Szép vagy okos?

2011.10.02. 15:46 Travis.CG

Nem szívesen dolgozom CLC-vel. Csak akkor indítom el, ha kiosszák feladatban, hogy az adott problémát ezzel kell megoldanom. Azért nem szeretem, mert nem képes vizualizálni az információt. Amit vizualizál, az pedig ronda, nehezen kezelhető.

Nemrég viszont megkértek, hogy nézzem meg a Geneious programcsomagot, ami egyfajta CLC Workbench rivális. Megpróbálom bemutatni, hogy egy újgenerációs szekvenciákkal foglalkozó bioinformatikus munkáját miként tudja segíteni. Teljesítményre és pontosságra nem fogok kitérni ebben az összehasonlításban. Esetleg ha érdekel valakit, akkor szentelek ennek is egy posztot. (Az olvasók számát elnézve erre nem sok esély van :-)

Először is, a Geneious megpróbálja csak azokat az eszközöket a kezünk ügyébe helyezni, amire éppen abban a pillanatban szükségünk lehet. Ez nagyon szimpatikus tulajdonság. Ha megnyitunk egy szekvenciát, a felső sorban megjelennek a primer tervezés és az annotáció hozzáadása gombok. A kezelőfelület ezért zsúfoltnak hat, amit én személy szerint nem tartok hátránynak.

Az információk is szépen vannak megjelenítve. Egyszerűen jó ránézni például az alternatív transzlációt megjelenítő ablakra. A fejlesztők nagy hangsúlyt fektettek a legkülönbözőbb adatbázisokhoz való kapcsolódásra. Példának okáért egy nyilvános EnsEMBL adatbázishoz próbáltam meg kapcsolódni a segítségével. Ha az egyéb járulékos elemeket telepítettem volna, minden bizonnyal sikerült volna. Ez nem a program hibája.

A menüsorban is csak azok az elemek aktívak, amelyek relevánsak a kijelölt adattípus feldolgozása szempontjából.

Rengeteg adattípust képes importálni. Sajnos itt komoly hiányosságok vannak. Először is, nincs finomhangolásra lehetőség. Aki dolgozott már FASTQ fájllal, az tudja, hány féle variánsa van. A Geneious ennek ellenére nem kérdez semmit, csak betölti azt. Nem tudja például, hogy színkódolásos adatokat is tartalmazhat, ezért ha ilyet kísérelünk meg betölteni, nem olvas be semmit. Ugyan így nem kérdez rá a paired-end adatokra sem. Ami azt illeti, paired adatok kezelésére emiatt teljesen alkalmatlan. (Színkódolt adatokat csak csfasta formátumban tud betölteni, de én nem tapasztaltam, hogy megkérdezte volna, van-e quality fájl.)

Tegyük fel, sikeresen beolvastuk valahogy a szekvenciánkat. Mit kezdhetünk vele? Ebből a szempontból is elég kiábrándító a program. Csinálhatunk de-novo-t vagy illeszthetjük referencia szekvenciához. Nincs SNP detektálás, nincs RNA-Seq, Chip-Seq. Semmi.

A referenciához illesztés valami furcsa okból kifolyólag nem az Alignment, hanem az Assembly menüpont alatt található. Itt egyetlen dialóguspanelen választhatjuk ki, hogy milyen módon akarjuk illeszteni a szekvenciákat. Ha viszont referenciához akarunk illeszteni, akkor a referencia szekvenciát itt nem választatjuk ki! Azt azelőtt kell kijelölni, hogy a dialógusablakot megnyitnánk. Itt egy újabb probléma van. A két fájlnak ugyan abban a könyvtárban kell lennie. Én személy szerint szeretem külön tárolni a readeket és a referencia szekvenciákat. (Esetleg a referenciákat is tovább bontom olyan naív gondolatok szerint, hogy prokariótáról vagy eukariótáról van-e szó) Hiszen egy referencia fájl több különböző analízis során is felhasználásra kerülhet. A Geneious esetén el kell felejteni ezt a fajta felosztást. Ott célszerű az egy feladathoz szükséges fájlokat egy könyvtárba helyezni. Sőt nem célszerű, egyenesen kötelező.

Miután végeztünk az illesztéssel, könnyen tudjuk nagyítani és kicsinyíteni a látható képet. Görgethetünk jobbra és balra. De nem ugorhatunk referencia pozícióra. Miért? Ez egy nyilvánvaló igénynek tűnik. Tablet, IGV mind biztosít lehetőséget, hogy egy adott pozícióhoz tekerjek. A másik nagy szívfájdalmam a nem mappelt readek hiánya. Hogyan határozzam meg, hogy mennyire sikeres a mappelés, ha nem tudom, hány readet sikerült mappelni?

Van egy Text View nevű fül is, ahol a grafikus sallangoktól mentesen nézhetjük meg az eredményeket. Egészen jó, kivéve, ha túl sok adatot akarunk látni, mert akkor egyszerűen levágja azt, amit nem tud megjeleníteni. Ez többszörös illesztésnél ez 57 oszlop és 1500 szekvencia. (Én megközelítőleg 10 ezer szekvenciát illesztettem egy 12 ezer bázispár hosszú genomi szakaszhoz.) Tehát ez egy teljesen fölösleges funkció.

A Geneious jól használható lett volna 10 évvel ezelőtt, amikor még csak Sanger szekvenciákkal kellett játszadozni. Laboratóriumi munkámra visszagondolva biztosan nagyon örültem volna egy ilyen programnak. A világ viszont megváltozott. Egy bioinformatikai program nem teheti meg, hogy figyelmen kívül hagyja az újgenerációs szekvenálások igényeit. Az Emboss - az egyik kedvenc programcsomagom - fejlesztői is igyekeznek bekapcsolódni ebbe a folyamatba. Geneious így csak szép lehet, okos nem.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr673272137

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása