HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Bioconductor installálás felhőre

2012.08.10. 11:39 Travis.CG

A Bioconductor egy olyan R csomag gyűjtemény, ami statisztikai oldalról támogatja a bioinformatikai munkát. Validálásnál, az eredmények kiértékelésénél rengeteg olyan eszközt ad a kutatók kezébe, amely nélkül a munkájuk minősége nehezebben állapítható meg.

Amikor erőforrás igényes munkáról van szó, és egy távoli gépen akarjuk kihasználni ezt a hihetetlen potenciált, akkor meg kell bírkózni a feladattal és egy olyan gépre is telepíteni kell a rendszert, amely - mint látni fogjuk - rendszergazdai szempontból több kihívás elé állít, mint egy helyi gép.

Első lépésben le kell tölteni magát az R csomagot. Választhatunk kész, bináris formát, de ezeket úgy fordították, hogy eleve feltételezték, hogy a rendszerünk tartalmaz X-t, Tcl interpretert és még ki tudja mennyi mindent. Ha ezek adva vannak, akkor nincs semmi gond, de ezek az én Amazonos gépemen nincsenek, és szükség sincs rájuk a munkámhoz. Tehát egyetlen lehetőség, a forráskód letöltése és fordítása.

>wget http://cran.cnr.berkeley.edu/src/base/R-2/R-2.15.1.tar.gz

Alapból az Amazonos gépek nem tartalmaznak fordítót, és egyes Linuxos instance-k saját csomagkezelő repositoryval vannak ellátva, de ezek megtalálhatóak a csomagok között. (Szemben az R-el, ami viszont nem) Az R csomagnak kell Fortran fordító is a C/C++ mellett:

>sudo yum install gcc44-gfortran.x86_64

A fortran fordító gfortran44 néven szerepel, ezért - miután kicsomagoltuk az R forráskódját - létre kell hozni egy környezeti változó, hogy a scriptek megtalálják.

>export F77=gfortran44

Ezután már konfigurálhatjuk a fordítást.

>./configure --with-readline=no --with-x=no

Nincs szükségem X-re, ezért kikapcsoltam. A másik opció további forráskódok telepítésétől ment meg.

A libxml2-dev és a libcurl4-openssl-dev csomagok viszont megtalálhatóak az Amazonos gép csomagjai között, ezért telepítsük ezeket is. Az R futtatásához nem szükségesek, de a Bioconductor használatához igen.

Ha a fordítás és a csomagok telepítése sikeres volt, akkor a további csomagokat már az R parancsértelmezőjéből futtathatjuk. Indítsuk el az R-t. Mivel a telepítőnek hozzá kell férnie néhány rendszer-könyvtárhoz, ezért mindezt root jogokkal tesszük.

>sudo R

>>source("http://bioconductor.org/biocLite.R")
>>biocLite("ShortRead")
>>biocLite("edgeR")
>>library("BiocInstaller")
>>biocLite("VariantAnnotation")
>>q()

Telepítés során előfordulhatnak problémák. A leggyakoribb ok, hogy valamilyen csomag hiányzik. Sajnos erről nem kapunk egyértelmű hibaüzenetet, csak annyit, hogy pl: xml-config not found. Ez annyit jelent, hogy nincs telepítve a libxml2-dev. Elképzelhető, hogy további csomagok is kellenek, de én a saját gépemre már annyi fejlesztői könyvtárat felpakoltam (samtools, bwa, stb telepítéséhez), hogy elképzelhető, valamit kifelejtettem.

Szólj hozzá!

Címkék: rendszergazda cloud computing bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr644705080

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása