Kalandok a magyar szuperszámítógépekkel

2013.07.24. 22:18 Travis.CG

Az egyik nagy előnye, hogy az ember akadémiai kutatócsoport tagja, hogy hozzáférhet a NIIF szuperszámítógépeihez. A papíron leírt impozáns teljesítmény mutatók azonnal megdobogtatják egy magamfajta felhasználó szívét. Sajnos az örömbe sok üröm is keveredik, ha a tényleges felhasználásra kerül sor.

Regisztráció

A regisztrációs procedúra sokat egyszerűsödött, de márciusban, mikor a saját kérvényemet intéztem, ez kétfordulós meccs volt. Először projektszámot kellett igényelnem. Kitöltöttem egy papírt, aláírattam minden főnökömmel, akik igazolták, hogy én tényleg létezem, és tényleg kutató vagyok. Ezután még egyszer kitöltöttem egy nagyon hasonló papírt, ahol témaszámot igényeltem. A procedura nagyon hasonló volt. Kellett generálni egy ssh kulcsot és már kész is voltam.

Programok

A szuperszámítógépek használata hasonlít egy batyus lakodalomra: Étel-ital lesz elég, ha hoztok magatokkal. Szoftver lesz elég, ha fordítasz magadnak. Ez nem olyan problémás, egészen addig, amíg nem a függőségek függőségeit kell fordítani. Utána kicsit unalmassá válik. Én a Mira-t akartam futtatni, ezert felmásoltam egy statikusan linkelt binárist és azt használtam. Illetve próbáltam használni.

Üzemidő

Memória gondjaim voltak, ezért akartam a pécsi szuperszámítógépen dolgozni, de csak a kínlódás volt vele, ugyanis lépten-nyomon elérhetetlen volt a gép és a futó programok pedig elszálltak. Visszanéztem az ezzel kapcsolatos e-mailjeimet és az alapján készítettem ezt a grafikont:

Egy hetet nem tudott folyamatosan menni a pécsi gép. Szerintem annak idején a Windows 95 jobban teljesített, nem? Áttértem a szegedire, ahol viszont nem jutottam sorra. (Illetve az egyik kiesés alkalmával csak a futó jobok szálltak el, a várakozási sor nem ürült, amitől az élre tudtam törni). A másik igencsak frusztráló dolog a jobütemező, ahol az idő folyamán egyre több korlátozást vezettek be. Egyik alkalommal nem voltam elég figyelmes és a job futásának hosszabb időt adtam meg, mint amennyi a felső határ volt. Nem kaptam hibaüzenetet, nem kaptam figyelmeztetést, semmit. Annyi tűnt fel, hogy van üres node, de én továbbra is a várakozási sorban dekkolok.

Mikor végre sorra kerültem, gyanúsan lassan futott a Mira. Rövid nyomozás után kiderítettem, hogy a félelmetes memória, CPU és sávszélesség mellett az IO műveletek röhejesen lassúak. (Emlékeztetőül: A bioinformatikai programok nagy fájlokat olvasnak és írnak). Álljon itt egy cseppet sem mélyreható, gyors tesz, mire is képesek a szuperszámítógépek:

számítógép	olvasás	írás
szeged	75,4	4,7
deb	204	8,8
munkaállomás	96,1	11
otthoni	66,1	15,1

A tesztet a jó öreg dd-vel csináltam:

dd if=/dev/urandom of=fajl # iras teszt dd if=/dev/sda of=/dev/null # olvasas teszt

A teszt nem túl szofisztikált, de a célnak megfelel (meg nem ártott volna néhány ismétlés, de annyit nem ér az egész). A deb egy nagyteljesítményű számítógép, ami nem a NIIF tulajdonában van.

Végszó

Sajnos semmi hasznosat nem tudtam kezdeni a hazai szuperszámítógépekkel. Végül úgy végeztem el a munkát, hogy lecsökkentettem a readek számát, hogy beleférjen 70GB memóriába, majd lefuttattam egy erre alkalmas gépen.

Facebook Tumblr Tweet Pinterest Tetszik

3 komment

Címkék: rendszergazda bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr815422777

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Kalle 2013.08.08. 15:05:05

Mit csináltál a mirával egész konkrétan?

Válasz erre

Travis.CG 2013.08.09. 21:39:57

Két bakteriális törzs genomját szereltem össze, hogy megkeressük közöttük a genetikai különbségeket.

Válasz erre

Kalle 2013.08.21. 10:46:03

@Travis.CG: Azért kérdeztem, mert hiába az egyik legkomolyabb assembler, nem mindenre működik megfelelően. Én a 3.9.x verziókat használom, egy 3 gbp baci genomot aránylag gyorsan összerakott (nem emlékszem pontosan, egy-két óra lehetett, IonTorrent 100bp kit, de messze nem szuperszámítógépen).

Torrentre a mira jön be a legjobban, és a tapasztalatom alapján a kevésbé ideális 2gen adatokra is.

Ha már van egy rendes, jó minőségű adatod (pl illumina, de a fő, hogy a read-hosz szórása ne legyen nagy ), többre mész egy dbg alapú assemblerrel, pl nekem az abyss jött be, de a velvet sem sokkal rosszabb. Ha ez mind nem újdonság, sorry :)

Válasz erre

Az élet kódjai

HTML

Az élet kódjai

Keresés

Friss topikok

Archívum

Feedek

Címkék

Egyéb

Kalandok a magyar szuperszámítógépekkel

2013.07.24. 22:18 Travis.CG

Regisztráció

Programok

Üzemidő

Végszó

3 komment

Címkék: rendszergazda bioinformatika

A bejegyzés trackback címe:

Kommentek:

Kalle 2013.08.08. 15:05:05

Travis.CG 2013.08.09. 21:39:57

Kalle 2013.08.21. 10:46:03

Az élet kódjai

HTML

Az élet kódjai

Keresés

Friss topikok

Archívum

Feedek

Címkék

Egyéb

Kalandok a magyar szuperszámítógépekkel

2013.07.24. 22:18 Travis.CG

Regisztráció

Programok

Üzemidő

Végszó

3 komment

Címkék: rendszergazda bioinformatika

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek:

Kalle 2013.08.08. 15:05:05

Travis.CG 2013.08.09. 21:39:57

Kalle 2013.08.21. 10:46:03