HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Felhő számítás

2010.09.30. 11:11 Travis.CG

A felhő alapú számítások (cloud computing) nagy népszerűségnek örvendenek manapság. Segítségükkel meg lehet határozni Isten számát, vagy a bioinformatika egyre növekvő tárhely éhségét,

Az Amazon rendszerét használva viszont nem tapasztalom azokat az előnyöket, melyeket a jelmondatok ígérnek. Hozzá kell azonban tennem, hogy az Amazon folyamatosan fejleszti szolgáltatását, ezért remélem jelen bejegyzésem minél előbb elavulttá válik.

1. Korlátlan tárhely

Az S3 szolgáltatás keretében rengeteg tárhelyünk van, feltéve, hogy betartunk néhány szabályt. Először is nem akarunk 2GB-nál nagyobb fájlt feltölteni. A biológusoknak ez igen kényelmetlen, mert egy nyers szekvenciafájl könnyedén elérheti a 25GB-t. A másik probléma, hogy nem áll rendelkezésünkre a hagyományos értelembe vett fájl struktúra. A fájlok ugyanis bucket-ekben vannak. Egy bucket elnevezése egyedi kell, hogy legyen a teljes S3-ban. Ha már egy felhasználó létrehozta a "cucc" nevű bucketet, akkor más felhasználónak nem lehenek "cuccai". Egy bucketen belül a fájlnévben elhelyezett per jelek imitálják a könyvtárszerkezetet.

2. Korlátlan virtuális gép

Egy felhasználó annyi virtuális gépet indíthat, amennyit a pénztárcája elbír. Feltéve, ha az Amazon rendszer maximális limitjét nem éri el. Személy szerint már három órája nem tudok egyetlen virtuális gépet sem elindítani, mert az Amazon "tele van". Ez ellen nem lehet mit tenni. A másik probléma a sávszélesség. Bizonyos esetekben, még nem jöttem rá, miért, de a kapcsolat megszakad a virtuális gép és a saját gépem között. Szerencsére a nohup parancs a segítségemre van.

Szerk: Közben sikerült megoldanom a problémát. A megoldás, hogy a virtuális gépről egy "képet" készítünk (Amazon Machine Image), amit elindítva megadhatjuk, hogy melyik régióba essen az új gép. Ugyan ezt eljátszhatjuk a virtuális meghajtókkal is.

3. Könnyű fejlesztés

Az Amazon Java SDK-ja szerintem megfelelő. Minden funkciót lefed. A fejlesztési nehézség az elosztott rendszer jellegéből adódik. Ha például lekérdezzük a futó virtuális gépek számát, csak egy hozzávetőleges számot kapunk. A rendszer tehetetlensége folytán előfordulhat, hogy a gépek közül néhány már nem fut. Ugyancsak nehéz fizetős szolgáltatást tervezni, mert nem tudjuk, hogy az ügyfél hitelképes-e. Aki tehát ilyen szolgálatást tervez, még azelőtt nézzen ennek utána, mielőtt begépel 10 ezer sort.

4. Elérhető szolgáltatások

Két nagyobb bioinformatikai adatbázist említenék meg, a GenBankot és az EnsEMBL-t. Felületesen szólva ezek tartalmazzák az összes megszekvenált élőlényt, ami csak laboratóriumot megjárt. Ennek ellenére a GenBank csak egy emberi Blast adatbázist, az EnsEMBL pedig egy két verzióval ezelőtti emberi genomot tartalmaz. Valóban, a kutatások legtöbbje az emberre irányul, de akadnak még muslicával, fonalféreggel, baktériumokkal foglalkozó kutatók is. Úgy gondolom, ha ezek mindent feltennének az Amazonra, másnak nem maradna hely, talán ezért is ilyen kurta a kínálat.

Szólj hozzá!

Címkék: cloud computing bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr72334213

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása