HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup
  • sdani: Nagyon jók ezek a bejegyzések! Feszültséggel teli, fordulatos, mint egy jobb krimi. :D Abba ne hag... (2024.04.29. 10:35) Wgel CTF
  • sdani: @Travis.CG: Egy kis szerencse sosem árt. :D (2024.03.01. 13:19) A bioinformatika helyzete 2024-ben
  • Travis.CG: Szóval az akadémiai szféra mazochistává tett, amit a Pinephone-al élek ki? Hmm, érdekes összefüggé... (2023.10.05. 18:23) Új barátom az Informatikai titkárságról
  • Travis.CG: Túl nagy a hype körülötte, ezért túlzó elvárások vannak vele szembe. Ha a korábbi chatbotokhoz kép... (2023.02.28. 06:28) chatGPT, a bioinformatikus

Az MTA Cloud felhasználási lehetőségei

2018.10.14. 21:40 Travis.CG

Alapvetően az MTA Cloudon igényelhető gépek kicsik. Nekem például az otthoni, 6 (vagy 7?) éves gépemet egyik instance sem képes megszorongatni. Még az előző munkahelyi ócskavas is lealázza őket memóriában.

Na, de akkor mire lehet használni őket? A kérdés jogos, bemutatok pár felhasználási lehetőséget. Mert igaz, hogy teljesítményben nincsenek eleresztve, de helyi hálózatba köthetőek és kaphatnak egy publikus IP címet.

A másik potenciális probléma, az elérhető operációs rendszerek típusa. Az Ubuntu Cloud csomagkezelőjében ugyanis nem érhetőek el azok a programok, amelyek egy asztali környezetben megtalálhatóak. Bizony elég sok manuális telepítés szükséges. Én például túl későn vettem észre, hogy az elérhető R olyan régi, hogy a Bioconductor alig ment fel.

1. Jupyter szerver

Pont az előbb írtam, hogy kimagasló számítási teljesítményt ne várjunk, akkor mégis miért kéne Jupyter szervert üzemeltetni? Például azért, mert a szakdolgozók még az akadémiai szférában található gépeknél is silányabb masinákkal vannak felszerelve (vagy csak én voltam balszerencsés).

Arról se feledkezzünk meg, hogy nem mindenki tudja IKEA növényként elszámlázni a számítástechnikai beszerzéseket, és a semminél még ezek a gépek is jobbak.

A szervert viszont csak SSH alagutazással lehet használni, ami egy kis plusz munkát igényel a helyi gépen. Cserébe viszont kapunk egy bárhonnan elérhető szervert és valós időben ellenőrizhetjük a munka haladását. Nem kell elfelejtett e-mailekre hivatkozni. Lehet írni megjegyzéseket is, bár a kommunikáció ilyen formáját nem tartom előnyösnek, mert alig komolyabb egy mindenki által szerkeszthető Wordnél.

2. Web szerver

Néha előfordul, hogy szükség lenne egy webszolgáltatásra, de nem akarjuk "terhelni" az intézeti rendszergazdát. Esetleg teljesen felesleges tőle bármit kérni, mert nem tudja/akarja megcsinálni. Ilyenkor saját magunk hozhatunk létre nekünk megfelelő webes szolgáltatást. Készíthetünk saját Wikipédiát, Blast szervert, Galaxy-t, bármit. Még ha nem is akarunk éles szolgáltatásokat futtatni róla, fejlesztői szervernek is megteszi.

A többi instance egy lokális hálózaton kommunikál a publikus IP-vel rendelkező géppel, ezért nem muszáj minden szervert egy gépen futtatni. Az adatbázis motort külön gépre rakhatjuk, így növelve az össz teljesítményét.

Habár közönséges webszervert nem nehéz csinálni, Shiny alkalmazást nem tudtam telepíteni. Máig nem tudom, miért, de 80-as porton a Shiny szerver nem akart válaszolni, más portot megnyitva nem tudtam kapcsolódni hozzá kívülről. (Persze alagutazáson keresztül működött, ami arra enged következtetni, hogy van egy tűzfal a helyi hálózat és a nagyvilág között.)

3. Tárhely

Felesleges a DropBox 2Gb méretkorlátjával bajlódni. Nem muszáj előfizetni Amazon S3-ra sem. Az instance-okat használhatjuk biztonsági mentésekre, kutatási eredmény megosztására. Ha kívánjuk, Hadoopos HDFS-el több gép tárhelyét is összefűzhetjük. De ha csak közönséges FTP-t telepítünk, azzal is javíthatjuk adattároló kapacitásunkat.

4. Fejlesztés

Ha verzió követő rendszert telepítünk rájuk, akkor bárhol fejleszthetjük programjainkat, nem vagyunk multi cégek kényének-kedvének kitéve, mint GitHub/GitLab/BitBucket esetén. Használhatjuk nagyobb projektek integritás ellenőrzésére is, bár kizárt dolognak tartom, hogy a magyar tudományos életben bárki használna ilyesmit, de cáfoljatok meg.

5. Speciális programokra

Vannak elemzések, amelyek nem igényelnek nagy erőforrást, mégis sokáig futnak. Ha aggódunk, hogy a takarítók esetleg a partvissal kikapcsolják a gépet, közeleg a rettegett áramszünet, nyugodtan használjuk a távoli gépeket. Azt is elképzelhetőnek tartom, hogy egyes bioinformatikai programoknak speciális rendszerkövetelményei vannak, vagy egyszerűen csak régiek, mi mégis használni szeretnénk. Szóba jöhet a Docker, VirtualBox is, mint megoldás, de ha valami miatt nem jöhetnek szóba, akkor még mindig itt van az MTA Cloud.

Összegzés

Az MTA felhő szolgáltatás használata vért és verejtéket kíván, aki használni akarja bizonyára rengeteg nehézséggel fog találkozni. Én legalábbis elég sokkal találkoztam. De ingyen van és ennél gyorsabban nem lehet szert tenni egy gépparkra. Cserébe csak annyit kérnek, hogy említsük meg a publikációkban, hogy használtuk és írjunk egy rövid jelentést.

Szólj hozzá!

Címkék: cloud computing

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr6314268337

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása