HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

Dragen, feltámad az FPGA

2016.02.29. 23:13 Travis.CG

Még 2008-körül az FPGA tűnt egy igen ígéretes megoldásnak a bioinformatikát uraló feldolgozási krízisnek. Senkinek nem volt elég a CPU adta teljesítmény. Egyre másra jelentek meg a Blastok, Bowtie-ok és más alkalmazások FPGA verziói. Később kiderült, hogy hiába a gyors feldolgozás, a I/O műveletek jelentik a szűk keresztmetszetet és még a legnagyobb fanatikus is kénytelen volt elismerni, hogy azért az FPGA sem jó mindenre.

Nemrég az Edico Genome jött hozzánk előadást tartani, ahol bemutatták a Dragen Cancer Pipeline nevű csodájukat. Habár mindenhol csak a PCI foglalatba illeszthető kártyát lehet látni, az előadás során világossá vált, hogy önmagában ezt nem lehet megvenni, hanem a hozzá adott PC körítés is a csomag része.

A gép mai szemmel nézve elég impozáns jellemzőkkel bír. Tizenkét mag, 128GB memória és sok terabyte tárhely (RAID-be kötött SSD-k). A kártyán is található 32GB dedikált memória. Az előadó szerint ez olyan specifikáció, amit nem kell hardver szinten fejleszteni. Azért egy ilyen mondatot bedobni egy bioinformatikus hallgatóságnak nagy bátorság. De ezért csodáljuk az üzletkötőket.

Az is elhangzott, hogy nem akarnak minden lépést FPGA-ra implementálni. A pipeline egyes részei a CPU-n futnak, és a kártyához adott hardverrel garantálni lehet teljesítményt, míg egy más forrásból beszerzett számítógépnél léphetnek fel gondok. Ez a lépés nekem szimpatikus.

Természetesen láttunk teljesítmény görbéket, de nem is érdemes szót ejteni róluk, úgyis mindenki tudja, mit tartalmaz: ők a legjobbak, pont. Az előadás szerint egy 30x lefedettségű humán genomot 1 óra alatt teljesen feldolgoz. Ez BWA + GATK konbinációval napokban mérhető. Legalábbis az üzletkötő szerint. Biztos sokat futtatta, azért tudja ilyen jól.

Az illesztőprogram egy saját fejlesztésű hash-alapú algoritmus, egyenesen FPGA-ra tervezve. A variációk keresése már CPU-n megy, erősen párhuzamosítva. Van liszenszük a GATK-ra, egyfajta viszonteladókként működik a cég. Ha viszont a megrendelő más programra esküszik, azt is megkaphatja előtelepítve.

Ami viszont nem tetszett, az az üzleti modell. A gépet nem lehet fix összegért megvenni, hanem a feldolgozott adattal arányos pénzt kell fizetni. Ha tehát kijön egy új referencia és az összegyűjtött adatokat újrafuttatják, akkor újra lehet fizetni. Mert ez a másik oka, amiért kell a számítógép. Az FPGA önmagában nem tud hazatelefonálni, hogy megmondja, aznap mennyi adaton rágta magát keresztül.

A rendszer egyébként kellően flexibilis. Egyrészt neten keresztül tudja frissíteni magát, másrészt van lehetőség egyedi pipeline-al kérni a gépet. Nálunk valószínűleg nem rakják ki a bioinformatikusokat, hogy FPGA-s gépekre cseréljék őket, de talán a klinikai diagnosztikában több létjogosultsága lesz.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr268420180

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása