Az idei bioinformatikai konferencia számomra olyan volt, mint egy érettségi találkozó. A volt kollégáim 70%-a jelen volt. Külföldről, nyugdíjból jöttek el, hogy itt lehessenek. A másik jó dolog az volt, hogy többségében PhD hallgatók adtak elő, így nem éreztem azt, hogy haldoklik a bioinformatika. A szervezés a magyar konferenciáknál megszokott "batyús bál" mintát követte. Ismerve a Magyar Bioinformatikai Társaság éves bevételét, azt kell mondjam, hogy csoda, hogy volt kávé. Szóval a szervezők tényleg a maximumot hozták ki a lehetőségekből.
De a sok kesergés helyett lássuk inkább az előadásokat, amik tényleg nagyon színvonalasak és változatosak voltak. Az utóbbi évek konferenciáin az előadók, mintha mind ugyan azt csinálták volna. Mikor Covid volt, mindenki vírusokkal foglalkozott. Mikor berobbant az AlphaFold, mindenki azt szapulta, mert nem találja meg a rendezetlen fehérjéket. Tavaly pedig mindenki MI szakértő volt. Úgy tűnik végre nincs több divathullám és valódi problémákra lehetett koncentrálni. Az előadásokról további információ itt érhető el.
Gerber Dániel: Bioinformatikai alkalmazások és kihívások az archeogenomikában
Az archeogenomikában több ezer éves DNS mintákkal dolgoznak. Jellemző, hogy ezek a minták töredezettek és kémiailag módosultak. Elsősorban populációgenetikai vizsgálatok dominálnak. Mivel az adatok hiányosak, ezért imputálásra támaszkodnak.
Bálint Balázs: Annotált genomok szennyeződéseinek érzékeny kimutatása és eltávolítása a ContScout programmal
A feltöltött genomok nagy része szennyeződés, ami befolyásolja az elemzést. Az eddigi programok alapvetően adatbázisokat használnak, de a ContScout fehérje alapon működik. A tesztek alapján horizontális géntranszfer esetén rosszabb eredményt ad.
Ari Eszter: mulea - egy többféle ontológiát és empirikus FDR-t alkalmazó dúsulást vizsgáló R csomag
Ontológiai elemzéseknél a többszörös tesztkorrekció ellenére is sok fals eredmény van, mert az ismert statisztikai módszerek függetlennek tételezik fel a teszteket. Egy fa struktúrába rendezett ontológia elemei viszont nem függetlenek. A mulea empirikus FDR-t használ, új mintavételezést végez, ezért számításigényes a futtatása.
Hegedűs Dániel és Juhász Márk Hunor: Filogenetikai fák metszése
Filogenetikai elemzéseknél a fel nem ismert hibák hosszú ágakat eredményezhetnek a törzsfákban. Az utólagos metszéssel jó eredményeket kaphatunk. Az eddigi programok nem végeznek jó munkát, és nehezen használhatóak, a csoport ezért egy új programot fejlesztett, ami nagyjából kör alakúra vágja a fákat. Jelen pillanatban az outgroup-ot még nem kezeli jól.
Juhász Judit: Nukleotid szekvenciák kontextusának vizsgálata pángenom és assembly gráfokban valószínűség alapú módszerekkel
Egy gráf jobban leírja a genomot, mint egy fasta fájl. Keresni viszont nagyon nehéz benne. A csoport egy hash alapú módszert dolgozott ki, ami egy minimizer alapú algoritmussal keres. Sokkal gyorsabb, mint a most létező megoldások, de még nincs teljesen kész.
Krizsán Dániel: Génexpresszió előrejelzése Escherichia coli baktériumban genomikai nyelvmodellek segítségével
A prokBERT nyelvi modellt használták, amit korábban mutattak be. Most expressziós adatokkal finomhangolták, hogy előrejelezzék az egyes gének kifejeződését. Sajnos még elég kis korrelációt mutat valódi expressziós adatokkal.
Nagy Ádám: Agyhullámok és Mentális Zavarok: A Legkorábbi Jelek Feltárása
Skizotípia és bipolaritás agyi képének elkülönítésére akartak tanulóalgoritmust trenírozni. Egyetemistákat használtak, akiket kérdőívek alapján egyik vagy másik csoportba soroltak. Ezután EEG-t, szemmozgást és más jeleket rögzítettek, hogy biomarkereket azonosíthassanak és modell magyarázó metrikákat számoltak.
Pogány Domonkos: Metabolit-betegség asszociációk becslése hiperbolikus terekben
A hiperbolikus terek jellemzője, hogy sok párhuzamos egyenes mehet át egy ponton, a térfogat pedig exponenciálisan növekszik. Emiatt skálafüggetlen hálózatok beágyazására alkalmasak. A csoport MDA hálózatok sekély beágyazását végezték hiberbolikus térbe, mert itt kisebb dimenzió is elég a kapcsolatok leírására. Az előadás legérdekesebb része mégis az volt, mikor az előadó azon filozofált, hogy miért látjuk a metabolit hálózatokat skálafüggetlennek? Azért, mert ilyen a hálózatok jellege, vagy azért, mert a kutatók az eredményeiket már ismert metabolitokhoz kapcsolják?
Stippinger Marcell: Jellemzők terének szűrése utranagy dimenziójú többosztályos adatokon
A bonyolultnak tűnő cím abból a kutatásból eredt, hogy egy cég felkérésére az aláírások hitelességét akarták meghatározni, amit egy idősoros adatként kezeltek. A probléma ott kezdődött, hogy nem tudták, milyen jellemzők lehetnek fontosak, például egy tanítási algoritmusnak. Ezért a meglévő adatok alapján jellemzőket generáltak számítógéppel. A gond az, hogy egyes jellemzők nem triviális korrelációkat tartalmazhatnak, ami egy elemzésnél elkerülheti a kutató figyelmét. A generált adatokat megpróbálták szűrni, amihez véletlen erdőket használtak. Az eredmének jók lettek.
Zsichla Levente: Nyílt forráskódú vírusgenom-összeszerelő pipeline-ok összehasonlító elemzése
Azt vizsgálták, hogy az egyes genom összeszerelő pipeline-ok mennyire jók HIV vírus esetén. Az összeszerelés minőségét Sanger-szekvenálással, gold standard genomokkal és in silico szimulációkkal mérték. A Shiver és a Smalt Align volt a legjobb.
Csendes Gerold: Poszt-perturbációs génexpressziót prediktáló gépi tanulási modellek kiértékelése
Ha a gépi tanulásban jó értékeket kapunk, még nem jelenti azt, hogy biológiailag is hasznos, amit az algoritmus megtanult. Különböző torzító tényezők miatt félremehet a tanulási folyamat. A baseline-ok megléte ezért nagyon fontos. Az előadás végén mégis arról beszélt az előadó, hogy ha nem jó egy modell, még nem használhatatlan.
Weber Áron: Hogyan fedez fel egy sejtszimuláció új fehérjekomplexeket?
A fehérjekomplexek azonosításában több stratégia létezik. A struktúra alapú módszernél azt vizsgálják, hogy a fehérjék képesek-e összeállni. Hálózat alapú módszeren alapul az MCL és a huMAP. Végül van a Cytocast Digital Twin Cell, ami egy szimuláció alapú megközelítést használ. Az előadás ezt mutatta be. A program proteomikai méréseken alapul. A kötési információkból gráfot képez, ahol a Google PageRank algoritmusát használják, hogy megállapítsák, melyik él a fontos.
Bruncsis Bence: Új szimulációs keretrendszer multivalens fehérjék és membránfehérjék közötti kötődés vizsgálatára
Egyes fehérjék kapcsolódásánál nem két, hanem több tag is részt vesz. Az ilyen, multivalens fehérjék esetén nem működnek a két tagra kihegyezett módszerek, ezért új kötési kinetikát és differenciál egyenleteket kell használni, hogy sikeresen leírják ezeket a rendszereket.
Kálmán Zsófia: Kölcsönhatások elemzése a PSD-ben: a GKAP-LC8 példája
A posztszinaptikus denzitás (PSD) fontos az olyan idegrendszeri megbetegedésekben, mint amilyen az Alzheimer is. A legfontosabb PSD-k bináris kölcsönhatását vizsgálták. Ezek közül az egyik az GKAP-LC8. Ez egy hexamer kapcsolat 4:2 stöchiometriával. Flexibilis kapcsolatot jön létre közöttük, amiben az LC8 kötőrégió hossza konzervált. Habár a komplex tagjai Drosophilában is megtalálhatóak, ott nincs közöttük kötés.
Tóth Adrienn Gréta: Klinikai megfontolások az antimikrobiális rezisztenciapotenciálhoz
Az antimikrobiális rezisztencia egy égető probléma. Sajnos a klinikumban, amikor antibiotikum használata mellett döntenek, akkor egy táptalajon felnövesztett törzsek telepmorfológiáját veszik alapul, ahol az antibiotikum kiválasztásánál szubjektív tényezők is szerepet kapnak. Ezzel a módszerrel sok információ elveszik. A csoport egy szekvenáláson alapuló módszert javasol, ahol genotípus alapján, metagenomikai módszerekkel rezisztencia géneket azonosítanának, és ez lenne az antibiotikum kezelés alapja.
Nagy Sára: Metagenomikai bepillantás egy gabonamúmiába
Emberi múmiákról mindenki hallott. De gabonákat is eltettek az Egyiptomiak. Egy ilyen gabonából vettek DNS-t, és azt vizsgálták. Találtak ember, selyemlepke, búza, prokarióta, nyárfa DNS-t. Sok szennyeződés volt a mintában, mert például fekete nyár nagyon ritka Egyiptomban, a selyemlepkére pedig kiviteli tilalom volt ebben az időben. Az emberi DNS viszont szubszaharai, valószínű, hogy hisztorikus.
Stirling Tamás: Genomi monitoring és fágterápia összekapcsolása az antibiotikum-rezisztens kórokozók elleni küzdelemben
A fágterápia hasznos lehet az antibiotikumok kiváltására, hátrányuk, hogy szűk hatásspektrumúak és gyorsabban adaptálódnak ellene a baktériumok, mint az antibiotikum ellen. A csoport adatbázisokból, környezeti mintákból rengeteg fágszekvenciát gyűjtött és azt nézték, miként változik a fágok genomja. Azt találták, hogy a fágok helyben terjednek, 6 éves távban nem mozdulnak, ezért hatékonyak lehetnek baktériumok ellen. A vizsgálatok alapján négy fágból álló koktél hatákonyan veszi fel a küzdelmet.
Buza Krisztián: Továbbfejlesztett ROCKET algoritmus tónusos-klónusos epilepsziás rohamok felismerésére
Az epilepsziás rohamokat idősoros gyorsulásmérő adatok alapján szerették volna előre jelezni. A fejlesztés során dinamikus konvolúciót építettek az algoritmusba. Először 10 ezer random konvolúciós mátrixot használtak, amit kétféle pooling alapján összegeztek. Az így kapott 20 ezer feature készletet logisztikus regresszióval vagy ridge regresszióval vizsgálták. Azt találták, hogy a nearest neighbour klaszterezéssel kapták a legjobb adatokat. Az algoritmus itt található.
Szatmári Zita Eszter: A sport hatása a biológiai életkor változására
Hetvenöt 50 és 70 év közötti ember öregedési óráját vizsgálták egy hosszabb edzés időszak előtt és után. Vérből izolált markereket használtak, többféle öregedési órát is néztek. Egyes órák esetben voltak szignifikáns különbségek, más esetben nem. Az előadó szerint az öregedés lassult edzés hatására. Nők esetén nem láttak olyan sok szignifikáns eredményt, mint férfiak esetén.
Kerepesi Csaba: A legújabb öregedés órák és érdekes alkalmazásaik
Az előadás a csoport eddigi publikációinak bemutatása volt. Tömören ezek a következők voltak: Fénykép alapján is meg tudták saccolni, milyen sebességű a biológiai órája valakinek. A sportolók tovább élnek, az olimpikonok meg még tovább (bár itt a hallgatóságból megjegyezték, hogy csak az élő sportolókat/olimpikonokat vizsgálták, tehát nem lehet általánosan kijelenteni, hogy a versenysport mindenkinek jó). Az akadémikusok pedig hamarabb halnak. Akinek magas a testzsír százaléka, az szintén gyorsabban öregszik. A gyulladást indukáló baktériumok jelenléte is a hosszú élet ellen dolgozik. Végezetül az egyes szervek nem ugyan olyan mértékben öregednek.
Nagy Gergely: A makrofág promóterek összetételének vizsgálata
A transzkripciós faktorok határozzák meg a sejttípust, de van olyan transzkripciós faktor is, ami egy egész sejtvonalat meghatározhat. Az elérhető nyilvános adatokból egy aggregált cisztront hoztak létre, amin belül az ETS és bZIP családokat néztek. A promótereket kategóriákba helyezték, így volt csak proximális elemeket tartalmazó csoport, csak disztális elemeket gyűjtő csoport, végül egy vegyes. Ez utóbbi csoportba tartozó promóterekhez rendelhető gének mutatták a legmagasabb expressziót. A promóterek CG tartalma meghatározza a cisz szabályozó elemek állapotát.