HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: Sajnos nekem is hasonló érzéseim vannak az R kiszorulásával kapcsolatban. Remélem jobban fogja tar... (2024.04.29. 10:48) R meetup
  • sdani: Nagyon jók ezek a bejegyzések! Feszültséggel teli, fordulatos, mint egy jobb krimi. :D Abba ne hag... (2024.04.29. 10:35) Wgel CTF
  • sdani: @Travis.CG: Egy kis szerencse sosem árt. :D (2024.03.01. 13:19) A bioinformatika helyzete 2024-ben
  • Travis.CG: Szóval az akadémiai szféra mazochistává tett, amit a Pinephone-al élek ki? Hmm, érdekes összefüggé... (2023.10.05. 18:23) Új barátom az Informatikai titkárságról
  • Travis.CG: Túl nagy a hype körülötte, ezért túlzó elvárások vannak vele szembe. Ha a korábbi chatbotokhoz kép... (2023.02.28. 06:28) chatGPT, a bioinformatikus

Minden, amit a CellRangerről tudni akartál, de féltél megkérdezni

2023.03.06. 17:58 Travis.CG

A fejlődés nem áll meg. Míg az első egysejtes elemzésemnél a jól bevált genomikai módszereket gyúrták át az egysejtes világ igényeinek megfelelően, addigra mára sokkal kiforrottabb céleszközök segítik a kutatók életét. Az egyik ilyen eszköz a CellRanger, amit a 10x Genomics ajánl a mintáik elemzéséhez. Habár úgy tűnik rengeteg információ van róla a dokumentációban, azért könnyű elveszni benne. Ezért álljon itt néhány dolog, ami segít eligazodni a káoszban.

A CellRanger melyik alprogramját futtassam?

Három alprogram van: count, multi, aggr. Count: egyféle mintán kell futtatni. Multi: többféle adat van ugyan ahhoz a mintához. Aggr: van több minta. A 10x dokumentációja nem program szerint csoportosítja a leírásokat, hanem kísérleti elrendezés szerint. Tehát a count három helyen is szerepelhet. Erre figyelni kell. A különbség legtöbbször nem is a paraméterekben van, hanem a paraméterként beadott CSV-ben. Egy oszloppal kevesebb, és más elemzésed lesz.

Hol vannak a nyers eredmények?

Az eredmény minden esetben egy mátrix lesz. A mátrix megvan egyben, H5 formátumban, vagy három tömörített fájlban. Barcodes.tsv.gz: ez a sorok azonosítója, kis túlzással ezek lennének a sejtek, ha egy tökéletes világban élnénk. Features.tsv.gz: ez az oszlopok azonosítója. Gyakorlatilag a gének. Matrix.mtx.gz: Ez a mátrixunk. Első oszlop a sor száma a barcodes fájlból, a második az oszlop száma a features-ből, a harmadik a cella értéke. Nullás cellákat nem tartalmaz, hogy spóroljanak a hellyel.

Nekem X darab mintám van, hogy találom meg ezeket egyetlen táblázatban?

Itt kezdenek érdekesek lenni a dolgok. Az aggr kimenetében a barcode azonosító végén van egy -x, ahol x a minta számát jelöli. Tehát ha három mintánk van, akkor lesz -1, -2, -3 végű barcode-unk. A sorrend az lesz, amit az aggr-nak paraméterként a CSV fájlban megadtunk.

Miként tölthetem be ezt R-be?

A DropletUtils csomag használatával. Ez elkészíti a SingleCellExperiment osztályt, amit az összes többi Bioconductor csomag is használ. Betölti a H5-t is, de kezeli a három különálló fájlt is.

Miként tölthetem be ezt Pythonba?

A Scanpy csomag read_10x_h5() vagy read_10x_mtx() metódusaival.

Hol vannak a molekulalác szekvenciák?

Ha volt VDJ meghatározás is, akkor FASTA formátumban megvannak a szekvenciák a vdj_reference alkönyvtárban.

Hogyan tudom megfeleltetni a molekulaláncokat és a barcode-okat?

Van egy táblázat filtered_contig_annotations.tsv néven, ahol felsorolják a barcode-okat és a clonotype-okat, ami az oldalláncok nevei.

Szólj hozzá!

Címkék: bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr4918060132

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása