HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: @Travis.CG: Nohát, nem is tudtam, hogy ilyen van... bár ahogy elnézem ezek a komponensek fizetősek... (2018.11.01. 10:14) Rossz beidegződések a bionformatikában
  • Csenge Tarnói: Ez érdekes. Most csinálok egy meta-analízist, életemben először, úgyhogy az én tudásom is felszíne... (2018.10.01. 21:39) Ez már nekem sok
  • robertherczeg: Nekem a kedvenc az volt, hogy: "Inkább eleve Mann-Whitney és/vagy Wilcoxon tesztet használjunk, m... (2018.09.04. 07:47) Ezért utálom a Wilcoxon-tesztet
  • Travis.CG: ÉÉÉÉÉs megjelent! (2018.08.24. 23:31) Nehéz szülés 2
  • Szedlák Ádám: Hogy én mennyire köszönöm ezt a posztot, arra nincs szó. A kódoljon mindenki / legyen mindenki olc... (2018.06.25. 03:37) Legyen mindenki programozó

Cikk táblázat

2014.06.06. 22:15 Travis.CG

Egy projekt kapcsán olyan ismert kisRNS-ek szekvenciájával kellett dolgozni, ami még nincs benne a mirbase-ben. Annyit mondtak, hogy a szekvenciák benne vannak egy cikkben. Tényleg benne voltak. Két oldalon keresztül mentek a táblázat sorai, 90 fokkal elforgatva.

Nem szeretek másolni. Ha kijelöltem és kimásoltam, csak sületlenséget kaptam. Az egyetlen használható információ a cikk online változata, mert ott a táblázat orientációja normális volt. Cserébe képként volt beszúrva. Nincs más hátra, be kell gépelni. Bár csak lenne egy szakdolgozóm! Már épp megnyitottam egy szöveg fájlt, amikor eszembe jutott, talán van valami jó OCR program Linux alá.

Rövid keresgélés után ráakadtam egy összehasonlító cikkre. Elolvastam a jelölteket és röpke tűnődés után adtam egy esélyt a tesseractnak. Parancssoros program, ami szövegfájlt eredményez. Ennél jobb konbinációt el sem tudok képzelni. Még az Ubuntu repoban is megtalálható, ezért csak egy pillanat volt a telepítése.

A dokumentáció elég szűk szavú. Nincs 200 paraméter, nincs kézi állítgatás. Ezen a ponton kicsit szkeptikus lettem, de már fel volt telepítve. Ha nem váltja be a hozzá fűzött reményt, majd eltávolítjuk. Letöltöttem a cikk ábráját a lehető legnagyobb felbontásban és ráeresztettem a programot. Fél másodperc és keletkezett egy fájl.

A tesseract gyönyörű TAB-al elválasztott táblázatot csinált. Összesen három sorban volt hiba, amit kézzel kijavítottam. Mégsem kell szakdolgozó.

Szólj hozzá!

Címkék: rendszergazda bioinformatika

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr156283319

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.