HTML

Az élet kódjai

Csináld maga. Senki nem csinálja meg helyetted.

Friss topikok

  • sdani: @Travis.CG: Nohát, nem is tudtam, hogy ilyen van... bár ahogy elnézem ezek a komponensek fizetősek... (2018.11.01. 10:14) Rossz beidegződések a bionformatikában
  • Csenge Tarnói: Ez érdekes. Most csinálok egy meta-analízist, életemben először, úgyhogy az én tudásom is felszíne... (2018.10.01. 21:39) Ez már nekem sok
  • robertherczeg: Nekem a kedvenc az volt, hogy: "Inkább eleve Mann-Whitney és/vagy Wilcoxon tesztet használjunk, m... (2018.09.04. 07:47) Ezért utálom a Wilcoxon-tesztet
  • Travis.CG: ÉÉÉÉÉs megjelent! (2018.08.24. 23:31) Nehéz szülés 2
  • Szedlák Ádám: Hogy én mennyire köszönöm ezt a posztot, arra nincs szó. A kódoljon mindenki / legyen mindenki olc... (2018.06.25. 03:37) Legyen mindenki programozó

Hulladékgazdálkodás

2018.11.12. 00:27 Travis.CG

A felhalmozódó szemétről már rengetegen írtak. A halak beleúsznak az eldobott műanyag dobozokba, a fókák nyakkendőként viselik a műanyag fóliákat. Fujj, belegondolni is szörnyű!

Aztán ott vannak a levélszemetek. Tárolni kell őket, fogyasztják a sávszélességet és még az időnket is rabolják, még ha csak annyira is, amíg töröljük őket.

Mi a helyzet a tudományos hulladékokkal? Azon belül is a bioinformatikai szeméttel? Megkapjuk őket egy szépen csomagolt cikk formájában, ami hemzseg az ilyen szavaktól: egyedülálló, újszerű, kimagasló, páratlan. Az ember bekajálja a meredeken felfelé törő grafikonokat, a 99.9999 százalékos hatékonyságot és azonnal ki akarja próbálni. Aztán jönnek a törött linkek, lefordíthatatlan programok. Minek tekintsük az ilyen programot? És a hozzá tartozó cikket?

A hétköznapi szemetet legalább részben újra lehet hasznosítani. Ezeket a cikkeket mire lehet használni? Elrettentő példán kívül?

Felmerülhet a kérdés, mennyi szemét van? Egy kutatócsoport elmerült a szoftver-szemétben és átnéztek több, mint 24 ezer programot. A programok fele nem érhető el, mert régi az URL, vagy nem telepíthető. A cikk alapján, ha egy programot 2012 előtt készítették vagy nincs GitHub link, nyugodtan felejtsük el.

Szakdolgozókat és PhD hallgatókat bevonva kiválasztottak random 99 programot telepítésre. Két órát szánhattak egy programra. Ha ennyi idő alatt nem sikerült működésre bírni, akkor megkapta a használhatatlan plecsnit. A kiadott dokumentáció alapján a programok fele nem telepíthető, kell hozzá vagy valami függőséget telepíteni vagy belenyúlni a kódba.

De miért kell ennyi energiát beleölni egy program fejlesztésébe? Nem elég addig futnia, amíg a cikket el nem fogadják? Azért, mert nem meglepő módon azt vették észre a cikk szerzői, hogy a telepíthető programok több citációt kaptak.

Tehát, aki meg akarja írni a követkeő IGV-t, annak pár egyszerű szabályt kell alkalmaznia: a progit tegye fel a GitHubra (vagy más publikus helyre), mert az intézeti/egyetemi URL-k jönnek-mennek. Használjon minél kevesebb függőséget (könnyebben telepíthető). Próbáljon csatlakozni nagyobb szoftver depóhoz (pip, Bioconductor, cran, bioconda). Az sem árt, ha rendes dokumentációt készít és mellékel egy kis teszt adatot is, amivel azonnal ki lehet próbálni.

De a legfontosabb üzenet - és ezt nem említi a cikk - hogy a program nem készül el a pulikációval. Azután is van élete, hogy mi másik munkahelyen vagyunk, másik témán dolgozunk. Ha nem is adunk hozzá új funkciókat, csiszolgatni továbbra is kell. Legalább annyira, hogy mások is le tudják fordítani.

Szólj hozzá!

Címkék: programozás filozofálás

A bejegyzés trackback címe:

https://cybernetic.blog.hu/api/trackback/id/tr5014363705

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.