Hol vannak az újságíróknak hasznos adatok?

Az állam

A legtöbb országhoz hasonlóan Magyarországon is a közszféra az egyik legnagyobb adatelőállító. A minisztériumok és különböző intézmények honlapjainak a mélyén gyakran bújnak meg értékes adatsorok. Itt van közülük néhány:

A civilek

Bár az állam sok adatot tesz közzé, gyakran ezeket nem túl felhasználóbarát formában teszi. Így van ez például a közbeszerzési adatokkal. Hiába van egy többé-kevésbé jól használható keresőfelület a Közbeszerzési Hatóság honlapján, elemzésre is alkalmas adatsorokat ebből nem tudunk kinyerni. Szerencsére azonban közgazdász kutatók ilyen formátumban is hozzáférhetővé tették a hatósági adatoknak egy jelentős részét:

Emellett több civil szervezet tesz közzé adatokban gazdag anyagokat. Például:

Külföldi kerülőút

Előfordul, hogy valamilyen adatot hiába keresünk hazai forrásokban, de közben hozzáférhető valamilyen külföldi csatornán keresztül. Magyarország ugyanis számos nemzetközi szervezet tagja, és ennek megfelelően kötelezve van bizonyos adatok szolgáltatására. Néhány forrás, ahol érdemes keresgélni:

Tedd elérhetővé az adatokat (technikai nyitottság)

A nyílt adatnak technikai és jogi szempontból is nyíltnak kell lennie. Ez azt jelenti, hogy az adatsort le lehet tölteni egy csomagban, gépileg feldolgozható formátumban.

Elérhető adat

Az adatok nem kerülhetnek többe, mint a reprodukciójuk reális költsége, és lehetőleg ingyenesen letölthetők az internetről. Ez az díjszabás azért vállalható, mert az intézménynek nem kerülhet semennyibe az, hogy az adatokat megosztja felhasználásra.

Adatcsomag

Az adatsort egy teljes csomagban elérhetővé kell tenni. Ha olyan adatbázisod van, amelyet törvényi előírásnak megfelelően gyűjtöttek össze, akkor az egész adatbázis legyen letölthető. Egy web API vagy hasonló szolgáltatás nagyon hasznos tud lenni, de ez nem helyettesítője az egy kattintással letölthető csomagoknak.

Nyílt, gépileg feldolgozható formátum

A közintézmények által gondozott adatok felhasználása nem ütközhet szerzői jogi korlátozásokba. Még ennél is fontosabb, hogy az adatsorokat gépileg feldolgozható formátumban tedd közzé, mert az nagyobb teret ad az újrafelhasználásnak. Egy példa erre, mikor statisztikákat pdf dokumentumként tesznek közzé, mert azt használták például a nyomtatott anyagok előkészítésére. Igaz, hogy ezeket a statisztikákat az emberek tudják értelmezni, a számítógépek viszont nagyon nehezen. Ez pedig nagyban korlátozza, hogy mások is felhasználják ugyanezeket az adatokat.

Néhány követendő irányelv:

  • ne bonyolítsd túl a dolgokat
  • gyorsan cselekedj
  • legyél pragmatikus.

Jobb ma közzétenni a nyers adatokat, mint a tökéletes adatsor publikálásával félévet várni.

Nagyon sokféle módja van annak, hogy mások számára elérhetővé tedd az adatokat. A legmagátólértetődőbb az internet korában az internetes közzététel. Ennek a modellnek sok változata létezik, a legalapvetőbb, amikor az intézmény az adatokat a saját honlapján teszi közzé és egy központi katalógus mutatja meg a látogatónak, hol van pontosan az adatforrás. Itt is vannak azonban alternatívák: amikor a kapcsolat limitált, vagy az adatsor túlságosan nagyméretű, akkor más formátumokban történő terjesztés is elfogadott. Ebben a részben az olyan alternatív megoldásokat soroljuk fel, amelyek nem növelik a reprodukcióhoz kapcsolódó költségeket.

Mutasd a domained, megmondom, ki vagy

Némely esetben egy-egy domain-név alapos vizsgálata igazi meglepetésekkel szolgálhat. Most két olyan eszközt mutatunk, amelyekkel hasznos adatokhoz juthatunk olyanokról is, akik megpróbálnak mindent megtenni azért, hogy minél kevesebb információ kerüljön nyilvánosságra róluk.

Hazánkban a szélsőséges szerveződések igyekeznek kihasználni az internet nyújtotta lehetőségeket, gyűlöletbeszédeiket előszeretettel jelenítik meg olyan oldalakon, amelyeknek a tulajdonosai, használói rejtve maradhatnak. Jó példa erre a deres.tv nevű portál, amelyre nap mint nap töltenek fel már-már kuruc.info-szintű gyűlölködéseket, a készítő csapatról viszont semmilyen információ nincs az oldalon. A honlapon neveket nem találunk, a domain tulajdonosára pedig a magyar szolgáltatónál (domain.hu) hiába keresünk rá, mivel az csak a .hu-s oldalakról ad tájékoztatást.

Robtex.com

Bár a magukat több szinten védő tulajdonosok kilétét (pl. kuruc.info) az általunk bemutatott eszközök sem tudják felfedni, segítségükkel viszont feltárhatóak a teljes kép kialakításához elengedhetetlen kapcsolati hálók, összefonódások. Az egyik ilyen eszköz a robtex.com.

A robtex.com-on számtalan új információt kapunk a rejtőzködőkről, megtudhatjuk például, hogy az adott oldal IP címén milyen további honlapok futnak. Ehhez rá kell keresni a kérdéses oldal domain-nevére, ezután pedig a “Shared” fülre kell kattintani.

Maradva a példánál: a deres.tv esetében ez máris egy fontos információt eredményez. Kiderül ugyanis, hogy a deres.tv mail szervere ugyanazon az IP címen fut, mint a mail.szentkoronaradio.com, vagy a mail.magyarsziget.hu. Utóbbi két oldal pedig egyértelműen a Hatvannégy Vármegye Ifjúsági Mozgalomhoz köthető. Köztük, és a deres.tv között hivatalosan nincs kapcsolat, ám az, hogy a mail szervereik egy IP címen futnak, jelzi, hogy mégiscsak lehet valami közük egymáshoz.

Ha pedig ezután a “Records” fülre kattintunk át, akkor még egy izgalmas adatot láthatunk: azt, hogy ez a bizonyos mail szerver Oroszországban van, ott fizettek elő a szolgáltatásra. Ez pedig egy újabb érdekes adalék a kapcsolati hálók feltárásához.

Nemcsak a mail szervert érdemes megvizsgálni, hanem azt is, hogy az adott oldal IP-címén még milyen honlapok futnak. Érdekességekbe, új információkba így is nagyon könnyen belefuthatunk: a Lezsák Sándor vejének résztulajdonában álló, az MTVA által is gyakran foglalkoztatott médiavállalkozás, a Dextramedia Kft. honlapja például egy olyan IP-címen van, amelyen ugyancsak felsorakozik a teljes HVIM-repertoár a hvim.hu-tól a toroczkailaszlo.hu-n át a zagyvagyula.hu-ig:

Domaintools

Ha még mélyebbre akarunk ásni, akkor pedig érdemes elővennünk a másik általunk elég gyakran használt eszközt, a Domaintoolst. A szolgáltatást regisztráció után egy hétig ingyen lehet használni, utána viszont havonta 50 dollár, egészed addig, amíg le nem mondjuk.

A Domaintools leghasznosabb szolgáltatása a Whois Lookup, azon belül pedig a Whois History, amely egészen a kezdetektől megmutatja például azt hogy kik regisztrálták be a domaint, kik használták, hogy kik intézték a technikai ügyeit. A magyar oldalaknál hasznos domain.hu-n csak a jelenlegi tulajdonost és technikai kontaktot láthatjuk.

A Whois Lookup-al emellett bármilyen domain tulajdonosának utánanézhetünk, lehet a vége .com, .tv, vagy .hu, és az se jelent akadályt, ha az oldal időközben megszűnt.

Összességében az a legjobb, ha mindhárom szolgáltatást együtt használjuk, tehát a domain.hu-t, a robtex.com-ot, és a Domaintoolst. Alapinformációkhoz elég az első kettő – a domain.hu-n telefonszámokat is találunk, amely abban az esetben igen hasznos lehet, ha meg akarjuk keresni az illetőt, főleg, ha a keresett személy máshol nem elérhető, az e-mail címe például nem nyilvános, és nem érhető el a közösségi portálokon.

Így találtunk rá például egy rejtőzködő HVIM-es vezető elérhetőségére is, akit hiába kerestünk mindenhol, telefonszámot sehonnan sem kaptunk. A domain.hu-n viszont az egyik HVIM-közeli alapítványnál az ő telefonszáma szerepelt, így végül mégis sikerült készíteni vele egy rövid interjút.

Oroszi Babett

adatujsagiras.atlatszo.hu (CC BY-NC-SA 2.5)