# 15: Voláme všechno pirátské archivářstvo

28. března 2024
# 15: Voláme všechno pirátské archivářstvo

Větší než malé množství mediální nostalgie – a jak ji mít za 20 let čím nasytit.

„Březen je nejpilnější měsíc na zahradě, která se má připraviti na příchod jara,“ píše Karel Čapek v Zahradníkově roku. Jenže my nejsme Karel Čapek, my jsme Samizdat, datový tým Českého rozhlasu, a na příchod jara jsme se obstaráváním a čištěním dat chystali přinejmenším od Vánoc. Nabídněte si našich plodů.

Napsali jsme

Honza Boček odvysílal druhou sezonu svojí datové detektivky o nelegálních přeprodejích léků do zahraničí. Vizualizovala Kristína Pšorn Zákopčanová:

"Léky na recept s nejsilnějším podezřením na nelegální reexport"

Klára Filipová investigovala spolu s Tomášem Pikou a Honzou Cibulkou stavbu gigafactory u Dolný Lutyně. Kontext dodává úvodní článek Stát chce na Karvinsku gigafactory za 200 miliard. Místo není pro průmysl vhodné, ozývá se od starostů, pak následují aktuality o dalším vývoji: ministerstvo jednalo s ochranáři o vycouvání z dohody, na čemž se s nimi pak i dohodlo, zároveň se řeší výkup pozemků.

Honza Cibulka s Janou Magdoňovou dál připravují Antivirus: dávat fotky dětí na sítě je mírně řečeno problematické, i když vám to samy děti dovolí. Cíba se též vrátil k již pozapomenutému, leč důležitému tématu: Blokování dezinfowebů je v pořádku, tvrdili ministři. Podle soudu ale šlo o porušení evropských pravidel , i zde ve spolupráci s Tomášem.

Michal Kašpárek vyšťáral kuriozity z 30 let Českých lvů. Například slova z popisů děje, která jsou nejspolehlivějšími prediktory Lva za nejlepší celovečerní hraný film: „Žid“, „zabitý“, „jíst“, „rozhlas“. Za Rozhlas děkujeme!

Nachystali jsme

Na apríla se na iROZHLAS.cz dozvíte, zda z Těšína skutečně vyjíždí vlaky co čtvrthodinu.

Vystoupili jsme

Klára přišla povídat o své práci do podcastu Stošestka.

Přečetli jsme

They don't know I have 100s of TBs of books on LTO-9 tapes

Staňte se pirátským archivářem či archivářkou, nabádá pirátská archivářka Anna. Třeba jste to právě vy, kdo může zachránit cenná data či obsahy pro příští generace. Návod je to stručný, ale zároveň jak praktický, tak vzrušující. Konkrétnější a techničtější pokračování: jak provozovat stínovou knihovnu.

Jen tak mezi námi: pokud nějaký takový pirátský archiv máte, budeme rádi, když nám o něm dáte vědět, třeba bychom z něj dokázali uvařit hezký datový článek. Můžou to být záznamy televizního vysílání, databáze sportovních výsledků, katalogy zboží… – ostatně právě jeden takový archiv nám pomohl napsat o proměnách intervalů mezi spoji brněnské hromadné dopravy.

Volně s tím souvisí pravidelné okénko mediální nostalgie, v tomto případě možná spíš retrofuturismu: The Verge píše o rozkvétající scéně disketové muziky. (Kdyby vás to taky napadlo hledat: balík deseti disket se v našem největším online obchodě prodává za 799 korun. Mají kladné recenze: „da sa z nich urobit perfektny low cost fileter na fotak a sledovat zatmenie slnka 20. 3. 2015“.) A lidé z The Bloop Museum se dělí o zkušenosti se záchranou dat ze 40 let staré diskety i o tipy na nástroje.

Tím nostalgické okénko nekončí: o tom, že to jde s internetem do háje, tentokrát píše Edward Zitron. Mimořádným dělá tohle konkrétní štkaní kvanta odkazů na další zdroje. Ukazují podobným směrem: naše schopnost zorientovat se v takovém množství informací byla už tak příliš závislá na algoritmech velkých technologických firem, v kombinaci s AI generující tuny spamu jde o vyloženou pohromu. („Degenerativní AI“ je hezké, byť problematické sousloví.)

Stejné téma z jiného úhlu: Jak špatné jsou výsledky hledání? Srovnání Googlu, Bingu, Marginalie, Kagi, Mwmbl a ChatGPT.

Několik z vás posledně zaujal článek o programátorských mýtech o časových zónách. Milý čtenář J.J. poslal odkaz na kurátorovaný seznam programátorských omylů.

Když máte cukrovku prvního typu, může vám datařina zachraňovat kejhák.

Poslechli jsme

Výběr čtení tíhnul k archivařině, jiné to nebude ani u tipu na poslech: podcast An Archivist’s Tale má pěkný díl s Geirem Walderhaugem, archivářem Univerzity v Oslu. Přemítání nad spolehlivostí archivů není nikdy dost. Byť na rovinu přiznejme, že jen v málu podcastů moderátoři říkají „to je ale zajímavé!“ na věci, které přijdou zajímavé tak malé skupině lidí.

Školili jsme

Michal s Cíbou naněkolikrát ukazovali velké jazykové modely kolegům a kolegyním z Rozhlasu.

Vyzkoušeli jsme

Pokud se pustíte do zálohování internetu do své špajzky, hodit se může commandlajnová utilita Monolith. Webovou stránku uloží jako jeden jediný soubor HTML, včetně obrázků nebo skriptů, takže pro budoucí pokolení zachová třeba funkční grafy v HighCharts a podobně. Do kódu decentně doplní informace o zdroji a času uložení. S videi z YouTube a singly ze SoundCloudu jsme nepochodili, ale od toho tu je yt-dlp, případně jeho forky pro specifické weby.

Za Samizdat, datový tým Českého rozhlasu přeje jaro čapkovské a ne kafkovské
Michal Kašpárek

Obrázek jsme vygenerovali ve Stable Diffusion promptem „A person with a floppy disc instead of a head, black and white illustration“.