# 18/19: Stín katedrál, JSON co si k ránu dávám zdát

1. července 2024
# 18/19: Stín katedrál, JSON co si k ránu dávám zdát

Víme, kam slunce nesvítí, a milerádi vás tam pošleme.

Jsme Samizdat, datový tým Českého rozhlasu. A tenhle newsletter už bude dílem letní: najdete v něm mapu stínů nebo inspiraci pro datovou analýzu vaší prázdninové lásky.

Napsali jsme

Honza Boček získal od Ministerstva vnitra podrobná a aktuální data o jménech, které toto ministerstvo přestalo už před několika lety publikovat, a pohledal v nich vlastní jména zmizelá. Vedle obligátního Adolfa, na jehož svátek článek vyšel, se vytratila i defaultně zdrobnělá ženská křestní. Což je v pořádku, protože odsoudit dceru k celoživotnímu žoviálnímu oslovování Jiřinko nebo Alenko je perverzní.

Hugo a Emilie se vrátili a jsou silnější než kdy dřív.

Pak se Bóča vrátil ke svému evergreenu: dostupnosti léků. Vypíchnout si zaslouží tip na eRecept PACIENT, webovou a mobilní aplikaci, která umí vyhledat léky z vašeho receptu ve skladových zásobách lékáren v okolí. Není to bez much (data nejsou úplně real-time a krabičky si taky mohl někdo zamluvit po telefonu), ale pořád mnohem lepší než obcházet apatyky naslepo.

Honza Cibulka sleduje dvě doméno-squatterské kauzy: Albert i Elektrárna Chvaletice prozatím u soudů vyhrávají nad aktivisty, kteří jejich názvy používají v doménách kritizující jejich byznysy. A protože je Cíbovým velkým tématem, jak ani v těchto newsletterech nelze přehlédnout, ochrana soukromí, pověnoval se i unijnímu plánu na automatickou kontrolu nelegálního obsahu v chatovacích aplikacích, včetně těch šifrovaných.

Růst cen potravin se zastavil, některé dokonce zlevnily, píše Tomáš Jeník s datovým přispěním Petra Kočího.

Hostovali jsme

Michal Kašpárek si tentokrát na to, že to jde s internetem k horšímu, nestěžuje na internetu, ale na papírových stránkách červnového Hostu.

Klára Filipová zavítala na rojzařený web Page Not Found s reportáží z ostravské kolonie Bedřiška. Je v ní všechno, co jste kdy chtěli vědět o finských domcích, ale nenapadlo vás se zeptat.

Vyzpovídali jsme

Honza Boček si do Datařů pozval dva digitální archeology: Petra Pajdlu, manažera rozvoje služeb Českého archeologického informačního systému, a Jana Koláře, který působí na UCL Institute of Archaeology. Díky datům víme, že minulost byla složitější, než se nám dřív zdálo, shodují se pánové, za jejichž nehty na rozdíl od dalších archeologů hlínu nenajdete.

Přečetli jsme

Je snadnou – a stále věříme, že ne neužitečnou – datovou disciplínou počítat, kolik přišlo do televizních diskusí žen, jestli o důchodové reformě mluví ve zprávách i někdo jiný než kravaťáci z fondů a tak podobně. „Předat mikrofon druhému jeho poníženou pozici nevylepší,“ přetlumočuje mediální teoretik Jan Motal postřehy amerického filozofa Olúfémi O. Táíwò k tématu. I kdyby do Otázek Václava Moravce přišel mluvit „řadový dělník z Kovolitu“, napřed by prošel sítem dramaturgie a ve studiu pak přijal komunikační styl ostatních, hlavně žádné drama a nic radikálního. Řešení: „přestat se soustředit na to, koho zveme do místnosti a otočit náš pohled na místnost samotnou“.

Teresa Ibarra si se svým expřítelem vyměnila 80 tisíc zpráv, které pitvá v datové analýze. Ačkoliv jde o docela banální rozbor intenzity a obsahu, stal se virálním – vyvozujeme z toho, že málokoho napadne takovou věc udělat. Přitom je to skvělý projekt pro začínající a mírně pokročilé datařstvo. Snad všechny chatovací platformy umožňují export zpráv a na těch datech si pak lze osahat ledasco: analýzu časových řad i sentimentu, knihovny pro zpracování přirozeného jazyka, regulární výrazy nebo třeba generování word cloudů jako v roce 2012. Hlavně ale potrénujte práci se souborem .gitignore, ať vedle grafů neskončí někde vyvěšený i JSON s kompletní konverzací.

Mimochodem – z toho exportu zpráv si také můžete vysázet papírovou knihu.

Komunity držely nejvíc při sobě, když lidi chodili na základku, nejlepší hudba vycházela kolem jejich osmnáctých narozenin a nejkoukavější sportovní utkání se úplnou náhodou odehrávají v mladé dospělosti: datový tým Washington Post vizualizoval tvar nostalgie na odpovědích z průzkumu YouGov.

Přiléhavým titulkem „Chaos v médiu“ uvozuje Amy Goodchild své zkušenosti s výrobou grafů a jiných vizuálů na plotteru štětci a vodovkami. Ještě větší chaos: James Steinberg sestrojil robota, který háže z okna lidem na hlavy čepice.

Český statistický úřad změnil metodiku určování osoby v čele domácnosti ve svém šetření Životní podmínky. Fascinující je, že jí dosud byl automaticky muž, tedy pokud byl v domácnosti přítomný. Nově se hlavou domácnosti stává ten či ta, kdo má nejvyšší podíl na rodinných příjmech. „Se změnou definice logicky vzrostl počet žen v roli osoby v čele. K situaci, kdy žena nahradila muže, došlo v 518,2 tis. domácností.“ Gratulujeme!

Vyzkoušeli jsme

Ať už vás v tropickém dni čeká cesta městem na úřad, nebo procházka z pláže na večeři, hodí se mapa stínů. Skvělá věc. Stín na ní vrhají nejen budovy, ale i stromy.

Kolem poledne do a z Rozhlasu raději po jižní straně Vinohradské.

Krisztina Szucs má pěkný nástroj pro skicování proporcionálních plošných grafů.

Rahul Ilango z MIT zhotovil pěkný interaktivní vysvětlovák vybarvování map – s důrazem nikoliv na barvy samotné, ale na matematiku za jejich potřebným počtem.

Uvidíme se

Datový pohled na českou kinematografii představí koncem července na Letní filmové škole v Uherském Hradišti Petr Kočí a Honza Boček. Nevyhlížejte tou dobou ve svých schránkách další Datažurnál – i newsletter si dopřeje dovolenou, těšit se na něj můžete na konci srpna.

Za Samizdat, datový tým Českého rozhlasu přeje krásné léto
Michal Kašpárek

Ilustrační obrázek jsme vygenerovali ve Stable Diffusion promptem „A cathedral on the shore in Dalmatia. Sharp sunlight, a record heatwave, long shadows on a paved street, high contrast, high energy. Black and white ink illustration in the style of synthwave“. Stable Diffusion ani DALL-E si mimochodem zatím neumí moc poradit se základní geometrií toho, co má vrhat jaký stín a kam.