Dále v newsletteru: dvě užitečné knihy, nástroj pro generování diagramů z textových popisů a samozřejmě naše články.
Jsme Samizdat, datový tým Českého rozhlasu. A jak se zpívá v letošním letním hitu: víme, že jsme vám chyběli. (Ze stanic ČRo jej nejvíckrát hrála Dvojka, ačkoliv bychom tipovali Wave.)
Honza Cibulka se u Ústavního soudu domohl svého práva na informace o životním prostředí – Zeměměřičskému úřadu tedy nemusí zaplatit tři miliony korun za digitální model reliéfu Česka (DMR 5G). Za jakých konkrétních podmínek získá přístup k datům, která využijeme k modelování dopadů klimatické změny, o tom znovu rozhodnou správní soudy. Tentokrát však už budou vázány vstřícným přístupem soudu ústavního.
Cíba vůbec zaznamenal úrodné léto: psal o zbytečně velké datové stopě aplikace eDoklady a o dva týdny později i o tom, jak se státní agentura DIA snaží tuto stopu zmenšit. Nadále sledoval svoje kauzy centrální evidence ubytovaných a soudního vypínání aktivistických webů. Neutichl ani pořad Antivirus: Jak vznikají podvodná deepfake videa, Jak nenaletět internetovým podvodníkům, Na robotického lékaře se spolehnout nedá.
Klára Filipová hledí k zemi: psala o mizení orné půdy, o snaze obejít posouzení vlivů na životní prostředí při přípravě dolnolutyňské gigafactory a o důsledcích půdní eroze.
Honza Boček pomáhal na svět článku Anny Košlerové o nárůstu počtu dětí s poruchami příjmu potravy a článku Nikol Pisoňové a Lucie Farkašové o tom, jak řídí alkohol.
Nakonec praktická hříčka pro ty, kteří hledají jméno pro dítě, a zároveň nepraktická hříčka pro všechny ostatní: popularita 41 tisíc jmen za posledních 125 let.
Mermaid umí generovat diagramy z lidsky srozumitelných („Markdown-like“) popisů.
U knihy Python Web Scraping Cookbook od Michaela Heydta člověku běží před očima všechny ty hodiny, kdy se učil získávat data z webových stránek metodou pokus-omyl a googlováním zákysů na StackOverflow. Dobře uspořádaný a srozumitelný návod vás provede od úplných základů přes scrapování dynamicky generovaných stránek až po vytváření aplikačních rozhraní pro zbytek organizace či pro klienty. Kniha vyšla už před šesti lety, ale žádná revoluce v oboru od té doby nenastala.
Scrapování je jedna cesta k datům, další jsou hacky a leaky. Jak s nimi pracovat, radí Micah Lee z The Intercept v knize Hacks, Leaks, and Revelations. Zalistovat se do ní můžete zdarma.
Josef Šlerka se na Investigaci povrtal v datech o followerech Filipa Turka na TikToku, neboli o milovnících hranatosti.
Jak staré jsou hlavy vlád a států ve vztahu ke stáří „svých“ národů? Staré, ukazují ve Washington Post. Jediné země s nejvyšším ústavním činitelstvem mladším než mediánový věk populace jsou Itálie, Irsko a Černá hora.
V Bloombergu vizualizují haldy sutě, na kterou města v Gaze proměnilo izraelské bombardování.
Metapříspěvek k olympiádě: jak vizualizovat a vlastně i počítat žebříčky nejúspěšnějších států?
Z cyklu smějeme se umělé inteligenci: vizuální modely GPT-4o, Gemini 1.5 Pro nebo Sonnet-3.5 selhávají v úkolech pro prvňáčky, jako je počítání jednoduchých tvarů a jejich průniků. V jiných oblastech mohou být schopnosti stejných modelů impresivní, je ale dobré pamatovat na to, že tu ve stroji nemáme lidský mozek a lidské oči.
V srpnovém čísle Labour Economics píší tři čeští ekonomové o efektu zvýšení rodičáku na participaci žen na trhu práce. Výsledky signifikantní – a nepřekvapivé.
Proč nepoužívat krabicové grafy a čím je nahradit.
Kate Crawford a Vladan Joler se pokusili vměstnat půl milénia vědeckotechnického pokroku do cosi-jako-rodokmenu.
Sklenka vína pro zdraví? Prdlajs, připomíná longread v The Slate. Z datově-novinářského pohledu není zajímavý ani tak tématem samotným jako výčtem všech chyb v úvaze, které k doporučování decky nebo dvou červeného vedly, a které se u jiných témat stále opakují.
Když už se motáme kolem klamu přeživších… V self-help literatuře ale i knihách různými způsoby spojenými s daty se často objevuje obrázek „poďobaného“ letadla s prostřílenými křídly, který doplňuje již všeobecně známá anekdota: pakliže to do těchto míst schytaly bombardéry, které se vrátily na základnu, opancéřovat namísto nich potřebovaly ty části trupu, které byly bez průstřelu, neboť právě zásahy do nich sundávaly stroje z oblohy. Bajka je to jistě inspirativní, ale na aeronautickém webu Hush-Kit píší, že vybájená.
Komu v literárním průmyslu umělá inteligence usnadní práci a komu ji vezme? S Evou Nečasovou a Ditou Malečkovou o tom bude v Knihovně Václava Havla jako třetí panelista 18. září diskutovat Michal Kašpárek.
Za datový tým Českého rozhlasu přeje bezva září Michal Kašpárek
Ilustrační obrázek jsme opět vygenerovali ve Stable Diffusion, tentokrát promptem „Chickenpox bomber diagram, survivorship bias“.