Jak žít do sta, anebo se aspoň nezrakvit na kole? Jeden by řekl, že na to jsou přece data. Jsou. Jenže zkreslená podivuhodnými silami.
Třikrát se obrací Rio Pecos a pak stojí na jejím levém břehu kůl. Anebo možná ne – nevíme, nejsme Apačové, jsme Samizdat, datový tým Českého rozhlasu. Víme jiné věci, tady jsou:
Byly volby. Jan Boček a Petr Kočí spolupracovali s Jakubem Grimem na sérii článků o politickém milieu v jednotlivých krajích. Chronologicky: Středočeský, Jihočeský, Plzeňský, Karlovarský, Ústecký, Liberecký, Královéhradecký, Pardubický, Vysočina, Olomoucký, Jihomoravský, Zlínský, Moravskoslezský.
Honza Boček krom toho s Kristínou Pšorn Zákopčanovou krásně zrekapitulovali fungování dosavadních senátů a také zkoušel získat studii, na základě které vláda spolu s Jihomoravským krajem a brněnským magistrátem rozhodly o podpoře MotoGP. Na konci září se výzkumníka Lukase Blinky ptal na rizikové používání sociálních sítí a hraní mezi adolescentstvem.
Ještě k volbám: před nimi jsme ukázali kandidáty, po nich výsledky na mapách a krále preferenčních hlasů.
Taky byly povodně. Honza Cibulka připravil mapu rozlivu, Klára Filipová psala o zatopeném pozemku pro gigafactory.
Ještě od Cíby: interaktivní klikačka, která pomůže výzkumníkům z Ústavu státu a práva Akademie věd a Právnické fakulty Univerzity Karlovy zmapovat, jak vážně veřejnost vnímá různé druhy krádeží. Dále od Kláry: longread o hořící Heřmanické haldě.
Bóča si do Datařů pozval Michala Šindeláře, sociologa a cykloaktivistu. Ten v září publikoval výzkumnou zprávu Sebereportovaná a oficiální nehodovost s účastí jízdního kola (PDF) a zdravou skepsi k oficiálním statistikám my rádi. Ukazuje se, že policejní evidence nehodovosti kol je jednak velmi děravá, jednak zavádějící: jako samonehody totiž označuje i ty pády, ke kterým přispěli lidé v autech znalí triku, že stačí ujet. Děsivá je pak část popisující úmyslné využívání vozu jako zbraně.
Cíba pak mluvil s Kristinou Vejnbender z Investigace.cz o infrastruktuře ruských dezinfo webů.
Potěšilo nás, že letošní Ig Nobelovu cenu za demografii obdržel Saul Justin Newman. Upozorňuje totiž na to, jaký bordel je v datech o dlouhověkosti, zvlášť těch o obyvatelstvu takzvaných modrých zón, tedy Okinawy a některých italských a řeckých regionů. Vybombardované či jinak narušené archivy + pobídky k podvádění penzijního systému = spousta „stoletých“. (Moravským průkopníkem na tomto poli byl Vladimír Menšík, alespoň tak praví taktéž nepříliš spolehlivý zdroj, tedy vyprávění jeho již mrtvých hereckých kolegů.) Newmanovu práci shrnuje rozhovor na The Conversation, do hloubky jde původní paper Supercentenarian and remarkable age records exhibit patterns indicative of clerical errors and pension fraud.
K tématu se volně váže kniha Davida Handa Dark Data, kterou jsme sice zatím nedočetli, ale už prvních pár kapitol dává důvod k doporučení. Poukazuje na časté problémy s (ne)úplností dat a ukazuje, jak se s nimi dá popasovat.
Ještě jednou chybějící a zkreslená data: německý staťák má několikaměsíční výpadek v dodávce mnoha důležitých ukazatelů.
V Nature vyšel článek o tom, jak vědci a vědkyně využívají malé jazykové modely, které lze rozběhnout na víceméně běžném laptopu a ještě si tím člověk takhle při podzimu příjemně zatopí. V LM Studio (pokud neumíte/nechcete s příkazovou řádkou) nebo v Ollama si můžete pohrát třeba s llama3.1. Shodou okolností jeden z posledních dílů podcastu Talk Python to Me připomíná, že tu vedle LLMs už deset let máme šikovné nástroje pro zpracování přirozeného jazyka, které umí analyzovat texty, aniž by při tom uvařily počítač nebo propálily stovky dolarů za tokeny.
K diskusi: Vennův diagram smíšených emocí.
Narazili jsme na tři roky starou, zato však volně dostupnou a veskrz inspirativní publikaci Scientific Visualization: Python + Matplotlib. Doporučujeme především kvůli příkladům přesahujícím do generativního umění. Kód přiložen.
Nostalgické okénko tentokrát obstará především Carl Svensson. V příspěvku Cosy Computing líčí jistou svátečnost, která byla zhruba do 90. let spojená s používáním domácích počítačů, a kterou umocňovaly už zapomenuté smyslové vjemy: listování disketami, ťukání do kláves s vysokým zdvihem, všechna ta „plomp“ a „vzů“, která vyluzovaly monitory. V zápisku Stupid Slow se pak bystře zamýšlí nad frustrující zkušeností, že na přepnutí chatů v Teamsech čekáme na nových strojích (přinejmenším subjektivně) déle než na podobné operace kdysi dávno na Amize: „Staré domácí počítače byly pomalé pouze při úkonech, kdy jsme to od nich dopředu čekali. Dnes se situace zdá být přesně opačná.“
Sváteční pro některé z nás v devadesátkých byly i návštěvy rodinných známých majících televizi s teletextem; James O’Malley popisuje svoji práci na jeho záchraně ze starých videokazet.
A nakonec věc, která se dat dotýká víc, než by se na první pohled mohlo zdát: i váš byt, dům či chalupa si zaslouží dokumentaci.
Za Samizdat, datový tým Českého rozhlasu přeje líbezný říjen Michal Kašpárek
Ilustrační obrázek jsme opět vygenerovali ve Stable Diffusion, tentokrát rekordně krátkým promptem „Rio Pecos, glitch art“.