Názorová propast mezi mladými muži a ženami se nejspíše nezvětšuje, velké jazykové modely se nezlepšují překvapivými skoky a časové zóny jsou zdroj zmatku, ne pořádku. Newsletter, který dělá svět složitějším.
Jsme Samizdat, datový tým Českého rozhlasu. A v únoru jsme se přehrabovali v datech z výzkumů.
Opět se vracíme ke značce „Rozděleni…“, tentokrát Evropou. Před květnovými volbami do Evropského parlamentu se díváme na to, co si Češi a Češky myslí o Evropské unii. Dříve jsme o slůvku „Rozděleni“ pochybovali a v případě loňského seriálu o konspiracích od něj dokonce upustili, teď však sedne: „Sociologové z analytického ústavu STEM identifikovali dvě pětiny Čechů, kteří jsou v různé míře prounijní, další dvě pětiny tvoří ti, kteří smýšlejí protiunijně a jedna pětina má z EU smíšené dojmy.“ Schválně zkuste v rychlém testu sami zjistit, do které skupiny patříte.
Klára Filipová vyšila longread o tom, co trápí české novináře a novinářky. Je to chmurné a to možná nejchmurnější je, že zvlášť nešťastní jsou ti nejmladší. Protože my staří tady nebudeme věčně.
Honza Cibulka připravil několik dílů Antiviru: o online tržištích, sňatkovém podvodnictvu a virech ve falešném softwaru.
Vyšel nový díl Datařů, Honza Boček v něm zpovídá jednu z nás, vizuální novinářku Kristínu Pšorn Zákopčanovou. Kristi je legenda oboru, a to má přinejmenším tři čtvrtiny kariéry před sebou.
V minulých týdnech na internetu nešlo nepotkat grafy Financial Times údajně dokládající prohlubující se ideologickou propast mezi konzervativními mladými muži a pokrokově smýšlejícími mladými ženami. Jen mírně hlubší pohled do podkladových dat ale napovídá, že jde o bulšit:
- Ve srovnání s 90. lety se u mužů i žen zvýšila pravděpodobnost, že se označí za liberálně smýšlející. 2. U žen je tato pravděpodobnost o 5 až 10 procentních bodů vyšší. 3. Nemáme důkaz o tom, že by se tento rozdíl mezi pohlavími zvyšoval.
34 programátorských oříšků souvisejících s existencí časových zón: někde zóny neodskakují po celých hodinách, různé regiony přecházejí na letní čas v různé dny a některé vůbec, některá města leží ve dvou zónách. Krása střídá nádheru.
Ars Technica přináší zábavné shrnutí paperu Does GPT-4 Pass the Turing Test?. Co je na tom zábavného: zhruba třetině lidí se v Turingově testu nepodařilo druhou stranu přesvědčit, že jsou skutečně lidmi, nikoliv chatující umělou inteligencí. A překvapivě dobře si vedl víc než půl století starý chatbot ELIZA. Jak je to možné?
Za prvé, ELIZA odpovídá zdrženlivě. Na jednu stranu to sice může působit, že jí moc není do řeči, na druhou stranu se díky tomu neprozradí nějakou nepřesností či naopak obskurní znalostí. Za druhé se ELIZA projevuje jinak než dnešní AI-asistenti, kteří se snaží být nápomocní, přátelští a výřeční. A nakonec někteří účastníci konstatovali, že byla ELIZA prostě „moc špatná“ na to, aby šlo o AI chat, a tak došli k závěru, že si nejspíš píšou s člověkem, kterého test nebaví.
Ještě jedno zkoumání velkých jazykových modelů a jejich takzvaných emergent abilities, tedy překvapivých nových schopností nových a větších verzí. Skokové zchytřování se patrně neděje, nárůst schopností je plynulý a do jisté míry předvídatelný, pouze jsme schopnosti modelů měřili příliš hrubými testy.
Na Voxu vyšel medailon datařské-ish skupiny Samotsvety. Oni to jsou tedy forecasteři, k jejich relativně přesným předpovědím jim ale pomáhají data či lépe řečeno dobrá práce s čísly.
Styděla jsem se, nemám dost důkazů, nepamatuju si to: Michal Škvrňák zvizualizoval vzorce v odpovědích výzkumu Proč jsme to nenahlásily*i.
A nakonec pár slov k jedné kritice projektu Společnost nedůvěry, který loni na jaře zkoumal vztah Čechů a Češek ke konspiračním teoriím, a na kterém jsme se podíleli. Filozof Václav Bělohradský v Salonu Práva argumentuje, že „[k]ultura radikální nedůvěry v systém, jež inspiruje občanský aktivismus v západních zemích od vzpurných šedesátek, je […] nepřímo označena za patologický stav mysli, který se může rozšířit jako epidemie a rozvrátit celou společnost.“ A ptá se, „proč by ztráta důvěry v aparáty systému nemohla být příležitostí k osvobozující revoluční změně.“
Padre Bělohradský v textu nezmiňuje jeden podstatný rys našeho výzkumu. Ten se nezabýval věcnou kritikou „systému“, která by mohla vést k nějakému emancipačnímu pohybu, například kritikou majetkových nerovností či likvidace přírodních zdrojů. Výzkum sledoval specificky příchylnost k teoriím o tajemných spiknutích v pozadí událostí či k přesvědčení, že vláda pevné ruky může být lepším uspořádáním než demokracie. Jistě, i z toho lze uvařit revoluční polévku, ale těžko věřit tomu, že by samotnému Bělohradskému chutnala. Zároveň zůstává k zamyšlení, zdali právě konspirační teorie nejsou brzdou oněch osvobozujících revolučních změn. Kdo spadne do díry řízeného nahrazování obyvatelstva migrací a smrtícími vakcínami, obvykle pak už není příliš efektivní v prosazování progresivních daní nebo omezování moci oligarchů.
V podobném duchu se mimochodem nese také mnohem širší i hlubší polemika, kterou v Salonu s Bělohradským krátce před rozesláním newsletteru vede Alice Koubová: Bezpečný prostor radikální nedůvěry.
Michal Kašpárek mluvil o práci s velkými jazykovými modely v PAQ Research. Přimělo ho to nahodit na GitHub pár sešitů s experimenty se 7B lokálními modely, kterým zadává vždy stejné sady úkolů. Jako nejšikovnější z doposud testovaných se jeví být mistral-openorca, který na některé typy úloh dává přijatelné odpovědi i v češtině. I tak je to ale pod schopnostmi GPT-3.
Honza Boček se vrací k datové detektivce o reexportu léků, Michal k české kinematografii, konkrétně k již třicetileté ceně Český lev.
Za celý tým Samizdatu, datového týmu Českého rozhlasu, přeje hezký březen, měsíc internetu
Michal Kašpárek
PS: Nezapomeňte, že 31. března se mění čas z CET neboli GMT+1 na CEST neboli GMT+2.
Úvodní obrázek jsme vygenerovali ve Stable Diffusion promptem „Czech female journalist dying from exhaustion, bar charts and pie charts all around, abstract, weird dream, bird eye lens, ilford 800, high key, high energy“