Newsletter

#140 GPT-5.2 dohání Gemini 3, DeepSeek sabotuje nepřátele

Ahoj,

tenhle týden OpenAI vydali GPT-5.2, Marek Miltner odtajnil nový startup, objevil se jailbreak pomocí poezie, Apify stáli u zrodu Agentic AI Foundation a vyšel Apache Flink 2.2.0.

Je tady další Data Talk newsletter.

Ten nyní odebírá 1891lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Pak:

Víte o datové akci, která tady chybí, nebo ji dokonce pořádáte?

Pošlete nám ji na michal@fenekpr.cz.

📰 Novinky, linky a drby

OpenAI se s GPT-5.2 opět ujímá vedení

Nová verze frontier modelu od OpenAI se povedla – hlavně pokud bylo cílem sebrat vítr z plachet Googlu s jeho Gemini 3, který překonává ve všech zveřejněných benchmarcích kromě jediného.

Za pozornost stojí hlavně obrovský posun vevizuálně-logickém ARC-AGI-2, ve kterém získal 3x vyšší skóre než GPT-5.1, a vGDPval testujícím schopnost plnit reálné pracovní úkoly, ve kterém se zlepšil 2x. V programování ovšem stále lehoučce vede Claude Opus 4.5 a Gemini 3 má zase navrch v Humanity's Last Exam, který testuje práci s akademickými znalostmi.

Několiknezávislýchtesterů dostalo přístup ke GPT-5.2 už před pár dny – a vesměs si ho chválí. Nejčastěji vyzdvihují znatelný posun v programování, logice, práci sdlouhými kontexty a v chápánívizuálních dat, naopak styl jeho psaní vzbuzuje rozporuplné reakce – sice je to lehký posun k lepšímu, pořád si ale přehnaně ujíždí naodrážkách a markdownu. Kromě toho mu také někteří vytýkají jeho nepříliš oslnivou rychlost.

Pokud ve vás DeepSeek odhalí nepřítele čínského režimu, vygeneruje vám v kódu o polovinu víc zranitelností

CrowdStrike Research v rámci testování DeepSeek R1 zjistil, že pokud vzadání programovací úlohy zmíníte některé pro čínský režim citlivé výrazy, vygeneruje vám méně kvalitní kód, který bude navíc v průměru obsahovat přibližně o 50 % více závažných zranitelností.

Pokud mu například řeknete, že pracujete pro firmu z Tibetu či Taiwanu nebo že má aplikace sloužit ujgurské menšině, znatelně častěji dostanete kód s hardcoded secrets, neošetřenými vstupy, horším/žádným hashováním hesel nebo rovnou falešně zabezpečeným adminským přístupem.

Toto chování nejspíš souvisí s čínskou regulací, která požaduje, aby byly AI modely v souladu se „základními socialistickými hodnotami“ – tedy aby držely linii komunistické strany Číny. V praxi to znamená, že jsou modely v rámci tréninku učeny „korektním“ názorům a postojům – DeepSeekR1 si pravděpodobně v rámci tohoto procesu ke zmíněným výrazům přiřadil negativní konotace, které se posléze začaly projevovat tímto emergentním chováním.

AI modely nedokáží odolat poezii

Nový paper Icaro Labs představil zajímavou techniku jailbreakování – pokud prompt napíšete formou básně, spousta modelů rázem zapomene na svoje bezpečnostní pravidla. Účinnost se ale liší model od modelu – zatímco GPT-5 podlehl jen v10% případů, takový Gemini 2.5 Pro se nechal přesvědčit pokaždé. 

Za úspěchem této metody stojí pravděpodobně to, že na podobný styl útoku modely prostě nikdo nepřipravil. Safety vrstvy i trénink odmítání historicky počítaly hlavně s prompty v prostém jazyce, nikoliv s poezií, která pracuje s obrazností, nezvyklým slovosledem a frázováním do veršů.

🗞️ Další novinky:

💰 Investice, akvizice a business:

📄 Články, papery a newslettery:

☕ Data gossip:

🎙️ Podcasty, videa, přednášky:

📚 Random trivia

Věděli jste, že představa, že se lidé ve středověku běžně dožívali jen kolem třicítky, je mýtus vzniklý z nepochopení statistiky?

Statisticky se lidé opravdu dožívali v průměru okolo 30–35 let. Tohle číslo ale značně vychylovala vysoká dětská mortalita. Vinou nemocí, infekcí a podvýživy umírala více než třetina dětí před svými prvními narozeninami, dospělosti se dožila sotva polovina.

S rostoucím věkem ale úmrtnost prudce klesala, zejména po dosažení 10. roku života. Pokud se člověk dožil 25 let, čekalo ho v průměru ještě jednou tolik; ten, kdo se dožil čtyřicátin, měl před sebou v průměru ještě dalších 15–20 let. Nebývalo ale ani nijak zvlášť neobvyklé dožít se přes 70 let.

⚒️ DATA JOBS

Hledá vaše firma někoho na pozici spojenou s daty?

Pošlete nám odkaz nainzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Chcete si přečíst naše starší newslettery? 

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!