DATA talk Newsletter #140 GPT-5.2 dohání Gemini 3, DeepSeek sabotuje nepřátele

#140 GPT-5.2 dohání Gemini 3, DeepSeek sabotuje nepřátele

Ahoj,

tenhle týden OpenAI vydali GPT-5.2, Marek Miltner odtajnil nový startup, objevil se jailbreak pomocí poezie, Apify stáli u zrodu Agentic AI Foundation a vyšel Apache Flink 2.2.0.

Je tady další Data Talk newsletter.

Ten nyní odebírá 1891lidí, které zajímají datové technologie, AI a česko-slovenská datová scéna.

Máte memes nebo vtipné obrázky, o které se chcete podělit? Pošlete nám je na michal@fenekpr.cz

📅 Kalendář datových akcí

Příští týden:

Impact Night with Kardi Ai (úterý 16. prosince, Praha)
AI Tinkerers Prague: Annual Christmas Meetup 2025 (úterý 16. prosince, Praha)
Pyvo Prague #175 – Christmas Hardware Edition (středa 17. prosince, Praha)
E2B Christmas Party in Prague (čtvrtek 18. prosince, Praha)

Pak:

AI Predictions 2026 (středa 21. ledna, Praha/online)
Snowflake BUILD Meetup (čtvrtek 22. ledna, Praha)
Prague PostgreSQL Dev Day 2026 (úterý a středa 27. a 28. ledna 2026, Praha)
Machine Learning Prague 2026 (pondělí až středa 4.–6. května 2026, Praha)
WebExpo 2026 (středa až pátek 27.–29. května 2026, Praha)

Víte o datové akci, která tady chybí, nebo ji dokonce pořádáte?

Pošlete nám ji na michal@fenekpr.cz.

📰 Novinky, linky a drby

OpenAI se s GPT-5.2 opět ujímá vedení

Nová verze frontier modelu od OpenAI se povedla – hlavně pokud bylo cílem sebrat vítr z plachet Googlu s jeho Gemini 3, který překonává ve všech zveřejněných benchmarcích kromě jediného.

Za pozornost stojí hlavně obrovský posun vevizuálně-logickém ARC-AGI-2, ve kterém získal 3x vyšší skóre než GPT-5.1, a vGDPval testujícím schopnost plnit reálné pracovní úkoly, ve kterém se zlepšil 2x. V programování ovšem stále lehoučce vede Claude Opus 4.5 a Gemini 3 má zase navrch v Humanity's Last Exam, který testuje práci s akademickými znalostmi.

Několiknezávislýchtesterů dostalo přístup ke GPT-5.2 už před pár dny – a vesměs si ho chválí. Nejčastěji vyzdvihují znatelný posun v programování, logice, práci sdlouhými kontexty a v chápánívizuálních dat, naopak styl jeho psaní vzbuzuje rozporuplné reakce – sice je to lehký posun k lepšímu, pořád si ale přehnaně ujíždí naodrážkách a markdownu. Kromě toho mu také někteří vytýkají jeho nepříliš oslnivou rychlost.

Pokud ve vás DeepSeek odhalí nepřítele čínského režimu, vygeneruje vám v kódu o polovinu víc zranitelností

CrowdStrike Research v rámci testování DeepSeek R1 zjistil, že pokud vzadání programovací úlohy zmíníte některé pro čínský režim citlivé výrazy, vygeneruje vám méně kvalitní kód, který bude navíc v průměru obsahovat přibližně o 50 % více závažných zranitelností.

Pokud mu například řeknete, že pracujete pro firmu z Tibetu či Taiwanu nebo že má aplikace sloužit ujgurské menšině, znatelně častěji dostanete kód s hardcoded secrets, neošetřenými vstupy, horším/žádným hashováním hesel nebo rovnou falešně zabezpečeným adminským přístupem.

Toto chování nejspíš souvisí s čínskou regulací, která požaduje, aby byly AI modely v souladu se „základními socialistickými hodnotami“ – tedy aby držely linii komunistické strany Číny. V praxi to znamená, že jsou modely v rámci tréninku učeny „korektním“ názorům a postojům – DeepSeekR1 si pravděpodobně v rámci tohoto procesu ke zmíněným výrazům přiřadil negativní konotace, které se posléze začaly projevovat tímto emergentním chováním.

AI modely nedokáží odolat poezii

Nový paper Icaro Labs představil zajímavou techniku jailbreakování – pokud prompt napíšete formou básně, spousta modelů rázem zapomene na svoje bezpečnostní pravidla. Účinnost se ale liší model od modelu – zatímco GPT-5 podlehl jen v10% případů, takový Gemini 2.5 Pro se nechal přesvědčit pokaždé.

Za úspěchem této metody stojí pravděpodobně to, že na podobný styl útoku modely prostě nikdo nepřipravil. Safety vrstvy i trénink odmítání historicky počítaly hlavně s prompty v prostém jazyce, nikoliv s poezií, která pracuje s obrazností, nezvyklým slovosledem a frázováním do veršů.

🗞️ Další novinky:

Marek Miltner (AI Tinkerers, ex-Whadoo) odtajnil svůj nový startup PangeAI, který vyvíjí agentní systém, který má přinést revoluci v práci sgeoprostorovými daty a umožnit provádět komplexní analýzy i bez velkého týmu expertů.

CzechInvest spouští dodatečné kolo Technologické inkubace, na podporu růstu startupů vyhradil dalších 100 milionů korun. Každá firma může získat až 5 milionů korun, přihlášky je možné podávat do 9. ledna.

Linux Foundation založila Agentic AI Foundation, jejímž cílem je vybudovat otevřený, neutrální a spolupracující ekosystém pro vývoj agentní AI. Mezi zakládajícími členy jsou vedle Anthropicu, OpenAI, Block, Googlu, Microsoftu nebo Amazonu také čeští Apify.

Vyšel update Apache Flink 2.2.0, přináší možnost volat modely strojového učení přímo v datových pipelinách přes Table API, vektorové vyhledávání veFlink SQL (hodí se pro RAG) a hromadu dalších novinek a vylepšení.

Anthropic přidal do svého rozšíření pro Slack možnost delegovat úkoly naClaude Code přímo v rámci konverzace – stačí tagnout @Claude.

Americký prezident Donald Trump povolil Nvidii prodávat její AI čipy minulé generace H200 doČíny – za podmínky, že odvede 25 % výnosu z těchto prodejů státu.

Mistral vydal Devstral 2, nový open-weights model zaměřený na agentní programování. V benchmarku SWE-bench Verified se sice chlubí výsledkem jen těsně za těmi nejlepšími frontier modely, v nezávislých testech ale vjiných benchmarcích souvisejících s programováním a prací s dlouhým kontextem naprosto pohořel.

💰 Investice, akvizice a business:

Čeští Boost.space, kteří vyvíjí platformu pro centralizaci firemních dat, získali seed investici ve výši 6,5 milionu dolarů a otevírají pobočku v San Franciscu.

Čeští Ataccama, kteří pracují na agentní platformě pro komplexní správu dat napříč firemními systémy, získali investici od Snowflake Ventures.

Digitask Filipa Dřímalky se po drobné právní komplikaci definitivně přejmenoval na Aibility, navíc získal další investici od brněnských Seyfor.

📄 Články, papery a newslettery:

Deepnote Data Deep Dives | DeepSeek’s Olympic gold, Mistral 3 goes Open, Claude Code’s $1B run rate, OpenAI, Anthropic share the state of AI

☕ Data gossip:

Pavlína Vajgarová po 11 letech končí v České spořitelně.

Paul Čejka (ex-CCO Revolt BI) nastoupil do Boost.space jako Head of Sales pro Evropu, Střední východ a Afriku.

Anton Lukin (ex-AWS) začal pracovat pro Google Cloud jako Customer Engineer.

Filip Dřímalka vytvořil vtipné AI Wrapped 2025.

🎙️ Podcasty, videa, přednášky:

Data Talk #164 | Lenka Křenková (MEWS) o propojení světa dat a kyberbezpečnosti

E2B | kurz Building Coding Agents with Tool Execution (zdarma)

📚 Random trivia

Věděli jste, že představa, že se lidé ve středověku běžně dožívali jen kolem třicítky, je mýtus vzniklý z nepochopení statistiky?

Statisticky se lidé opravdu dožívali v průměru okolo 30–35 let. Tohle číslo ale značně vychylovala vysoká dětská mortalita. Vinou nemocí, infekcí a podvýživy umírala více než třetina dětí před svými prvními narozeninami, dospělosti se dožila sotva polovina.

S rostoucím věkem ale úmrtnost prudce klesala, zejména po dosažení 10. roku života. Pokud se člověk dožil 25 let, čekalo ho v průměru ještě jednou tolik; ten, kdo se dožil čtyřicátin, měl před sebou v průměru ještě dalších 15–20 let. Nebývalo ale ani nijak zvlášť neobvyklé dožít se přes 70 let.

⚒️ DATA JOBS

Sazka
- BI data engineer (Praha)

Colours of Data
- CRM Strategy Expert (Praha/remote)
- Senior Growth Marketer (Praha/remote)

intecs
- Senior BI Consultant (Brno)

Emark
- Cloud Data Engineer – Snowflake (Praha/Pardubice/Bratislava)
- BI Specialist (Praha/Pardubice/Bratislava)
- Cloud Data Engineer – Azure (Praha/Pardubice/Bratislava)

Carl Data Company
- Head of Marketing (Praha)

FLO
- Business & Data Analyst (Praha/Sydney)
- Data Engineer (Praha/Sydney)
- Data Scientist (Praha/Sydney)
- AI Architect (Praha/Sydney)

Aim
- Full Stack Engineer (Praha)
- AI / LLM Engineer (Praha)

Rossum
- Senior Backend Engineer – Integrations (Praha)
- Senior Solution Architect (Praha)

PangeAI
- Founding Engineer (Praha)
- DevOps Engineer (Praha)

GoodData
- Intern Frontend Engineer – React (Brno)

MBI
- Data Analyst / Engineer - Database.xlsx (Praha/remote)

Direct Technologies
- PostgreSQL DevOps (Brno)

BigHub
- Data Engineer (Praha)

Dateio
- BI / Data Analyst (Praha)
- Data Engineer – Tapix (Praha)

duvo.ai
- AI Solutions Consultant (Praha)
- Product Engineer (Praha)

Hledá vaše firma někoho na pozici spojenou s daty?

Pošlete nám odkaz nainzerát na michal@fenekpr.cz a my ho rádi zveřejníme.

Chcete si přečíst naše starší newslettery?

Někdo vám newsletter přeposlal a vy jej chcete taky dostávat?

Data Talk není pay to play! Pokud chcete sdílet svoje know-how či obsah od vaší firmy, napište nám!

A pokud vás naše práce baví a poskytuje vám hodnotu,

můžete nám poslat finanční podporuna kafe!