Data Talk #147: Jan Procházka (DataSentics)

V tomto díle Data Talk podcastu byl hostem Jan Procházka, CTO firmy DataSentics. S moderátorem Jirkou Vicherkem diskutoval o technologickém i podnikatelském vývoji, který vedl od prvních datových skladů až po špičkové AI projekty. Jan sdílel svou cestu od BI analytika přes architekta po CTO a popsal, jak se v DataSentics od počátku zaměřili na dlouhodobé trendy: využití cloudu, open source nástrojů a machine learningu s důrazem na konzultantskou část a end-to-end přístup. Mluví taky o potřebách globálních zákazníků, popisuje, jaký byl prodej DataSentics do francouzského IT giganta Atosu, i jakou roli v tom celé hrála a bude hrát data science. Sdílí také tipy na nejlepší knihy, které doporučují všem lidem ve firmě, celý seznam najdete zde.

Strojový přepis

Opravený text:

Dobrý den, moje jméno je Jirka Vicherek a vítám vás u dalšího dílu podcastu Datatalk. Mým dnešním hostem, vzácným hostem, je Honza Procházka, CTO DataCentix. Ahoj, Honzo.
Ahoj, Jirko.

Jsem hrozně rád, že jsi přijal pozvání, protože vzhledem k důležitosti DataCentix na českém trhu jsem se vás snažil dostat dlouho, a proto mám velkou radost, že to vyšlo. Dneska s Honzou probereme historii – jak vlastně DataCentix vznikly, přes velký prodej a úspěšný exit, až po to, co DataCentix dělají dneska. Myslím, že spousta lidí slyšela ten brand, ale vlastně si ho neumí naplnit. Mě baví to, jak jste vyrostli a jaký dopad máte minimálně na evropskou scénu. Na to se moc těším. Podíváme se taky na přehled technologií, jak se vyvíjely v čase, a ukážeme si, že úspěch DataCentix nebyl náhoda – ani na tržní a technologické úrovni, ani z pohledu osobní podnikatelské cesty, a jak se vám povedlo dostat se tam, kde teď jste.

No, ale začněme tebou. Jaká byla tvoje cesta – nejdřív do DataCentix a potom v rámci firmy?

Ještě poděkuji za pozvání, jsem tady rád. Myslím si, že máme vůči širší datové komunitě co dohánět, hlavně ve stránkách komunikace, co děláme, jak fungujeme, takže... Jsem rád, že to vykopáváš, taky mám ten pocit. Pojďme to dohnat. Tak kde ses vlastně k datům dostal?

Hele, já jsem si data poprvé všiml na vysoké škole, protože už jsem měl za sebou základy programování v Javě. Začaly databáze a už byly trochu propojené s BI a najednou jsem si říkal: "Ty jo, to je super, tady vidím nějaký smysl, o čem to celé je." Naprogramovat si kalkulačku bylo cool, ale říkal jsem si, jestli v životě opravdu chci psát něco, co ani nevím, k čemu někdo bude pořádně používat, co to bude znamenat a jakou hodnotu to přinese.

A pak přišly databáze, kde už nebyl jen seznam objednávek celé firmy za dlouhou dobu nebo seznam klientů, ale tam byl vidět příběh té firmy. To BI bylo právě o tom udělat reporty, které tyto informace ukazují někomu, kdo pak ten byznys žije a firmu utváří. Bylo to přesně na tom rozhraní – potřebuješ technologie, programovací jazyky a kód, aby ses dostal k tomu formuláři, kam někdo zapsal data, spustila se procesní logika, jak ta firma funguje, a data se uložila do databáze. Uděláš insert, hodíš tam payload a je to.

Ta data se dají použít na spoustu dalších věcí, protože v sobě nesou úplně jiný obraz o tom, co se v tom procesu stalo – proč někdo vyplnil ten formulář, co to znamená a jaký to má dopad na úrovni firmy. To mě hrozně bavilo. A musíš rozumět technologii, protože jednu používáš na zapsání dat, jinou na jejich zpracování. Data jsou vlastně neviditelná. Pro běžného člověka, který kouká očima a nekouká přes technologii, ani neví, že tam ta data jsou – jen se dívá do systému a vidí například, kolik jsme prodali za poslední měsíc, nebo sleduje report o vývoji marže za posledních pět let.

O jakém roce mluvíme? Co jsi studoval?
(Tady text končí, část věty je neúplná.)

Opravený text:

O inženýra to víc vypadalo, že s tebou bude vývojář a pak tě učarovala data a BI. Hlavně mě vždycky bavily počítače. Rodiče mi říkali, že když budeš hrát počítačové hry, zblbneš. Doufám, že se to úplně nestalo. A pokud ano, tak to zblbnutí není tak špatné. Skrze počítače a nějaké věci ve škole jsem viděl, jak funguje Pascal, a to zažila spousta lidí z mojí generace. Vždycky jsem tomu tíhnul a myslel jsem si, že chci být prostě ajťák. Ale když přišly přijímačky, hlásil jsem se na ČVUT, na VUT a na další školy. A úplně mě šokovalo, že na ČVUT i VUT nikdo neřešil podnikatelskou stránku věci – bylo to jen o matematice, programování a tak dál. Proto jsem šel na ekonomku, protože tam kromě lidí, které zajímají počítače, byli i ti, které zajímal spíš byznys a pragmatický pohled na věc. A tak jsme se bavili na ekonomce.

To bylo asi v letech 2008 až 2011. Ok, super, to byla doba proklamace technologií a věcí. Pak přišly databáze, do kterých jsem se zamiloval. Co bylo dál? Říkal jsem si, jak se do té práce dostat a začít to dělat. Nedávno tady byl Jirka Neoral a povídal, jak školil Office. Já jsem v Praze v firmě Aira taky školil Office. Později jsem školil i na VŠE, chvíli Office v rámci nějakého předmětu. Evidentně cesta k důležitému postavení na české datové scéně vede přes školení Office. Podle mě je to spíš korelace, že tam takoví lidi jsou, protože když chceš dělat data, Excel je nejdostupnější technologie pro práci s daty. Nikdo lepšího a dostupnějšího nevymyslel. A ono tě to tam vtáhne. Nakonec spousta BI nástrojů má integraci právě s Excelem, a jsou to často velké nástroje. Například TM1, velká plánovací aplikace, vyhrála trh jen proto, že má uživatelské rozhraní přes Excel. To jsem také na začátku nechtěl zmeškat a vedle BI jsem najednou viděl i plánování, reporting a analýzy a tak dál. Chtěl jsem se někam dostat a našel jsem firmu Reporters, která nabírala juniory i seniory. Říkal jsem si: „Ježiš, mám štěstí.“ Dnes už takových firem, které najímají seniory i juniory, asi je dost a já dělal implementace a projekty. Po brigádách a školeních jsem říkal: „To je ono, to je to BI.“ Nakonec mě firma přijala, připravoval jsem se a byl jsem nadšený, že to vyšlo. Pohovorem jsem prošel, chvíli jsem měl bez projektů čas nastudovat, jak funguje Jasper Open Source, a předával jsem tyto znalosti starším kolegům. Bylo to vtipné, když člověk ještě nemá s čím to porovnat. Pak jsem se postupně dostal na projekty. Byl jsem v Raiffeisenbance na nějakých reporte a jejich migracích, pak krátce v jedné dnešní automobilce, kde to bylo víc o plánování. Procházel jsem, jak se to kóduje, a když jsem pak psal kód, říkal jsem si: „Tyjo, a co s tím jako někdo...“

[Text přerušuje, pokračování není k dispozici.]

Opravený text:

Co získat? Proč někdo chce takový report? Proč vlastně migrujeme? Ptával jsem se Radima, proč to vlastně migrujeme. Radim říkal, že protože přecházejí na Cognos a ty reporty dál používají. Proč děláme tu re-prioritizaci? No protože ne všechny reporty se používají. A proč jsme teď začali dělat tu re-prioritizaci? Ukázalo se, že ač máme nějaké peníze na migraci, ten rozpočet není tak plný, aby bylo možné zmigrovat všechno, tak jsme šli za lidmi znovu a řekli jim, že rozpočet je menší, a pojďme to tedy znovu re-prioritizovat. A ptal jsem se, jak se vlastně používají ty reporty? Kde je ta hranice, kdy si řekneš, že už nemá cenu něco migrovat? A najednou jsem zjistil, že při každé takové technologické migraci se třeba 60 až 70 % reportů zahodí. Protože si je objednal někdo, kdo už ve firmě není, a ten, komu to předal, je nepovažuje za důležité. Takových situací je tam hodně. A my v IT to vlastně nevidíme. Vidíme logy, kdo na co kouká, ale nemáme tu znalost, jak to funguje. A já měl takové blbé otázky během své kariéry, ptal jsem se po smyslu.

Oblíbený dodavatel, no, to zní fajn. Jo, a ono by to fungovalo, kdybych se mohl bavit třeba s někým z byznysu nebo s CFO a podobně, a měl k tomu spoustu dalších schopností, abych byl efektivní v rozhovoru. Když se ale bavíš s člověkem, který má ty reporty na starosti a taky jim nerozumí, a pokládáš mu takové otázky, tak tím nezlepšíš atmosféru v týmu... Právě, právě. Asi jsi nebyl nejoblíbenější. Na druhou stranu, co tě to naučilo?

Na technologické straně jsi byl stále v Microsoft stacku? Byl to tvůj stack, nebo to bylo všude možně? Hele, tam jsem zaparkoval až později. Začínal jsem na Oracle, Teradata, potom plánovací TM1, Cognos Planning a pak jsem skončil u SQL Serveru. To hlavně proto, že v tu dobu byl technologicky opravdu napřed a stál třeba pětinovou cenu na licencích a hardwaru. Pětinovou si vymýšlím, ale i tak. Když se člověk podívá na cenové nabídky dnes, často se lidé diví, proč někdo migruje z Oracle nebo Teradata do Databricksu, Snowflakeu nebo Cloud Native Warehouse, ale i Data Lakehouse. Pointa je, že za cloudový model nikdy nezaplatíš tolik jako za licence. A to zahrnuje i hardware a flexibilitu, úplně jiný přístup. Už tehdy bylo vidět, jak v SQL Serveru máš kompletní stack, můžeš tam pracovat s reportingem, BI... Jasně, Jirka říkal, že Enterprise edice je drahá, ale to je nic ve srovnání s celou sadou od Oraclu nebo Teradaty, nad kterou si třeba koupíš Cognos a pak to nějak namícháš.

Najednou bylo možné i v menších firmách, když jsem pak přišel třeba do Datartu, dělat BI celé. Bylo možné začít věci jako verzování kódu, což byla první věc, co mě uchvátila. Ty vado, já to nemusím po každé rozbít, můžu se podívat...

Tady je opravený text:

Na DIFu to v kódu už v tu dobu bylo normální, ale v databázích, když máš prostě Create Table Script a uděláš nový Create Table Script a potřebuješ to nasadit, tak musíš vymyslet, jak postavit ten Create or Replace, aniž bys přišel o data. A kolikrát je to dost složitá operace, na kterou si najmeš hodně drahé lidi, protože ta tabulka má miliony řádků a tvoje databáze nemá neomezenou kapacitu výpočetní. Tak to nemusí být jednoduché vymyslet, jak ji přeorganizovat z řádkové struktury na sloupcovou a umožnit jak rychlý zápis, tak rychlé čtení pro reporting. A to byly problémy, kterými jsem se zabýval.

Postupně v kariéře jsem začal mít nepříjemný pocit, že tomu hrozně rozumím. A to je jeden z prvních velkých omylů. Myslím si, že na konci dne je to zdravé v kariéře a je důležité mít štěstí na lidi okolo sebe. A to jsem naštěstí celou dobu měl – že mě nikdo za to úplně nezbyl. Ale v nějakém bodě si člověk na vrcholu té křivky vědomostí vytváří falešný pocit, že tomu rozumí. To je můj nejoblíbenější golfový vtip. Jaký je golfový vtip? „Už to umím.“ „Jo, jo, jo.“ A právě to je ten moment.

Navíc jsem měl pocit, že i rozumím tomu, jak by měla fungovat firma, když vidím do dat. A proto to bylo nebezpečnější. Kdybych jenom mluvil o tom, čemu možná fakt rozumím, bylo by to jinak. Ale já jsem začal přemýšlet o úplně jiných věcech.

Pamatuju si na zkoušku s jedním finančním ředitelem, kterému jsem říkal: „Pojďme tady trochu do něčeho investovat. Ušetříme dva naše seniory, aby mohli dělat nějakou inovativní a zajímavou práci, místo aby jen točili stále to samé.“ A on mi říkal: „Implementujeme právě teď iFirstSale a já potřebuji veškerý potenciál firmy zaměřit na to, abychom zvládli iFirstSale včas.“ Já to chápu, je to nepříjemné, já ty dva lidi obětuju. A já jsem říkal: „Ty vole, to není tak těžké.“ Měl jsem pocit, že jsem partner v tom rozhovoru. Přitom jsem vůbec netušil, co je iFirstSale, nebo to jen tušil – ale spíš jako člověk, který dělá data, ne jako účetní nebo někdo, kdo dělá change management ve velké organizaci.

A teď jsem měl pocit, že na to mám názor – a že ho mám lepší, protože rozumím něčemu, čemu oni nerozumí. A takových momentů bylo víc.

Velké ponaučení zpětně je, že ve warehouse vidíš celou firmu, ale jen očima kontrolingu a účetních. Vidíš účetní doklady, objednávky, výsledovku (P&L), kontrakty a snažíš se rozpadnout hlavní účetní knihy na nižší granularitu, která není v účetnictví přímo zachycena. Potřebuješ vědět, jak asi na konci měsíce dopadneme – jsme na tom dobře, když je pátého, jak to bude třicátého? To z účetních dokumentů neuvidíš, protože ještě nedorazily. Teprve někdo se někde zalogoval, máme leady, máme nějaké nezávazné objednávky a závazné objednávky a to musíš nějak do účetnictví dostat a správně rozúčtovat. To je dost složitý problém a tohle vidíš ve warehouse. Tam nevidíš nic jinýho.

Pokud budeš chtít, můžu pomoct i s pokračováním nebo s dalšími úpravami.

Zde je opravený text s důrazem na plynulost, správnou gramatiku a interpunkci:

Pětně jsem pochopil, že pokud chci vědět, co ta firma dělá, tak to nenajdu úplně v datech. Najdu to v příbězích. A ideálně najdu ty příběhy jako příběhy vedení té firmy — jaký život prožili, co vystudovali, jaké zkušenosti má ředitel. Je to hrozně důležitá věc tomu porozumět, protože se to potom obtiskne do denního řízení firmy. To je určité pozadí, kontext — a naprosto klíčový kontext k těm datům. Jakoby je to důležitější než samotná data.

Protože to třeba může být, jako například u jednoho z našich pěkných klientských příběhů: do firmy přijde nový ředitel poté, co do firmy, která možná funguje tradičně, vstoupí nějaký venture fond. Přijde tam ambiciózní ředitel, který chce firmu změnit. Pokud tento kontext nezachytíš — a je jedno, jestli ucházíš o nějakou řadovou pozici nebo že tam jdeš jako dodavatel kamkoliv — pokud nevíš o tomto kontextu a začneš jen...

...tam mluvit o důležitosti kontinuity, což z dat vyplývá, protože roky jeli právě na kontinuitě, protože vědí, co tam je teď, jaké lidi tam mají. A to jsou příběhy. Příběhy marketingové — co firma říká navenek, jak se chce profilovat, jaké chce zákazníky. Jsou to příběhy interních zaměstnanců, zejména ředitelů, ale i investorů. Kdo vlastní firmu? Je ředitel zároveň majitelem, nebo tam jsou akcionáři, kteří se zajímají jen o zhodnocení? Pokud tam jsou akcionáři, jak vypadala výroční zpráva? Je akcionář dnes spokojený? Je tam prostor na investice a zajímavé věci, nebo se tam prostě drtí čísla a na konci dne jde jen o to? To jsou příběhy.

Kdybych to tehdy věděl, možná by v některých situacích nebyl takový krten. Tímto se všem vstupně omlouvám. A zároveň jsem rád, že jsem se tady dokázal posunout hodně skrze Petra z Data Centrix, o čemž asi ještě bude řeč. Získal jsem díky tomu nový pohled. I BI dnes vnímám jinak, mimochodem. K tomu se dostaneme.

Pojďme tedy k setkání s Petrem.

Takže jsi na vrcholu kariéry, pomyslně ve své hlavě, už všechno umíš a jsi konzultant, teda spíš v tomto oboru. Jak se stalo spojení s Data Centrix?

Byl jsem spíš takový architekt, který se pomalu mění v konzultanta. Pochopil jsem pár věcí. Když přijdeš do nové firmy, je dobré měsíc jen poslouchat, vnímat lidi a udělat jim nějaký hezký diagram, třeba Data Flow diagram. A říct jim: „Já jsem se vás tady obešel, pochopil jsem, jak fungujete, a tady jsem to zachytil v tomto diagramu. Co si o tom myslíte?“ A oni ti řeknou: „Wow, to je dobrý pohled.“

Proč je to dobrý pohled? Protože tam je nulová invence z mé strany. Já jsem jen vzal standardní diagram, který je léty ověřený a ukazuje nějaké souvislosti. Oběhl jsem ty lidi. Ze zkušenosti jsem viděl, že toto je bod, o kterém se asi moc nemluví. A kdykoliv se mě někdo zeptal: „Proč je tady tahle šipka? Proč tady data jdou tímto směrem?“ Já jsem říkal: „Hele, to říkal Karel.“ A on říkal: „Aha.“ A pak jsem šel za Karlem a říkal jsem: „Hele Karle, na to se ti lidi moc netvářili u té šipky.“ A Karel říkal: „No já vím, ale to tam musí bý...“

Pokud chceš, mohu text upravit ještě víc stylisticky nebo jazykově přizpůsobit konkrétnímu účelu.

Tady je opravený text bez zásadních stylistických změn:

Protože ABC.A, tak jsem šel zpátky a řekl jsem: „Hele, ale ABC.A.“ Oni řekli: „No jo, ABC.A.“ Nejen řekli, ale i „to je nechytřej“. A teď jsem se pak držel měsíc neříct vůbec nic, pak tři měsíce říkat jenom tady ty propoje, co mám, a informace od jiných lidí, ale pořád moje předaná hodnota byla v tom, že jsem to dával do kontextu, který oni neviděli a který jsem věděl, že je důležitý pro ty projekty, co měli před sebou. A teprve potom, po půl roce jsem reálně začal do toho mluvit a vstupovat. Což mimochodem je de facto role konzultanta do velké míry, ale hodně umírněná pro tu architekturu, kterou jsem dodával.

Architekturu jsem dodával jednoduše proto, že dokud jsem dělal analytika, dělal jsem úplně stejnou práci jako vývojář. Vždycky jsem to chtěl pochopit celé, najít ty bottlenecky, ty úzká místa, a ty vyřešit, a tím to posunout. Takže spíš tak jako problém solver, než že bych byl zamilovaný do jedné technologie, do jednoho přístupu. Zajímalo mě, na čem se to blokuje a co se má zlepšit. A zjistil jsem, že jenom když se nazvu architektem, spadnu do jiný škatulky a dostanu víc peněz. A víc mě poslouchají.

Zjistil jsem, že ten trh, jak je nastavený a ty jednotlivé role, které na něm jsou, jsou víc nastavené tak, aby rekruiteři a různí dodavatelé uměli nastavit ceníky, a není to nastavené podle toho, co ty firmy potřebují. Tudíž je na mě se tam napozicovat, aby to odpovídalo tomu, co chci dělat. A když to deleguju na někoho jiného, tak oni řeknou: „A to je poptávka po vývojářích, tak my tě vezmeme na vývojáře.“ A pokud jsi univerzální, je ti to jedno a nepřemýšlíš nad tím, tak jsi právě připravil o docela slušné peníze, ať už jsi zaměstnanec, freelancer nebo pracuješ nějakým jiným režimem. Je to hrozně důležité, jak se nazveš, protože ten ceník se dělá na začátku a oni tě poznají až potom. A to už se blbě mění ta cena. Zajímá nás to směrem nahoru.

No, takže tehdy jsi se nazval architektem.

Tehdy jsem se nazval architektem, měl jsem ty postupy a v té své naivitě, jak jsem tady říkal, a s pocitem, že jsem nejchytřejší na světě, a zejména v BI, se stalo pár věcí, co mě začaly formovat trochu jinak. Objevil jsem SQL Pass Community, tady Tomáše Tuška, Romana Lánského, Jaro Rekena a spoustu dalších lidí. A pochopil jsem, že řeší stejný problémy jako já, jsou chytřejší, mají víc zkušeností, působí na více místech, vědí víc, a v té komunitě najednou...

A jenom jsem zjistil, že nejsem nejchytřejší. Ani v tom oboru, o kterém jsem měl o sobě v té malé bublině silné mínění. Tak to bylo první, kde jsem začal přemýšlet trochu jinak. A to bylo druhé – ten trh, jak funguje. Říkal jsem si: „Hele, proč vlastně já mám tady živit nějakou firmu, která jenom drží nějaký kontrakt? A kolikrát mě ani nutně nepomáhá v tom, abych byl úspěšnější v té pomoci tomu zákazníkovi.“ Co kdybych vzal pár chytrých lidí, které znám, a dali jsme to dohromady? Byli jsme ten elitní tým a chodili na ty nejtěžší místa a říkali si vlastně dvojnásobek peněz, než si říkáme dneska. Ale poskytovali jsme i tu firemní obálku pro toho zákazníka...

Pokud chceš, můžu text ještě víc upravit nebo zestručnit.

Zní to takto:

Zníka. A říkal jsem si, OK, založím si svůj Data Warehouse Boutique. Taky jsem už tou dobou byl díky SQL Passu na nějaké konferenci v Londýně a jinde a viděl jsem, že cloud se dere dopředu. Co je to za rok? To bude nějaký rok 2015, 16. A tak se mi to spojilo, že by to mohlo být dobré. No a teď jsem tvrdě narazil zase s touhle naivitou. Složit tým tří seniorních lidí nebo čtyř, pěti a dostat se společně na projekty zní skvěle. Do momentu, než za někým přijdeš a řekneš: „Hele, vymyslel jsem tuto kravinu.“ A on ti řekne: „Jo, jo, jo, to zní skvěle, to bychom mohli dělat. Já ještě tak čtyři měsíce potřebuji být na tomhle projektu, abych to tam dodělal, a pak bych mohl.“ A pak přijde druhej a ten říká: „No, ale já jsem teď na konci, mi končí projekt, mohli bychom začít hned. Máš už něco?“ A ty říkáš: „Kámo, já se bavím o tom, že bychom nezačali a šli do toho, a třeba tři měsíce projekt nebudeme, protože se musíme nějak dohodnout, co chceme těm klientům říkat. Já tady nemám ještě seznam firem, co říkají, že chtějí platit hodně peněz za tři chytráky, co se dali dohromady. Potřebuji někoho, kdo s tím pomůže taky.“ A on říkal: „Jo, tak já už tady mám nabídku prostě od jiných firem, které se na to specializují, ale není to tak špatné. A teď nechci být dva měsíce bez příjmu, když mám takové nabídky. Ale líbí se mi to, co děláš.“ A já říkal: „Tyjo, tuhne to.“ A v tom jsem potkal Petra Bednaríka, nějak jsem začal být trochu vidět, měl jsem nějaký blog, tehdy už neexistující, a tak jsme šli někam do kavárny. Já mu říkal svůj příběh, on mi říkal ten jeho. A zajímavé bylo, že mluvil o datech, ale úplně jinak než já. Říkal, že to, co jsem znal a uměl, by byla vlastně blbost. Nerozuměl žádným stackům, kterým jsem rozuměl, ale nedělal v nich moc. Mluvil o data science, machine learningu, Pythonu a já říkal: „Tyjo, já jsem spíš SQL based, jasně, taky se rád bavím o tom, jak na databázi udělat nějaký service bus a jak to propojit, takže trochu chápu, o čem to je, a že to nemusí být blbý na něco.“ Ale zároveň to bylo dost neznámé. A zároveň Petr říkal: „Hele, já u těch use caseů, to, co dělám, mám business case.“ Já mu říkal: „Já u těch dashboardů mám problém prodat business case. Třeba abych prodat,“ tehdy jsem to ještě říkal blbě, ale teď už to řeknu pochopitelně, „abych prodal business case reportingu, musím nejdřív prodat business case controllingu a manažerského účetnictví.“ A já si vlastně nemyslím, že manažerské účetnictví je něco, co bych chtěl prodávat, když to vezmu kolem a kolem. Je to důležitý aspekt všeho, ale není to ta finální hodnota, kterou bych chtěl dodávat. Spíš je to až to, co přijde na konec. Potom, co to někdo vymyslí, odprototypuje a nasadí, pak je zajímavé to účetnictví a manažerské účetnictví vyškalovat a doladit. No a Petr místo toho říkal: „Hele, já když tady zoptimalizuji tyhle ka…“

Text původně končí nedokončený, takže jsem ho ukončil zde. Pokud chcete, mohu pokračovat dle dalšího zadání.

Zde je opravený a stylisticky upravený text:

Kampani pomocí machine learningu uděláme personalizovanější, a ta firma nepošle generický e-mail všem, ale pošle e-mail jen na lidi, kteří si v nedávné době na webu hráli například s nějakou kalkulačkou. Takže najednou můžu nakoupit tu reklamu trochu dráž, ale mám násobně vyšší konverzi a vydělám víc peněz. Já vůbec nemám potřebu business case, protože je to evidentní z těch čísel, která dělám. A já říkal: „Tyjo, to je dobrý, to mě baví.“

Viděl jsem taky, že Petr dělal dlouhé roky v Deloittech, dobře o tom mluví, má business case, je to ale úplně jiné. Už jsem byl trochu nalomený tím, co jsem viděl ve světě a v komunitě, že nejsem nejchytřejší na světě, tak jsem se podíval, jak na tom jsem finančně, a řekl jsem si: „Hele, ta runway je takhle dlouhá, a i kdybych dělal za nezajímavé peníze – protože ve startupu většinou děláš za nezajímavé peníze, pokud...“ A to si povíme později, protože tohle není úplně ten typ startupu.

Mezitím se mělo narodit moje první dítě, Viktorka. Pokud to poslouchá, tak ji za pár let zdravím. A teď jsem přemýšlel: „Tyjo, je to dobrý, moment, nemám taky úplné zajištění.“ Pak jsem ale říkal, že nejlepší zajištění je strávit tady s Petrem co nejvíc času, protože ten člověk ví, o čem to je, má úplně jiný pohled než já, má kolem sebe zajímavé lidi, kteří taky za ním jdou, a také kolem sebe nějaké zákazníky. Takže pojďme to prostě spojit.

Dalším důvodem, proč se mnou Petr mluvil, bylo, že ty proof-of-concept koncepty fungují – na lidi optimalizuješ jednu kampaň, pak potřebuješ jinou, potom zase něco v CRM, takže najednou máš kolem toho spoustu dat a je otázka, kam ta data dávat. Dáváš je do každého jednotlivého scriptu zvlášť? To se neukazuje jako škálovatelná varianta. A to je vlastně to BI a moje zkušenost s tím.

Zeptám se zase – o jakém roce tady mluvíme, když říkáš data science? Tohle je rok 2016-2017. A Petr byl tehdy na stejné úrovni jako já, používali se spíš blackbox modely, pojišťovny, aktuární analýzy a podobně. Chyběl ten komunitní aspekt, chyběla otevřenost open source. A z nějakého důvodu bylo hodně praktických problémů, proč ta řešení prostě neděláš třeba v R nebo Pythonu. Byla to doba, kdy data scientisti ještě preferovali R, pokud vezmeme specializovaný statistický software, a Python teprve začínal nabírat na popularitě.

To bylo zároveň jedno z prvních témat: na jakém jazyce se shodnout. Bylo to legrační, protože dnes jsme firma, která primárně většinu věcí vyvíjí v Pythonu – a nejen v Pythonu, ale i v SQL. V té době to ale bylo primárně R a Spyder. A já jsem měl zkušenosti se SQL.

Jedno z prvních témat, mimochodem i spojené s Databricks, bylo, jak to všechno skloubit dohromady. Ukázalo se, že Python nemusí být pro každého volba číslo jedna, ale najednou jsi měl člověka, který rozuměl SQL a dokázal...

Pokud chceš, mohu pokračovat nebo upravit text do jiného stylu.

Tady je opravený text s lepší gramatikou, stylizací a čitelností:

Abych se naučil Python, musel jsem trochu přepnout z „tabulkové hlavy“ na tu trochu víc skriptařskou, programátorskou. Vždycky přitom platilo, že Python je spíš skriptovací jazyk než plnohodnotný programovací jazyk — alespoň tak ho vnímají ti, kdo opravdu programují. Současně to věděl i každý data scientist, že to, co jde v R, jde na konci dne i v Pythonu. Možná to nebyla první volba, ale byla to velmi solidní druhá volba. A když jsme měli v týmu programátora, který na obojí trochu koukal s despektem, říkal: „Hele, Jakube, pokud si máte něco vybrat, tak si vyberte aspoň Python, já se vám k tomu dokážu lépe přizpůsobit.“

To byly často první roky naší práce. Chodili jsme za klienty, vysvětlovali, že data se musí někam uložit, musí se nějak zpracovat a výsledky musí být dostupné pro lidi, kteří dělají Data Science.

Než ale šli za prvními klienty, tak jsme se potkali s Petrem, sedli jsme si a hned bylo jasné, že jsme komplementární. On nastoupil do Databricks. V jaké roli? To jsme ještě s Databricks teprve začínali. V té době jsme měli virtuální server na Azure, na kterém běžel nějaký Spider a jednotlivé skripty vývojáři psali na lokálních strojích. Git jsme používali opravdu z pohledu datařů a datových scientistek, což znamená, že já jsem byl překvapený, když jsem zjistil, že Git lze nejen používat jako úložiště kódu, ale také pro verzování. Ale taková byla ta doba, z dnešního pohledu docela dřevní.

A právě ty technologie, nejen Databricks, jsme objevovali čistě podle toho, co nám opravdu fungovalo.

Jen pro představu — jak velký tým jste s Petrem vlastně byli?

No, zpátky ke klíčovému momentu na začátku. Byli jsme takový širší tým pěti lidí, seděli jsme kolem jednoho stolu a byli jsme jakýsi tavící kotel různých přístupů. Bylo to dané tím, jak se měnila celá doba, a také tím, jaké profily k nám přicházely a jaký přístup jsme k práci měli.

Dobře, začněme tou dobou z mého pohledu. Je fascinující, kolik věcí, které dnes bereme za samozřejmost, před deseti lety vůbec neexistovalo, nebo je nikdo neznal. Popiš tu dobu, pro mě je to hodně spojené s otevřeným softwarem, že?

Přesně tak. Do té doby to byly hlavně black boxy a proprietární řešení. Najednou přišla revoluce open source — ne jen open source modelů a knihoven, ale hlavně celé infrastruktury.

Dovolím si tu sekci trochu motivovat, proč ji vydržet, i když dnes máme Gen AI a všechno je super „cool“ a agentické. Ta doba byla paradoxně podobná, ale nikdo to tehdy neviděl. Obrázek, který budu teď uvádět, je založený na knížkách a informacích, které jsem objevil až později. Viděli jsme ten známý ledovec — povědomí, že klasické BI nástroje postavené na relačních databázích z 80. let začínají mít problém a přestávají stačit. Viděli jsme, že Data Science začíná mít POC (Proof of Concept), které opravdu přinášejí měřitelnou hodnotu a na něž se dá stavět. A pak jsme zaznamenali několik menších trendů okolo. Ale tehdy jsme jim nepřikládali zásadní váhu.

Podívejme se ale zpátky — dnes už všichni víme, že příchod agentů a dalších technologií všechno zásadně změnil.

Pokud chceš, mohu text ještě více upravit stylisticky nebo obsahově.

Opravený text:

Vidíme ten typický ledovec, ale zároveň se to děje určitě mnohem víc paralelně, a to složí ten celkový obraz toho, kam se to bude ubírat. Na tomto příkladu bych chtěl ukázat, že má smysl to opravdu zkoumat a jít pod povrch, bavit se nebo studovat více lidí, více firem, více přístupů a hledat, co je pod tím, co nakonec formuje, kam svět půjde. Je to ekosystémová komunitní záležitost, není to nikdy jen o jedné firmě. Vždycky jde o masu lidí – nakonec potřebujete přilákat miliony vývojářů, architektů, zákazníků, dodavatelů a tisíce dalších lidí a rolí, aby překlopili tu stránku inovace směrem k praktickému použití, produktivitě a k velkému byznysu.

Náš pohled byl tedy takový, že svět se mění a náš úkol je vymyslet, co mohou lidé tady v Praze, kteří mají dostatečný hlad to dokázat, dělat, aby byli na té pozitivní straně inovace, která postupně vytlačuje tu starší, zastaralou a negativní stránku inovace. Situace je vždycky nepřehledná a nikdy nevíte, kdo je přesně kde. Ještě v roce 2016 probíhaly velké diskuse o tom, zda mít Oracle Cloud nebo Azure – Oracle už do toho investoval, mělo to být skvělé, a Azure prý nikdy nebude nic moc. Dneska je to mnohem jednodušší, jak to dopadlo. Podobné diskuze se určitě dějí i dnes ohledně různých technologií, a je opravdu relevantní vsadit na to, že nějaká z nich zůstane.

Pro ty, kdo chtějí větší deep dive, Jirka Norál to krásně vysvětluje na přehledu Power BI a OLAP kostkách – opravdu nevíte, co přesně přijde. Proto má smysl si projít dobu před deseti lety, protože je to nejblíže tomu, co se děje dnes, a zároveň to byla ta jiskra, která vedla k agentům a k tomu, co tu dnes máme. Pokud tedy někde najdete vzory, na kterých vymyslet, co dělat dnes, tak to bude právě v té době.

Navíc, a to se mi líbí, když už o tom mluvím já, je za mnou nějaký příběh – něco jsme přinesli, něco vydělali. Například jsme se dívali na PR článek francouzského státu o tom, že kupuje... a teď nechci předbíhat, možná si o tom budeme povídat později, ale dnes jsme součástí týmu, který podle této tiskové zprávy dělá obrat 800 milionů eur, a všechno je postaveno na AI. My toho můžeme být součástí.

To vše je dáno tím, že jsme skočili do inovace, aniž bychom přesně věděli, co se reálně děje, ale zkoumali jsme podle jednoduchého pravidla: co přinese hodnotu zákazníkovi na konci celého řetězce dodavatelů, jaká ta hodnota má být, a pojďme na ní makat – nezáleží, jakou technologii použijeme. Ale musí to být spojeno s daty a machine learningem.

A jaká byla ta diskuze před devíti lety? Tehdy to možná zní až divně, protože dnes už jsou ty technologie standardem. Já už jsem zmiňoval Git, a teď chci říct konkrétní čísla. GitHub byl založený v roce 2008, GitLab v roce 2011, Bitbucket také v roce 2008, a primárně sloužily pro čistě programátorské use case. Taky tehdy ještě moc nefungovaly.

Jasně, tady máš opravený text:

A vždycky perfektně fungovalo, že ještě byl od Microsoftu Team Foundation Server, který také dlouho říkali, že má být moje proprietární verzovací technologie, nebo umožníme i Git. Dneska, když si otevřete Visual Studio a tyto nástroje verzování od Microsoftu, tak je tam všude Git, a kdyby tam bylo cokoliv jiného, tak by se ptali „proč, pro boha“. Takže jednou z věcí byl Git.

Jeho širší používání i mimo čisté programování a vlastně internet, schopnost sdílet a šířit přes GitHub a další služby, na čemž hodně funguje dodneška komunitní vývoj open sourceových jazyků, třeba Python. Dalším tématem byl nástup cloudu. Taky v letech před vznikem DataSentics, i my během prvních tří let jsme chodili do firem vysvětlovat, že cloud fakt má smysl. A oni na nás koukali, co je to za blbost. Ve velké firmě, v bance, cloud? Co blbnete? Dneska bez cloudu v bance neuděláte nic, co blbnete? Ale byly tam legitimní problémy, které cloud tehdy ještě měl, a bylo to jako rafr v mnoha ohledech.

Na to navazuje Terraform. Terraform měl první nějakou 0.1 verzi, nebo jak se to jmenovalo, v roce 2014. Microsoft měl Azure Templates, pokud si ještě někdo vzpomene. Pak přišel Bicep a dnes je stejně Terraform ten standard, který používají všichni. Bere se to jako něco, co funguje perfektně, jak spravovat infrastrukturu. Ale tehdy se taky rozvíjel Ansible a vedla se debata. Mám si to spravovat sám a připojovat se na nějaké servery, na které si instalovat software? Nebo mám zavolat pomocí Terraformu, ať mi vytvoří infrastrukturu a komponenty takovým způsobem?

Zároveň další zajímavý trend, který se formoval a je to takový spoiler do našeho příběhu, je NVIDIA a její CUDA. Máme i nějaký seznam knížek, který ukazuje to, co rozhodně stojí za to znát. Šlo o software, jak efektivně pracovat s grafickou kartou a jejím čipem. V roce 2012 to konečně chytilo trakci a začalo se prosazovat celkové spojení GPU a superpočítačů. Trend, o kterém jsme ještě nevěděli... AlexNet, ne? Je první model, který vyhrál nějakou obrovskou soutěž v Data Science, postavený na CUDA, tedy grafických kartách, a to bylo něco nového. A není to jen o renderování nové hry Wolfenstein nebo tak, je to mnohem víc. Fakt stojí za to si tu knížku přečíst. Rád se o tom budu bavit, ale myslím, že zatím neposkytnu dostatečně hodnotný pohled, a tak ji chci nejdřív pořádně nastudovat.

Ta kniha je třeba „The Thinking Machine: NVIDIA's Story“ od Chrise Millera. Myslím, že to jsou dvě hlavní knížky na toto téma. Problém je, že CEO NVIDIA Jensen Huang není moc zvyklý psát vlastní životopis nebo historii firmy. My v DataSentics si taky myslíme, že by měly mluvit výsledky, ne dlouhé řeči o tom, co jsme dělali třeba před deseti lety a jak neefektivně. Proto moc knížek není, ale tahle určitě stojí za přečtení, protože ukazuje trendy a vysvětluje proč o tom mluvíme.

Pokud chceš, můžu ještě upravit styl, aby byl text formálnější nebo naopak více hovorový. Stačí říct!

Tady je opravený text s lepší srozumitelností a gramatikou:

Proč zmiňuji ten rok 2015? Protože tehdy společnost – nevím, jestli už to byl Atos, nebo ještě Bulle, evropský výrobce superpočítačů – měla první superpočítač založený na GPU, Bulle Sekwana X1015. Zdravím kolegy z Česka. A vlastně to je pak služba z toho příběhu, kde všude je dnes AI a kde jsme i my. Jsou to právě lidé, se kterými jsme v jedné firmě a s nimiž děláme obrat 800 milionů eur. Je to opravdu komplexní, protože se jedná o budoucí trendy. Když mluvíme o generativní AI a AI obecně, najednou je vidět, že to nějak bude spolu fungovat. Nvidia už jednou touto oblastí vyrostla, i když dlouho byla AI spojována především s výzkumem a simulacemi, které pro běžného člověka v byznysovém světě nemusí být úplně atraktivní. Pro generativní AI, kde je potřeba vysoký výkon a paralelismus, to ale určitě bude jeden z formujících hráčů v celém odvětví.

Ale vraťme se k roku, kdy vznikal DataSentics, ne k tomu roku, kdy se začalo tolik mluvit o generativní AI. Když už jsme u toho, v tu dobu už existoval Databricks. Mám DataSentics hodně spojený s Databricksem, že jste třeba nějaké centrum excelence. Viděl jsem, že jste v advisory boardu Databricks, což je skvělé. Jak to tehdy s Databricksem bylo? Myslím, že nemusíme rozebírat jejich „sexy“ stránku, ale pro nás je to velká zkušenost a know-how, které jsme díky spolupráci získali a vidíme to dodnes.

Podobně jako Jirka Neurál říkal, co znamená být MVP Power BI, naše spojení s Databricksem je o to zajímavější, že se jedná o úroveň velkých zákazníků a významných firem. Pamatuju si, že v jedné české bance jsme řešili první seriózní implementaci Databricksu v bance v Evropě.

Když se vrátím k tomu roku a tomu, jak to vznikalo: řešili jsme právě první implementaci Databricksu v evropské bance, a to dokonce v Česku. Dneska se o tom moc neví, nikdo se tím příliš nechlubí, protože pro Databricks to nebyla nejvíc „sexy“ story, ale je to hezká připomínka toho, jak vzniká a formuje se inovace. V té době už Databricks měl tisíce případů použití ve finančním sektoru a bankách, ale není banka jako banka. Marketingové oddělení banky má výrazně menší restrikce, protože celé marketingové aktivity běžely v cloudu, což bylo v té době velmi důležité, oproti třeba karetním transakcím, které jsou velice citlivé.

To, co jsme tehdy dělali my, pravděpodobně byla jedna z prvních seriózních implementací, protože když jsme chtěli zabezpečit síť a splnit všechny provozní standardy banky, ukázalo se, že control plane Databricksu, tedy ta část běžící v cloudové sdílené infrastruktuře, a datový plane, který je umístěn v perimetru banky, musí spolu komunikovat přes specifické síťové rozhraní. Ukázalo se, že whitelisty, které máme např. pro firewall, musí být specificky nastaveny, aby vše fungovalo bezpečně a podle požadavků banky.

Pokud chcete, mohu vám pomoci i s pokračováním textu. Stačí říct.

Zde je opravený text:

Elistovat, jako by nefungovaly. A tak na ten blog postupně začali přispívat dva tři lidé z Microsoftu, z Databricksu. Postupně dali dohromady, co aktuálně platí, protože s postupným vznikem datových center nebylo udržet síťové adresy konzistentní úplně jednoduché ani pro ně. A teď nám říkáš: „Hele, pokud se tohle teď děje asi na náš účet, tak možná tohle ještě nikdo fakt seriózně neřešil v Evropě.“ Bylo to víc o tom, jak to vyřešit v evropském Microsoftím datacentru, než nutně o tom, že by to nebylo vyřešené jinde. To reagovali dost rychle zase.

A teď si říkáš, že marketingově děláme něco, čtyřistátý na světě, je to nuda, co tu děláme. Ale technicky, bottom-up, vidíš, že tam běží nějaký marketing startupovej, venture fondu vej, je potřeba nabalovat kapitál a tak dál, musí se dobře o nás mluvit. Produkce všude. A najednou přijde něco takového. A takových příběhů jsme tam zažili jako bambilion.

Najednou jsme zjistili: „Hele, tohle děláme první. Tohle jsme použili první.“ Tady nám někdo říkal — to byl jeden produkteář z Google na nějaké konferenci — že uživatelé to používají, ale on ještě nepotkal reálného uživatele toho produktu. V Evropě to prostě skoro nikdo nemá. „Co se vám tam stalo? Ukažte, tady máte pět tisíc dolarů v kreditech, to mi všechno řekněte.“ A ty říkáš: „Tyjo, GCP?“ A tou dobou jsme už byli v letech 2017, 2018 s touto historkou.

Co tím chci ilustrovat je, že jde nejen o trendy, ale i o schopnost nebýt na úrovni PR a toho, co se člověk dočte prostě online, na webu a v nějakých high-level popularizujících diskuzích. Je potřeba být na těch fórech, používat to v praxi, testovat to, dostat se k těžkým implementacím a udělat si vlastní názor, jakoby to triangulovat — to, co říká marketing, co vidíš v praxi a co říká ostatní komunita, co se naučila. Hledat si v tom realitu, kde to tedy je, kam to půjde, abys byl na správné straně inovace a abys nenaletěl nějaké fíčůře.

Třeba v roce 2017 jsme měli diskuzi, jestli vsadit na Databricks víc, nebo míň. Nikdy jsme nevsadili jen na jeden Databricks, vždy děláme to, co se hodí pro danou firmu a daný use case, protože jsme fascinovaní hodnotou na konci, ne tím toolm. Nakonec ty tooly fungují všechny dost podobně. Pokud si vybíráš top 3 tooly na světě, zvládneš v nich každý use case. Možná trochu dráž, možná s jinými workaroudy, ale myslet si, že top 3 firmy na světě nevyřeší tvůj use case, to může nastat, pokud jsi Walmart nebo jiný specifický případ. Ale pokud jsi jakákoliv česká firma, zvládneš to implementovat všude.

Jak tedy vzniklo spojení Databricks? Když už jsme tady, pojďme k tomu. My jsme prostě řešili, jak zajistit, že když máš dovolenou, tvůj kód se neztratí a něco se stane. A když jsme měli ten virtuální počítač a na něm nějaké I...

Pokud chceš, můžu pokračovat s opravou i zbytku textu.

Opravený text:

Dčko a někdo neuložil data do Gitu a odjel na dovolenou, takže ten kód zůstal na jeho notebooku.

Dneska se to zdá jako vtipná historka, a podle mě právě... Vyřešili jsme to mimochodem... Jsi tak dopředu, to bylo stejně s verzováním v Agitu, že to, o čem vyprávíš, ukazuje, že jste byli cutting edge – nejenom díky první implementaci Databricksu, ale i díky tomu přístupu. Myslím si, že pořád najdeš spoustu kódů na lokálu. Ten svět laguje, implementace mu trvá. To bylo právě pro mě zajímavé – v letech 2021 a dál najednou je cloud téma, tak jsem měl pocit, že jsem někde zaspal nebo něco. Říkali jsme si na těch cloudových akcích, že my jsme byli už v roce 2012, bylo tady „cloud now“ a všichni říkali cloud, a o deset let později je to v tom „plethora of productivity“. Najednou je to mainstream. Takže v tom si myslím, že jsi napřed, akorát pořád najdeš lidi, kteří když odejdou na dovolenou, tak k jejich kódu se nedostaneš. No a vy jste se rozhodli, že to vyřešíte.

Tady to jenom ještě rychle doplním, promiň. Pokud nás teď poslouchají nějací softwaroví inženýři s tímto backgroundem, tak cutting edge v Gitu byli rozhodně oni a ne my. Ale v datech jsme byli cutting edge my. Projevovalo se to těmito začátky – někdo to musí prošlapat, aby se z toho stal později standard.

Takže řešíte kolegy na dovolené a jejich nespuštěný kód. A teď se ukázalo, že když ten Python pustím na Spark clusteru Databricksu v cloudu, tak ten Spark nám fakt funguje, což samozřejmě nebylo vždycky. Spousta firem investovala do dataléků obrovské peníze a pak měly problém rozjet nějaké Pythonní knihovny, protože měly špatnou verzi Linuxu pod tím a neměly dobře udělanou virtualizaci. A to nebyly malé investice. V Databricksu jsme ten problém nikdy neřešili. Naopak jsme byli překvapení, kolik lidí s open source cloud resumé stackem tenhle problém často mělo. To nám potvrdilo, že cloud má smysl, protože některé problémy tam jednoduše nejsou, a díky tomu jsme mohli machine learning dělat výrazně efektivněji s manažovaným Sparkem.

Současně tam bylo UI, které fungovalo jako Google Docs. Ty jsi měl klienta – webového, tenkého – tam sis psal a viděl kurzor někoho jiného, kdo na tom samém notebooku taky psal. Funkcionalita, která se neukázala jako důležitá pro svět, ale pro nás tehdy to byla možnost demonstrovat, o čem je kolaborace a k čemu je Git. I když tam Git ještě ani nebyl. Protože jsme říkali, že takhle pracují dohromady, mají jednu verzi kódu, kterou vidí, a pak to někdo zazálohuje do Gitu nějakým příkazem na pozadí.

To byl ten moment, kdy jsme začali používat Databricks, protože to reálně zvýšilo rychlost našeho dodání nějakých dat o násobky. Ubylo prostě těch „plumbingů“ a nějakého lepení toolů, aby dělaly to, co mají. Prostě si tam dal ten skript, který něco natrénoval – nějaký model – a pak ho nascoreoval někde a použil na nějakou kampaň. A ono to takhle fungovalo, seamless. A to je důvod, proč jsme…

Začali jsme používat Atabrix a byli jsme prvním partnerem v Evropě. Bouchali jsme na jejich dveře v době, kdy měli v Londýně pouze dva lidi a teprve zvažovali, jestli do Evropy vstoupit. My jsme jim říkali: "Podívejte, pojďte to dělat rychle tady v Evropě, protože to potřebujeme." To pak dlouhodobě určovalo náš vztah, ale vždy jde hlavně o to mít nástroj, který opravdu funguje.

Máme spoustu zákazníků, kde Atabrix nepoužíváme. Pokud máš velkou smlouvu s AWS a už tam máš rozjeté technologie, tak je to v pohodě a dnešní řešení tam můžeš nasadit klidně. Není potřeba někam násilně protlačovat Atabrix a zpomalovat projekt o dva roky tím, že interně diskutuješ o všech politikách a zabezpečení. Použij nástroj, který tam už existuje, podle toho, co chceš dělat.

Jde hlavně o to, jak pro zákazníka vytvořit hodnotu a najít nejkratší cestu k tomu. K tomu je potřeba mít dostatečně schopný tým, který je flexibilní. Jasně, když máš sto certifikovaných lidí na technologii, vyřešíš složitější problémy lépe než malý dvoučlenný tým. Ale pro většinu případů použití s byznysovou hodnotou nepotřebuješ detaily cutting-edge znalostí. Firmy většinou mají vlastní tým a potřebuješ, aby byli kompatibilní. To se snažíme všem zákazníkům vysvětlovat: Nepřicházíme s tím, že vám změníme váš technologický stack a způsob práce, ale chceme pochopit, že se chcete v AI a datech posunout, a pak vám umíme dát zpětnou vazbu, protože jsme toho hodně viděli, a nemáme s tím problém.

S tímto vám umíme pomoci. Když bude určitá část v AWS, řekneme si, že to pro nás bude dražší, ale kdyby to bylo jinde, může to být efektnější a možná levnější, protože budeme efektivnější. Myslíme si, že určitá technologie je na daný problém efektivnější, ale vy budete mít náklady na adopci nového stacku, přetrénování lidí atd. Když to takhle říct, tak jim třeba nenabídneme Databricks, protože by to nedávalo smysl a byla by to zbytečná ztráta času pro všechny. Pro nás by to byla i ztráta dlouhodobé kvality, protože nejhorší věc je zamilovat se do jedné technologie. Pak jste expertem jen na tu jednu technologii a pomáháte šířit právě tu technologii, což je určitě příležitost pro kariéru. Ale pokud je vaším cílem řešit problémy pomocí dat a AI, tak si takovou situaci nemůžete dovolit. Technologie má být nástroj, který vás posouvá dopředu, ne co vás brzdí.

Naše zkušenost je, že do „košíku vajec“ musíš dát víc technologií. Ty se pak začnou vzájemně propojovat. Můžeš přijít třeba do firmy, kde se klient rozhoduje mezi AWS a Databricks, a AWS ví, že my pracujeme i s Databricks, a Databricks ví, že pracujeme s AWS – a zákazník to také ví. Pak můžeme zákazníkovi skutečně pomoci vybrat řešení, které mu přináší hodnotu. A i partnerské společnosti s námi takto spolupracují.

Jinak to vidím tak, že ten partner je spojený s tím jedním rande, ale jinak je to spíš o tom, že více dává na náš názor, více se nám věnuje a to je ta pozitivní stránka inovace – ten ekosystém. Rozhodně AWS i Databricks jsou na pozitivní straně inovace v IT a ještě dlouhé roky tam budou, spolu s dalšími firmami.

Pozitivní stránka inovace podle mě znamená, že už to není legacy – vlastně ti to otevírá víc možností, než ti je zavírá, co se týká vendor lock-inu a potenciálu. Legacy je možná příliš tvrdé označení, to už je spíš ten dlouhý konec spektra s negativní stránkou inovace, takové „ocas“ na konci.

Hezky je to vidět na příkladu Cisco, které bylo před 20 lety jednou z nejhodnotnějších infrastrukturních firem na světě, a od té doby se jen propadá v SAP 500. Neznamená to, že by bylo na negativní straně inovace, spíš se přidaná hodnota přesunula jinam. Cisco je pořád cutting-edge firma, která umí dělat spoustu skvělých věcí a stále je v SAP 500. To je fajn.

Pozitivní stranou inovace jsou dnes firmy, které pracují na trendech, jež přinesou výsledky za pět let. Dnes je o nich možná málo lidí ví, někteří je podceňují, nebo je považují za niche hráče. Třeba před čtyřmi lety, pokud jsi dělal Lemko, byl jsi pro trh nezajímavý. Ale kdo sledoval vývoj Transformerů a četl knihy na toto téma, už věděl, že to je nejpozitivnější strana inovace.

To, co dělalo OpenAI, když začali trénovat modely s Microsoftem, bylo zcela jasné – píší velký příběh, jen nebylo jasné, jak velký. Ekosystém nebyl připravený na to, aby to dostal do byznysu. Zlom přišel s prvním ChatGPT, kdy našli B2C cestu – po desítkách let velkých IT inovací rozjet B2C model místo B2B. To byl silný signál a ta pozitivní strana inovace.

Být v ekosystému těch firem, které už mají ty vzorce vymyšlené a vědí, jak to bude fungovat, je klíčové. Protože když se ten ekosystém rozjede, když hype ještě ani v produktivitě není uplatněn, ale už jede, tak se svět rozšiřuje. A pokud jsi na té rozšiřující straně, jedeš s tím – vlastně je jedno, jak moc s tím jedeš. Koláč totiž peče celý ten ekosystém společně.

Ten ekosystém musí vymyslet, jak technologii dostat do malých firem, do zdravotnictví, retailu, výroby, bank, velkých i malých podniků, startupů. Stačí v tom být a ekosystém tě podpoří, abys se nestratil, pokud na něj máš dostatečně silné vazby.

To vnímám i ze startupového prostředí: když se říká produkt, tým nebo trh, tak klíčový je trh. I špatný tým s nedokonalým produktem na rychle rostoucím trhu může uspět, jak to bylo třeba u DataSentix. Na co jste sázeli? Vždy jste měli víc vajíček… Můj pohled na DataSentix zvenku je…

Opravený text:

Entixou DataScience, je to jako AI, než to bylo cool.

Prostě kluci z jadérky, takže fakt data science posunutá do implementace, tedy software engineering na plný pecky k tomu. Tak takhle jsem to vnímal – úzká propozice, protože data science byla dlouhou dobu úzká a drahá. Pak přišel rok 2021 a s ním exit. Tak co se stalo za ty čtyři roky? Říkal, že vás bylo osm u jednoho stolu, šli jste do toho a hezky jste zachytili technologickou revoluci – co najednou bylo dostupné: cloud, open source řešení, databricks, verzování a škálování projektů. Už to tedy není jen "vytvoříme model a za rok se na něj podíváme znovu". Tak co se za ty čtyři roky dělo? Jaké klienty jste chytili? Jak se posunul trh pod rukama?

Ještě to rychle shrnu, protože mi to přijde fakt klíčové pro pochopení příběhu: všechno je to období od roku 2012 až 2015, těsně před naším vznikem. Doba tehdy byla ještě pomalejší a z Ameriky k nám ty věci cestovaly dva až tři roky. Když si k roku 2012 přičtu ty dva tři roky, je to právě ten founding moment DataCentrix. Naskakovali jsme na ten trend, a už od prvního dne jsme byli na pozitivní straně inovace, aspoň v Evropě. Dneska k nám novinky dorazí za 14 dní, takže dnes jde naskočit na den jedna úplně globálně.

Co se týče trendů: Hadoop a celý big data frameworky se začaly konsolidovat ke Sparku a bylo jasné, že Spark z toho vzejde jako nový standard pro škálování velkých dat. Nástup cloudů. Už se vlastně v roce 2016 o big data moc nemluvilo, protože to začalo mít negativní konotaci – stálo nás to stovky milionů a nic na tom neběží. "You’ve been Hadooped." Pak přišel svět cloudů, kontejnerizace, Kubernetes, a obrovský rozvoj HPC, Nvidia, CUDA, využívání GPU napojených do klastrů. V datovém světě pak rozvoj nástrojů jako Power BI.

K Power BI – Jirka to nezmínil, tak to doplním svým pohledem: jak zoufalí museli být lidi v Microsoftu, když nový databázový engine v prvním roce postavili na Textcelu? Pokud děláš reportingovou technologii, stavíš ji přece na databázi, ne? Pokud ovšem ta databáze není tak zastaralá a špatná, že raději jdeš na Textcel. Proto VertiPack začal na Excelu. Nevím, jak je to ověřené, ale slyšel jsem to na konferencích. Důvod, proč začali na Excelu a ne SQL serveru, byl ten, že SQL server měl roční inovační cyklus. Každý rok přišla nová verze a vlastně dneska v cloudu se technologii mění pod rukama mnohem rychleji. Dřív jsi musel mít minimálně týdenní projekt, během kterého jsi doufal, že nerozbiješ systémy nad SQL serverem. Bylo to složité a spousta firem na tom žila. Excel měl naopak půlroční release cyklus, a proto šli spíš na Excel – měl pružnější tým a mohli rychle tlačit změny...

(Tady původní text končí.)

Opravený text:

Rychlejší inovační cykly. Takže byli schopnější, rychleji to opravit. A teď neříkám, že mám přesně ty časy, je to jako konferenční šum a možná je to celý hezká historka, která je pravděpodobně jenom ze jedné třetiny pravdivá. Ale zase jsme u těch inovačních trendů. To bylo přesně o tom, že lidi v Excelu už začali tlačit Excel Services a začali tlačit online, dnešní 3-6-5ky, a už uvažovali o tom, jak to udělat do cloudu, jak to udělat nad Kubernetes, jak být rychlejší, jak zrychlovat. Tady je i příběh NVIDIA, která řekla: pojďme všechny ty softwary psát klidně jako quick and dirty, ale buďme na trhu první a zaberte ho, i se špatným kódem. A to je další velká změna mindsetu a paradigmatu, která tam byla. Takže takhle ty trendy za sebou šly a my vlastně s tím zpožděním v Evropě jsme od dne jedna v mezeře krát vznikli. Tenhle souběh tolika trendů nedokázal nikdo zachytit, protože každá firma byla specializovaná jenom na webové aplikace, jenom na databáze, jenom na BI, jenom na něco.

A my jsme přišli s tímto BI-íkem, který dochází dech a bude se hodně měnit, a data science začíná být fakt použitelná. Doporučuji knížku Data Science for Business, tam je přesně popsaný ten mindset, který jsme tehdy měli a pořád ho máme, jenom v modernější podobě. A to je ten moment a teď je hrozně těžké říct, co se dělo ty další roky, protože to hrozně zjednoduším. To, co se dělo, bylo, že jsme každý rok rostli zhruba dvojnásobně co do počtu lidí a nabírali jsme lidi, kteří byli ochotní s námi jít do tohohle tavícího kotle. V našem týmu byli softwaroví hardcore inženýři, kteří takhle koukali na dataře a na scientisty a říkali: „Ty vole, co děláš s tím gitem?“ Omlouvám se za ta slova, ale tak doslovně to ještě v Malém říkám, když popisuji naše chování. Z druhé strany byl data scientist a říkal: „Pane bože, co tady řešíš za blbost, to vůbec není důležitý pro ten use case, jak se to bude verzovat. Důležitý je to rychle nasadit, jestli to celé nezahodíme.“ Do toho tu byli dataři a ti říkali: „Hele, ty transakce nejsou ani acidní.“ ACID na transakcích znamená, že když pustíte nějaký příkaz, měl by se celý provést, anebo vůbec ne. Což když máte Spark a ten distribuovaně počítá na více klastrech nějaký výpočet a ukládá ho na nějaké distribuované úložiště, je docela tricky zajistit, že když se to někdy pokazí a spadne, tak to opravdu rollbackuje všechny ty výpočetní uzly, které provádějí ty operace. Takže většinou pak ještě musíte jít a dočistit to a musíte vědět, co se tam zapisovalo. A to byl velký problém, dneska už to problém není. Takže to byl další pohled na to. A teď jsme všichni měli silné názory, protože jsme znali své obory, jak fungují, a znali jsme state of the art praxi. A na sebe to ale nepasovalo. A teď přesně tam byli ti, které jsem popisoval. Proč jsme si vybrali Python? Bylo to něco, na čem jsme se dokázali shodnout. Nebylo to rozhodně nejlepší na nic z toho, ale spojovalo nás to. Proč jsme... (text končí)

Jasně, tady je opravený text s nápravou gramatiky, stylistiky a interpunkce:

E si vybrali Databricks tou dobou? Jako jedno z těch nosných témat, jak urychlit přidanou hodnotu, kterou dodáváme. Protože v Databricksu mohl přijít data inženýr a data scientist a jeden z nich tam vytvořil dobrou, ne perfektní, ale „good enough“ datovou pipeline. V té době, protože jsem měl ten verhauzový background, jsem měl problém říct, že to je opravdu „good enough“, ale fakt to stačilo. Na verhauz by to tehdy nestačilo ani smykem, ale na datově vědecké účely to bylo dostatečné a mnohem lepší než cokoli, co by si někdo napsal čistě v Pythonu. A pak tam byl ten data scientist, který si stáhl PyTorch nebo Scikit-learn a tyto knihovny, mohl natrénovat model a ten model zavolat, přidat nějaké váhy návštěvníkům webu a podle toho cílit reklamu. Což už zase dělal software inženýr, který se uměl napojit na to API. A oba dva si mohli koukat do kódu a pochopit ho, protože kdyby každý mluvil jiným programovacím jazykem, nikdy byste to nespojili tak, aby to fungovalo rychle a dobře. Nikdy to nebude agile.

No, super, a to chápu jako tu interní “melting pot”. Co externě? Jak se vyvíjel trh? Vy už jste do toho šli s nějakými kontakty, s nějakými prvními lídry, a neseděli osm lidí u stolu a nečekali, kdo vám kdy zavolá. Ale jak se vyvíjelo vaše postavení na trhu? Teď přemýšlím, zda to zazumovat do konkrétního oboru, protože to nelze říct úplně plošně. E-commerce se chová úplně jinak než banky. A ty vstupní pozice na trendy, které jsem zmiňoval, a technologie, které boomovaly, byly u různých velikostí firem a oborů odlišné, a mnoha firmám to dost zamotalo hlavu. Protože nakonec skuteční vítězové období byli ti, kteří dokázali vše integrovat dohromady, přestože typicky začali v online marketingu s Data Science a Big Data. To byla věc, kterou nebylo možné pokazit.

To, jak špatně se dělal marketing v roce 2010 z hlediska například personalizace, bylo dáno jen tím, že data už Google uměl poskytnout o reklamách a lidech, ale chyběla schopnost je správně přečíst — a to byla tabulka, která měla stovky sloupců, některé zanořené CSV. Pro člověka, který tou dobou dělal datový sklad a honil se s SCD2, historizacemi a podobnými detaily, aby mu neunikl ani jeden řádek faktury, protože byl důležitý, bylo v marketingovém steku normální, že dva řádky byly divně zaplněné, tak je prostě zahodili.

Ani to neházelo chybu. Protože pro machine learning modely to bylo stejně jedno — bylo to outlier, který by do trénovacího procesu nic zajímavého nevnesl. Takže úplně jiné paradigma, úplně jiný technologický stack. Teď pro ukázku projdu všechny naše klíčové momenty. Drtivá většina z nich je k nalezení i na našem webu, protože z toho vznikaly reference, case study. Jsou to veřejně dostupné informace a jen je teď trošku okomentuju z mého pohledu.

Pokud chceš, mohu text ještě nějak zkrátit nebo udělat jasnější.

Opravený text:

Ledu, jak to sedí na ty trendy, o kterých jsme se bavili, a i na ty industry. Jeden z nich je třeba MOL.cz, kde přesně v MOLu funguje kontejnerizace – no jasně, že to fungovalo. Tam jsme mohli vidět, jak se dělá kontejnerizace. To byla první firma, kam jsme přišli, a stačilo, že jim dodáme do kř. s nějakými parametry, jako jak dlouho se to načítá, jak rychle to má odpovídat. A oni si na tom Kubernetes sami nastaví, co potřebují, aby ten web MOL.cz běžel dobře. Neskuteční kluci a holky, co tam byli. A úplné wow pro nás, kteří jsme předtím byli třeba v bance, kde toto téma teprve začínalo.

Další zajímavý klient z těch začátečních dob je rakouský Red Bull, pro kterého jsme tady v Česku dělali management regálů na prodejnách. Red Bull je prémiová značka, takže když přijdeš do prodejny, bylo by fakt blbé, kdyby ta plechovka byla otočená logem do boku a logo na tebe nekoukalo. Taky by bylo blbé, kdyby regál byl poloprázdný. Proces doplňování regálů v Česku dost závisí na kvalitě doplňovačů, a tak si to Red Bull zajišťuje sám, aby to mělo tu správnou kvalitu. My jsme dělali to, že měli mobil, vyfotili si polici před doplněním a po doplnění, a my v Power BI jsme vytvořili pěkný report pro člověka, co má doplňování na starosti. On tak vidí, jak byl regál prázdný před doplněním a jestli byl opravdu doplněný. Taky vidí všechny cenovky na regále, takže si může zkontrolovat, že se prodává za správné ceny.

A zase, když se podíváš například na MOL.cz, pomáhali jsme s tím, co má být na produktové stránce, když si něco vybíráš, versus tady mám appku v mobilu, kde něco vyfotím a snažím se z toho něco dešifrovat. Proto se mluví o trendech tak zeširoka, protože by nedávalo smysl, že tohle dělají podobní lidé pod jednou střechou. Ale záleží na tom vidět přesně tu dynamiku. Někde vidíme, jak má správně vypadat práce s kontejnerizací, a to pak u nás může inspirovat, jak třeba udělat mobilní aplikaci, abychom na tom nevypálili celý rozpočet zbytečně, ale udělali přidanou hodnotu. Klienta nezajímá, jak je mobilní appka skvělá, responsivní a podobně. Jemu jde prostě o to, aby fungovala rychle a odeslala obrázek do cloudu, kde se děje to zajímavé.

A v obojím vidím machine learning, to bylo všude, protože šlo o to, jak z těch dat dostat hodnotu. V té době byly dvě možnosti. První je V.I., o kterém jsme se už bavili – ten příběh přes financování a controlling, kde víc dodáváš úsporu nákladů než zvýšení příjmů. Když šetříš náklady, můžeš dělat inovace, ale většinou u toho není tolik nadšení a takový typ lidí. Ostatně málokdy je finanční oddělení zdrojem velkých firemních inovací. Jsou firmy, kde je to výjimka, ale to je moje zkušenost z Verhausu.

Ta druhá strana je machine learning, který opravdu dokázal přijít s miliony malých rozhodnutí, které člověk sám nezvládne učinit. To byla ta opravdová inovace machine learningu.

Zde je opravený text:

Machine learningu. Když chceš udělat jedno velké rozhodnutí, lidi si najdou čas. Když chceš udělat miliony malých rozhodnutí, většinou je řešíš nějakým "ifem", který je ale v rozhodování hrozně neefektivní. A machine learning umí rozhodovat kousek po kousku specificky, když je dobře udělaný, a to může přinést zejména do marketingu ohromnou přidanou hodnotu. Super, super, tak pojďme to prolítnout.

Pojďme k dalšímu velkému tématu. Když už jsme teda začali a chceme mít všechny nohy, na kterých jsme tehdy stáli, tak velký příběh je Česká spořitelna, která se před mnoha lety začala transformovat z tradiční české banky. Řekli bychom, že IT tam bylo v tom nejhorším slova smyslu – kolik bylo vývojových prostředí v různých systémech a jak často se dělaly releasy, to bychom rádi nechali mluvit někoho z České spořitelny. Ale šli do obrovské změny, obrovské transformace.

Když dneska vidíš Tomáše Selmona, Martina Kobzu a další lidi z vedení, jak mají juniorní board a jak šlapou do firmy, aby byla zaměřená ne na to, kolik vyděláme přesně za půl roku tady a teď, ale na prosperitu klienta, to je přesně stejné nasazení na trendy, jaké jsme měli my. Pojďme si dát hodnotový cíl a teď hledejme ty nejlepší věci, které dělat.

My jsme přišli s tím, že umíme pomoct s personalizací a jak pomoct k prosperitě všech klientů v retailu. Těžko seženeš dost bankéřů a těžko budou retailoví klienti mít prostor, aby se o ně lidé takto starali. Ale AI a machine learning mají možnost opravdu dát nějaké rady – ať už bankéřům, nebo přímo klientům – aby dělali lepší finanční rozhodnutí. Není to perfektní, ale musíme si říct, že startovací bod byl: pošleme všem jeden e-mail, že když chtějí, máme autopůjčku v akci. A ty jsi přišel vyřídit si hypotéku na pobočku a v některých bankách je to tak i dnes – tam ti někdo tlačí autopůjčku, protože má na to incentivou. To žádnou hodnotu nepřináší.

Kdyby bankéř viděl, že ten člověk je přihlášený v internetovém bankingu a třeba na kalkulačce si kliká na autopůjčku, tak mu na míru, s přihlédnutím k riziku, připravíme předschválený úvěr a tobě uděláme incentivu na míru. Taková konverzace je pro všechny příjemnější.

Zažil jsem momenty, které myslím stojí za to říct veřejně, kdy si banka přemýšlela, jak využít AI k vyšší hodnotě. A ta hodnota se dobře měří penězi. Byl moment, kdy někdo řekl: „Jo, vydělá nám to víc peněz, ale těmto typům lidí ty půjčky asi nechceme prodat.“ A to bylo nakonec odmítnuto. Protože pokud tohle nemáš, tak agilita nikdy nebude fungovat, protože to všechno zhyperoptimalizuješ na něco, co nepřináší zákazníkovi hodnotu, ale jen akcionáři. A dlouhodobě ani akcionáři... (text zde byl nedokončen)

Pokud chceš, mohu text ještě více uhladit nebo zestručnit.

Jistě, tady je opravený text:

Je důležité, aby byl zákazník spokojený, a to i v bance. Když máš úspěšnou a bohatou klientelu, tak ta banka dodá větší hodnotu akcionářům. Na konci dne je to prostě tak, že to musí potvrdit někdo z banky, a podle mě to musí sedět. Takže to je další zákazník, s kterým dlouhodobě spolupracujeme, ale ne na konkrétních věcech, spíše na hodnotách a trendech. Chceme prostě, aby banky v Evropě byly úspěšné a pomáhaly zvyšovat prosperitu celého ekosystému. A opět jsme na té pozitivní straně inovací.

Teď, co se týká těch případů, o kterých mi říkáš, není to pro mě žádné překvapení. Takových firem bylo v té době několik málo, teď jich je spousta s touto nabídkou před pěti lety. Pojďme udělat fast forward do roku 2021. Bez vnějších investic děláte hlavně pro české klienty, z osmi lidí v roce 2016 jste se za pět let rozrostli na přibližně stovku. A kupují vás Francouzi, jedna z největších francouzských IT skupin na světě. Tak co se stalo mezi tím, co pro vás ten exit znamenal?

V kontextu trendů a hodnot jsme si někdy v letech 2018-2019 říkali, jestli půjdeme na západ, kde to bude těžké, nebo na východ, kde máme možná dost silný brand a bude to jednodušší. Trvalo to asi pět milisekund, než jsme si řekli, že chceme jít na západ, protože pokud chceme pracovat s těmi nejlepšími a dělat ty nejlepší věci, musíme jít na západ. A postupně jsme tam získávali klienty, jako třeba E-Shar a další zahraniční zákazníky, ke kterým jsme se tehdy dokázali dostat a něco pro ně dělat. Byla to úplně jiná liga.

Najednou jsi v západní Evropě, máš východní přízvuk, což není nic špatného, ale i kdybys byl Francouz v Anglii, musíš být zásadně lepší než Angličan, aby s tebou chtěli dlouhodobě spolupracovat. Musíš mít něco navíc. Současně jsou tyto trhy tak velké, s obrovskou konkurencí a velkými problémy, na které se z Česka nepřipravíš. Myslím, že už tady můžu zmínit, například máme Bayer.

Firma má sto tisíc zaměstnanců. Tam narážíš na problémy, jako je, kolik lidí mohu pustit do workspace Databricks, aby to fungovalo. Úplně jiný typ problémů, které v Česku těžko najdeš a na které se těžko připravíš. A ten zákazník zároveň očekává totéž, co český klient – řekněte mi, co mám dělat dál, jak inovovat a jak se změnit. Kdo v Česku je připravený radit firmě se sto tisíci lidmi, jak změnit organizační model, aby byla úspěšná v AI?

Škodovka má přibližně 35 tisíc zaměstnanců, myslím, že v Česku nemáme sto tisícovou firmu, ale v zahraničí ano. A ty firmy generují spoustu problémů, na kterých můžeš dělat cutting edge inovace a pochopit, jak to škálovat. Uspět na tomto trhu bylo extrémně těžké, pořád je a vždycky bude, a je to správně.

Naší základní otázkou bylo, jak to tady škálovat a jak mít více poboček, jak se prosadit v zahraničí. Hodně nám pomohli ekosystémoví partneři, kteří hledali dobrého dodavatele a měli s námi dobrou zkušenost tady v Česku, ale také věděli, že se...

Pokud chcete, mohu vám pomoci text dále upravit či doplnit.

Tady je opravená a stylisticky upravená verze tvého textu:

Sami to umíme dostat i jinudy. Takže Databricks a AVS? Ano, Microsoft, AVS a Databricks, ale zároveň tam byli i další hráči, které teď spíš jmenuju, protože všichni znají tyhle. A to byl náš plán, jak jít do zahraničí. Provedli jsme si assessment německého trhu, kde má smysl investovat pre-sale energii a něco tam prodávat. To je vůbec nejsnadnější úkol.

Navíc, jakmile v dané zemi začneš platit zastoupení a máš tam kanceláře, najednou máš stejné náklady jako místní firmy. To byla jedna z našich konkurenčních výhod – tenkrát jsme v Česku měli nižší životní náklady než v Německu, takže jsme byli schopni být levnější, i když to nebylo tak jednoduché.

Těžké bylo, že pokud chceš jít do velkých firem, tam často funguje jeden velký dodavatel s desetitisíci zaměstnanci, který má rámcovou strategickou smlouvu. Když s tím zákazníkem chceš spolupracovat jako menší dodavatel, zákazník ti řekne, že nastartovat onboarding malého dodavatele – u kterého neví, jak dlouho tam bude – je dost drahý proces. Bylo by lepší dohodnout se s tou velkou firmou, která tě může subkontrahovat a má na to zkušenosti. Takové firmy to totiž používají.

A teď hádej, co se stane s tvou velkou cenovkou, když do toho vstoupí právě takový mezihráč, který má hodnotu hlavně v tom, že má rámcovou smlouvu a umí to kontrahovat. Vše ostatní je naopak spíš negativní hodnota, kterou přináší. On má zájem tě nakonec nahradit a dělat to sám, ne s tebou. Navíc sedí na klíčovém bodě – na kontraktu – a vezme si nemalý kus tvojí marže. Nakonec zjistíš, že i když děláš na západním trhu, vyděláváš téměř za české sazby, protože ten kontrakt je pro klienta klíčová věc a zároveň taky není zadarmo. Firma totiž platí account managera, lidi běhající okolo a další náklady, které se promítnou do ceny.

A to byl moment té transakce, kdy ty jsi říkal „exit“, já tomu ale říkám nerad „exit“. Spíš to vidím jako vstupní bod (entering point) než jako odchod. Pokud chceš mít deal s velkou globální firmou, která tě dostane k velkým zákazníkům, tak ona nemůže mít partnerství s 200 lidmi z Prahy. Může si je koupit, ale dělat s nimi skutečné partnerství ne, protože je spousta takových hráčů, kteří by o to měli zájem, a ten model by nefungoval. Model funguje tak, že když je někdo dost zoufalý, akceptuje tu nižší marži a oni ho vezmou ke klientovi. To je pragmatický přístup, který znají všichni. Není to partnerství, spíš proces tlačený zákazníkem.

Tím jsme se dostali k té transakci – etablovat se a vyhrát velké trhy. Cítili jsme, že na to máme, že nejsme o nic horší než firmy, které tam již jsou. Naopak jsme cítili, že ta kaskáda – Tier 1 vendor, který dodá strategii, Tier 2 vendor jako konzultační firma, která rozpadne projekt na dílčí zakázky a připraví výběrová řízení, pak implementační partner nebo bodyshoppingová agentura – je v datech pomalá a dělá chyby. Na něčí potřeby to stačí a funguje to dobře, ale nedokáže to zajistit plnou agilitu.

Pokud chceš, mohu text ještě více upravit, zkrátit nebo přizpůsobit styl. Stačí říct!

Zde je opravená verze textu s lepší gramatikou, interpunkcí a větší srozumitelností:

Neděláš ty iterace. A když děláš něco jako „jak vydělávat pomocí machine learningu v online světě víc peněz a zároveň víc pomáhat klientovi, třeba rychleji se rozhodnout nebo zmenšit náklady, takže můžeš dávat nižší cenu,“ tak potřebuješ celý ten zpětnovazební cyklus. Jo, musíš udělat rychlý prototyp. Náš prototyp byl v té době, že jsme něco udělali v Pythonu.

Uložili jsme to do Excelu, vytiskli, přišli jsme za pánem nebo paní na callcentru a řekli jsme: „Zkuste navolat tento seznam s touto kampaní.“ Oni to navolali, koukli jsme na výsledky a bylo to: „Hele, to má stejné výsledky jako ten seznam, co tady dělá pět lidí dva dny.“ A trvalo vám to pár dní vytvořit. Když to teď budete půl roku optimalizovat, je dost velká šance, že se dostanete na lepší čísla. A to je agilita.

Takhle to jde udělat i s korporátem, ale jde to jen s určitými týmy a pokud máš nějaký rozumný rozpočet, což není vždycky. My jako malé studio, které má všechny tyto role dohromady, jsme byli schopni být takoví blázniví. Do dneška se snažíme prosazovat, že jsme takoví „cool kids“ v enterprise. Chtěli jsme být startup, ale ukázalo se, že startupy nemají data. A bez dat se AI dělat nedá.

Takže jsme takový startup, který chodí do enterprise prostředí šířit i tu startupovou systémovou kulturu, protože potřebuješ inovační myšlení a rychlé iterace — opravdovou agilitu. A opravdová agilita není o tom, jak často komituješ kód. Agilita je o tom, jak často zmíníš produkt svému koncovému zákazníkovi. O tom to má být.

A většinou k tomu ani nepotřebuješ psát moc kódu, abys tohle dokázal. To jsme se snažili lámat a na tom jsme fungovali. Brali jsme firmy, které vyhořely s kaskádou dodavatelů, a říkali jsme: „Zkuste na to pustit nás.“ Lidé už byli tak zoufalí — a dodnes lze najít dost takových, kteří jsou úplně zoufalí — že se na nás podívají a říkají: „Hele, ta prezentace, co mi tady říkáte, ten pitch je horší než od té konzultační firmy.“ Jo, je horší. A taky prototyp, co mi tu ukazujete, je horší než ten, co mi dodala ta specializovaná firma. Ale jakože to hraje dohromady.

A já po všech těch lidech, co mluvili pěkné řeči a pak se nic nestalo, nebo po těch, co dodali pěkný kód, ale nikdo ho nepoužíval, rád vyzkouším změnu, protože by to mohlo fungovat s vámi. A ono to pak skutečně funguje.

My postupujeme iterace po iteraci a zvyšujeme zároveň investici, kterou do toho člověk musí dát, protože má omezený rozpočet. Chceme, aby manažer, který nás angažuje a riskuje kus své kariéry, nešel do zbytečného rizika, ale jen do kalkulovaného. A to riziko má být v rozpočtu, za který ho nikdo nevyhodí.

My dodáme něco, co přinese důkaz tvým nadřízeným, že to má smysl a že jsi přišel na něco hodnotného. A pak sami dáme kůži na trh a klidně to sami doplatíme, aby se to dotáhlo do bodu, kdy máš ten důkaz. A s tím důkazem jdeš dál, bereš si feedback.

A může se stát, že...

Pokud chceš, mohu text dovysvětlit či upravit na ještě srozumitelnější styl.

Tady je opravený text:

Kdo řekne, že je to pěkné, ale je to malé, pro nás to není zajímavé. Je to dobrý nápad, ale pro nás to není zajímavé. Nebo se ti může stát, že někdo řekne: „Ty vado, my máme tu strategii, jak chceme být v budoucnu víc AI driven a tak dál. A máme na to dost budžetu.“ A ty jsi vlastně vymyslel něco, kde by to mohlo fungovat, a my ten use case opravdu potřebujeme. To je zajímavé, vlastně v tomhle oddělení jsme ani nečekali, že někdo něco vymyslí. A to je takové spojení top-down, té firemní strategie, s bottom-up inovací. Protože nakonec potřebuješ mít interního člověka, který má inovátorské myšlení. Ale ten člověk má občas problém najít ty lidi, kteří dělají top-down inovace. Protože si pamatuju, když jsem byl na zákaznické straně a obešel jsem šéfa šéfa, abych se bavil o strategii a něco mu řekl, tak to moji nadřízení v té „mezery“ málo kdy brali tak, že jim pomáhám. Vlastně není jednoduché ve firmě takhle otevřeně mluvit s někým, kdo je pod jiným B1 manažerem, a otevřeně něco sdílet, protože v té interní politice nejsou firmy na to vždy připravené. O tom vlastně nao být agilní transformace, ale omezení tu vždycky budou. A když jsi dodavatel, očekává se od tebe, že to propojíš.

Jak moc se změnil DataCentrix, nebo co se změnilo tím příchodem Atosu? Nechceš tomu říkat exit, spíš začátek? Přístup na zahraniční trhy, to, že máme možnost a strategické kontrakty a nemusíme přemlouvat někoho, kdo nás subkontrahuje. Můžeme přijít a říct: „Děláte tyto věci s tímto zákazníkem, určitě máte nějaké zkušenosti s C-level manažery nebo jinými manažery, co jako dodavatel umíte přinést za hodnotu. Nepotřebujete náhodou AI nebo machine learning?“ Úplně náhodou nezaznělo AI. A my máme tyhle akcelerátory.

Skvělé věci fungují, rádi je ukážeme, to je pěkný obsah, který tam můžeme vzít a pak z toho něco bude. Není lehké to poskládat, proboha, to vůbec neříkám. Ale tady tu nástupní platformu nelze udělat z pozice firm s 200 členy v Čechách.

Ok, kolik vás tedy je v DataCentrix, kam spadáte pod Atos a co znamená Evident? Dnes nás je zhruba 250. Praha, Brno, Temešvár v Rumunsku, různá města v okolí Paříže, ve Francii jsme hodně rozptýlení, remote a tak. V Německu pár lidí. A ještě někoho jsem asi zapomněl, omlouvám se, ale jsme v různých lokalitách napříč Evropou. Snažíme se dlouhodobě pracovat ruku v ruce s vedením, abychom budovali globální tým. Ty lidi jsou v různých právních entitách, jsou tam nějaké složitosti být globální firmou, ale na konci je tu tým přibližně 250 lidí v těchto lokalitách.

A klienty máte globální, hlavně evropské? Ano, portfolio se výrazně posunulo. Zatímco před akvizicí jsme měli pár zajímavých log a k tomu pár zajímavých projektů, teď si opravdu můžeme dovolit být ty, kdo dělají v Česku i Evropě... [pokračování překračuje limit, je potřeba doplnit].

Jistě, tady máte opravený text s lepší srozumitelností a gramatikou:

Český nebo spíše evropský inovační hub říkám proto, že já sedím v Česku. Kdybych seděl ve Francii, řekl bych francouzský a dohromady je to evropský inovační hub. Děláme to tak, že na jedné straně máme drtivou většinu opravdu velkých firem, velká loga a řešíme u nich složité projekty. Současně ale můžeme spolupracovat i s firmami jako je třeba český Akont, který vyrábí tepelná čerpadla. V rámci ESG a podobně mají velký příběh, a my jim pomáháme, aby mohli využívat AI třeba i k vyrovnávání a balancování elektrické energie na českém trhu – což je aktuální téma. To vše díky jejich modernímu přístupu a službě, která začíná výrazně překonávat konkurenci.

Takže pracujeme s evropskými firmami na úrovni SP500 nebo z nějakých významných žebříčků, ale také s tady středně velkými firmami, o kterých by se mělo mluvit. A také s různými inovativními subjekty, ať už startupy, nebo střední firmy, které se rozhodly zabrat a stát se skutečnými scale-upy po několika letech standardního byznysu.

Pro nás je důležité jedno: pokud máte data, a máte jich rozumné množství, a funguje tam statistika, tak s vámi chceme pracovat. Pak už je jen otázka, jak vymyslet obchodní model. Ve velkých firmách jsou tzv. šuplíky, musíme se někam zařadit a většinou na konci máte tajný materiál, smlouvu, nebo pevně daný čas a cenu. Debata probíhá s interním inovátorem a pokud najdeme způsob, jak mu pomoci dělat skutečně hodnotné věci, je další výzvou, jak se nezdržovat zbytečnými interními schvalovacími procesy a využít nástupní možnosti, které tyto firmy pro dodavatele mají.

Velké firmy často mají strategické rámcové kontrakty, které umožňují začít pracovat na projektu během měsíce. Když rámcovou smlouvu nemáte, musíte se připravovat i několik měsíců. To znamená, že ten, komu chcete pomoci, si přidává byrokracii na několik měsíců, což málokdy přináší příjemný start. A právě to byla hlavní myšlenka naší akvizice – umět tuto fázi přeskočit u velkých klientů a pomoci jim být rychlejší a lepší.

Pokud pracujeme s menšími firmami, preferujeme model úspěšnosti (success fee), kdy sami máme na stole „sasíky“ a profitujeme přímo z výsledků. V tomto rozsahu se na konci dne pohybujeme.

Co nám přinesla generativní AI? Už jsi začal tím, že vrcholem té vlny byl příchod ChatGPT, který ukázal, co všechno umí data science. Jak to vidím já a skrze slova a vhledy hostů zde na DataTolku a DataMeshu, vnímám několik vrstev. První je ta, že jak jsi říkal, ty modely a přístupy tu byly delší dobu, prostě „Attention is all you need“ – tedy další krok, technologií revoluce sama o sobě to nebyla, spíš revoluce v adopci.

Na druhou stranu, když mluvíme o AI, lidé jí konečně začali rozumět, protože si s ní mohli psát vlastním jazykem, a ona jim chytře odpovídala. Už nevnímáme AI jen jako spamové filtry, vyhledávače a statistiku, ale najednou se to materializovalo, ten pokrok totálně zamíchal kartami. Takže vy, kteří jste byli tradičně v AI, najednou přišlo generativní AI, a to muselo být... [text dále pokračuje]

Pokud chcete, mohu vám pomoci i s další částí, nebo upravit text ještě více podle konkrétních požadavků.

Zde je opravený text:

Jako supervlna poptávky na jedné straně a na druhé straně mám pocit, že jsme uprostřed jakési demokratizace — spousta věcí, které se v minulosti daly dělat v data science opravdu poctivě, už dneska nedává smysl investovat tolik času, protože jsou komoditizované. Typicky velké jazykové modely nebo NLP. Mám pocit, že tyto technologie smazaly do velké míry rozdíly. Takže co se stalo, když přišel ChatGPT a co se změnilo za poslední tři, čtyři roky z pohledu trhu?

Změnilo se to doslova masivně. A pokud nás poslouchá někdo, kdo u nás chce zakládat firmu, možná se mu to ani nebude zdát. Protože se každý půlrok až rok totálně přeskupujeme podle toho, jak se mění trendy a co chtějí zákazníci. Tentokrát to byl stejný pohyb, ale masivnější. Jelikož inovace šla z B2C sféry — kde to mohl každý hodně sám vyzkoušet — zatímco ve firmách bylo těžší s tím začít, proběhla inovace trochu jinak, řekl bych všude. Protože se nikdo nesetkal s podobným způsobem inovace, která by probíhala takto.

Zároveň ale proces zůstává stejný: pochopit, kam inovace směřuje, být na pozitivní straně té inovace, která mění svět, a účastnit se ekosystému, hrát v něm co nejsilnější roli s tím, co jsme vybudovali. A to je velká změna — vracíme se k akvizicím a podobně. Najednou nejsme tady jen dvě stě lidí v Praze, kterých si ve světě lidé všimnou s poznámkou „hezký tým, jeden z mnoha“. Super firmička, hezká práce, kluci, ale těžko se kolem nich bude psát nějaký strategický příběh. Dneska, když je tady to PR a veřejná informace — dva a půl tisíce lidí rozdělených do dost samostatných entit — aby se uhájila pozitivní stránka inovace... V těchto dvou a půl tisících lidech jsme i my. A to je důležitý bod — jinak by to nedávalo smysl. Takže jsme tam i my, včetně Honzy Procházky. Dá se říct, že tvoříme asi 10 % toho, zbylých 90 % jsou lidé, kteří vyrábějí superpočítače, případně servery pro běžné podnikové použití.

A vracím se zpět k trendům, které fungují trochu jako pulzace. Říkal jsem, jak vznikl DataSentix, ale ve skutečnosti trendy nevedly přímo ke vzniku DataSentix, to je spíš epizodní role v celkovém světovém vývoji. Řekněme, že vám to může dát aspoň nějakou inspiraci, jak tady v Česku fungovat, ale globálně bylo firem, podobných DataSentixu, víc. A náš vliv na to, co se ve světě děje, bude i kdybychom se hodně snažili, spíš na úrovni 0,0 s možnou jedničkou. Dál už se nikdo nebaví, spíš jde o to, kde ta jednička je než co je za ní.

K finálnímu výsledku došlo díky velkým jazykovým modelům (LLMK) a celé té nové inovaci. A teď ta pulzace začíná znovu.

Pokud chcete, mohu text ještě více upravit, zkrátit nebo zpřehlednit.

b. Teď je znovu potřeba si říct, které všechny trendy se dějí, a nikdo dneska neuvidí všechny, protože jde o multioborovou změnu. Navíc je to nejen multioborové díky B2C segmentu, ale na konci dne tato změna zasahuje fakticky každého. Kolik miliard lidí má dneska přístup k internetu? Přibližně tolik je velikost toho trhu, plus všechny firmy, které z té množiny existují. Takže ten obrovský ekosystém, který se mění, je masivní, a je skvělé, že právě teď můžeme žít v této době a že se toho můžeme třeba i účastnit.

A ještě teď vezmu specificky nás, tedy dva a půl tisíce lidí, kteří vlivem těch trendů dělají jenom AI. Proto jsem tady mluvil o těch GPUčkách, NVIDIA superpočítačích – aby dneska bylo možné pochopit, jak my přemýšlíme o pozitivní straně AI inovací, pochopit, v čem jsme dobří a jak to můžeme zkombinovat. Jsme dobří v několika věcech. Umíme pomáhat firmám, jak pomocí AI získat hodnotu. A tady GPT a všechny tyhle antropické modely a další jsou naprosto skvělé.

To, co jsme dřív museli složitě přesvědčovat, jak to bude drahé a kolik to bude stát, nyní jednoduše „navajbujeme“ a přijdeme s prototypem přímo na místo. Už nemusíme říkat: „Zaplaťte nám půl milionu za to, že vám uděláme důkaz hodnoty.“ My tam přijdeme a on na to kouká – je to důkaz hodnoty. Takže to je masivní změna i pro nás, protože můžeme být mnohem odvážnější v produktech a znovu rozjet náš produktový „sval“.

Takže teď tady malá reklama na TechBuddyho jakožto agenta, asistenta pro technické supportní týmy. Ale to není náš první produkt, že? Pamatuju si, že ještě... máme spoustu produktů. Historicky, před Evidenem, dokonce ještě před Atossem, když vyšla ta tiskovka tehdy, přišlo mi zvláštní, zda nekupují produkt, protože mi přišlo, že spíš kupují professional services, ale vnímal jsem snahu vytvořit už produktový deal. Takže teď váš aktuální jeden z těch produktových směrů je TechBuddy.

Ano, různě v čase máme různé podíly těch „krabiček“, které IT průmysl řeší. Byla doba, kdy s námi spousta klientů přišla a ptala se: „A vy dokážete dodat i professional services?“ Tedy pomoci nám postavit tým a udělat to interně? To jsem vůbec nevěděl, je to skvělé.

Taky byla doba, kdy produkty byly odsunuté na druhou kolej – ne úplně, ty, co fungovaly, byly dál podporované, ale inovační “sval”, který vymýšlí nové produkty a musí do nich investovat, byl omezený. To bylo spojeno s lidmi, investicemi a tím, jak čísla musí sedět.

Ale nikdy jsme se nedostali do bodu, kdy by šly do produktů nulové peníze. Vždycky tam peníze šly, už jen kvůli tomu, že třeba AdPicker nám konzistentně funguje. Jako produkt se zaplatí. Jasně, nemáme stovky tisíc zákazníků globálně, ale ne každý produkt musí skončit neúspěchem. Pokud chceš investici od venture fondu, každý tvůj produkt musí skončit... (text dále pokračuje).

Tady je opravená a stylisticky upravená verze textu:

Hokejkou. Jinak se nezajímáš. Každý tvůj projekt musí slibovat, že skončí hokejkou. Pokud chceš pochopit, jak fungují nějaké technologie a jak přinášejí hodnotu, stačí udělat produkt, který má dost zákazníků, aby se uživil – to bylo naše iniciální motto. Potkali jsme se tady lidi z různých oborů, kteří chtějí dokázat, že ta práce má hodnotu, a společně vytvoříme větší hodnotu. A jak jinak to chceš katalyzovat, než tím, že uděláš vlastní produkt, do kterého dáš vlastní peníze, za které sis mohl pořídit cokoliv jiného – třeba je vyvést z firmy a koupit si něco hezkého pro sebe.

Takže produkt je pro nás vždycky flagman a něco, kam chceme směřovat. Ten princip hezky popisuje Ray Dalio ve své knize. Chceš dělat inovace, ale nejhorší inovace je ta, u které zchrachuješ. A je dobré nad tím trochu přemýšlet. Proto se stále snažíme udělat produkt, který bude mít hokejku a bude v AI brutálně nejlepší. Jdeme na to ale s pokorou. Tady máme lidi s technickým zázemím, pořád je to malý tým z Evropy. Už nejme jen malý tým z Prahy, ale stále je to malý tým z Evropy. Šance, že najdeme produkt s velkým "P" a vytvoříme tady druhý Product Board, je relativně malá, zvlášť když děláme i další druhy byznysu. Nakonec musíme správně zaměřit fokus, ale pořád to chceme najít.

Jsme zpět u toho týmu, který máme dohromady, a chceme být na pozitivní straně inovace. Věříme, že teď máme největší šanci s takovým produktem udělat ohromný otisk po Evropě. Už nejsme malý tým z Prahy, ale malý tým z Evropy. Ve skutečnosti jsme jediný tým v Evropě, který dokáže spojit pod jednu střechu výrobu superpočítačů, AI počítačů a vývoj AI use caseů a inovací na konci. Teď záleží jen na tom, jestli dokážeme udržet ty správné principy fungování, dohodnout se, pochopit, kam svět směřuje, a najít místo, které můžeme zaplnit. Protože ta mezera, která vzniká, je asi stokrát větší než před deseti lety, kdy vznikala Centix. A máme stokrát lepší výchozí pozici než jako pětiletý startup. Když tomu přičtu, že startup je superrychlý, kde můžeš věci měnit, tak pokud dnes mluvíme o tom, jak má Evropa uchopit AI, kdo jsou v Evropě klíčoví hráči? Je to SAP?

Abychom skutečně mohli přistoupit k AI jinak, podle mě hodně datařů vnímá, že je těžké s daty pracovat – hlídají si je, je špatné je sdílet, tabulky nejsou přehledné, protože mají složité infoviews a modely, data jsou fyzicky uložena komplikovaně a špatně se z nich extrahují informace. Dnes ale SAP spolupracuje s Databricks v rámci Business Data Cloudu, umí data lépe sdílet. To je teď horká novinka – toto spojení. SAP se otevírá trendu, který nastupuje, a otevírá se také ekosystémovému přístupu – nebudu tu sám, izolovaně, ale chápu, že to musíme složit dohromady.

Pokud chceš, mohu text ještě více zestručnit nebo přizpůsobit konkrétnímu stylu.

Tady je opravený text:

Tu inovaci. Jestli máme v Evropě tým, který umí udělat něco velkého dneska, na škále statisíců nebo desítek tisíců firem, lidí, globálně, tak je to prostě SAP. Je to jeden z největších softwarových domů na světě, který pořád dokáže šlapat na paty tady Microsoftu, Amazonu a dalším. Nechci říkat, že nemá nějaké problémy, každý je má, i Azure a další, ale SAP bychom měli začít milovat tady a pomoct mu, aby to tady fungovalo. Je to velký hráč, určitě SAP, který do toho má co promluvit. A takových firem tady v Evropě najdeš víc, které do toho dokážou promluvit víc, než by se zdálo. Schwarz Group je německá, ale i různé firmy ve Francii a tak dále. A my teď jsme jednou z těch firem, která má velkou stopu na celém evropském trhu. Máme unikátní fíčury v AI, které ostatní nemají a nemohou mít.

Dneska už v Evropě nevybuduješ novou továrnu na hardware. Vlastně je to velký e-ford od nás, jak z té továrny na superpočítače udělat továrnu na AI – ze vším všudy, i s těmi use casy na konci. A jakou roli máme v tom ekosystému, to čas odhalí. Teď je důležité rozmístit ty sázky, kde tomu věříme, a být tavicím kotlem nejchytřejších lidí, které dokážeme pozbírat, a zároveň nejchytřejších zákazníků a nejvíce dopředu hledějících zákazníků a partnerů.

Tady bych chtěl všem těm lidem, co ten příběh s námi píší, aspoň v tomto bodě, pokud doposlouchali až sem, poděkovat, protože i když s námi někdo strávil pět minut, nebo teď my tady ve studiu, každý se to otiskne a nikdy nevíš, co ti dá ten poslední okamžik. To, co byly transformery pro vznik LLM, je něco, co nikdy nevíš, že přijdeš. NVIDIA o transformerech zavadila tak, že Jensen četl všechny e-maily zaměstnanců, kteří mu je každý den poslali a hodně z nich mluvilo o transformerech. Google, který je vynálezce, to na začátku přehlížel. Takže to může být náhodný e-mail od někoho, který ti pospojuje nějaké věci dohromady, a z toho se zrodí nový, ultimátní produkt, který pomůže minimálně na evropském prostoru a možná i globálně.

Myslím si, že v Datacentrix před deseti lety naše šance na takový průlom byla 0 %. Jen samotný být na trhu byl velký cíl, který ne každýmu se podařil. Je super, že i dnes můžu tento příběh říkat s tím, že za námi jsou nějaké výsledky. Je to to, co chceme dělat s klienty. Nechci tady jenom mluvit o budoucnosti, i když to tak může občas znít, ale teď se tady něco děje znovu a fakt máme dostatečně vysokou procentuální šanci, abychom tady něco velkého dali dohromady. Jen musíme být chytří, flexibilní, agilní, udržet si tento mindset i v kontextu velkých věcí a velkých firem, protože i s tím, co se děje v Americe, a s naší závislostí na jejich IT, nahrává tomu, aby tady v Evropě něco velkého vzniklo.

Jo, já s tím souhlasím. Taky se mi posunuje vnímání těch celků – tak pět let zpátky bych řekl, že je super, že máte tuto příležitost.

Pokud chceš, můžu ti text i více upravit pro lepší srozumitelnost nebo stylistickou úpravu.

Opravený text:

Je škoda, že daně z této příležitosti půjdou do Francie. Teď, o pět let později, vnímám, že ta hra se nehraje Francie vs. Česko, že to už dávno neplatí, že herní plocha je někde jinde, a jsem rád za to, že to vzniká na úrovni Evropské unie a že tohle se děje, že se nějak snažíme držet krok v tom závodě. Je úplně super, že kluci z Prahy, kteří začali třeba BI Camp, Data Science nebo AI Before It Was Cool, jsou teď dostatečně cenění a jsou součástí toho.

Ty diskuze velkých hráčů o tom, jak bude vypadat budoucnost technologické Evropy, jsou podle mě skvělé – moc gratuluju. Když ještě trošku uzavřu to GNI, tak pro mě, co tam slyším, je zaprvé důležité, že jste měli nastavený nějaký manifest, vizi, jak to chcete dělat, která nebyla navázaná na konkrétní technologii. Díky tomu jste vyrostli, a díky tomu i GNI, nebo GGT, LLM a jejich nástup, byl vlastně business as usual – pořád jste se měnili, a teď jste se změnili jenom víc, protože příležitost byla větší. Co vnímáš jako zásadní, byla ta demokratizace – to, že to bylo najednou B2C a že z hodně B2B a užce zaměřeného data science se najednou stala AI, která zajímá od posledního freelancera po největší českou firmu a všechno mezi tím. Tohle vám otevřelo dveře.

Hrozně mě baví, jaký k tomu máš přístup – že dvakrát do stejné řeky nevstoupíš, pořád se něco děje, teď končí jeden hype cycle, začnou čtyři další, a jak se poskládají, to uvidíme. To mě fakt baví. Jsme tady, co mi přijde super důležité – ty jsi tady vyjmenoval nějaké knížky, které nejsou o konkrétních technologiích, jako jak na Python nebo podobně, ale jsou hodně non-fiction, softové. Dost mě překvapilo, jak moc na ně kladete důraz, tak pojď nám nakonec popovídat, co jsou tvoje inspirace, co ti pomáhá nebo vám v DataCentrix orientovat se v tom dynamickém prostředí. Pro mě je překvapením, že jsou tou vaší „ústavu“ nebo „KOROVIM“ právě takovéhle knížky.

No, jak jsem říkal, na začátku jsme seděli jako hard-core controllingoví datáři – řekněme já jako pojišťovák aktuár s pojistnou matematikou a softwarový inženýr s úplně jiným backgroundem – a měli jsme problém vysvětlit, co děláme a proč. Ale většinou každý z nás znal nějakou knížku, kde si někdo dal tu námahu vysvětlit, jak ten obor funguje a proč. Například od O'Reillyho kniha Data Intensive Application Design (něco takového), která je v seznamu, vysvětluje, proč a jak se vyvíjejí big data nebo systémy na zpracování velkých dat, jako je Spark. Spark: The Definitive Guide je další významná kniha, která to neskutečně dobře vysvětluje. Půlka toho, co s daty znám, je stále extrémně validní, a co se týče datových skladů, ta fyzika, jak pracovat s daty, se nezmění. Druhá půlka je o tom, jak funguje softwarový proces a proč vůbec něco, o čem uvažujeme, funguje. Pro mě, jako pro člověka z databází, například uložit data a nedat tomu schéma, jak to budeš číst, je nepředstavitelné.

(Pokud chceš, mohu text dále doplnit nebo upravit.)

Jasně, tady je opravený a trochu uhlazený text:

No prostě, když nevíš, jestli je to datum, zanořený CSO, a teď přišlo z druhé strany, prostě mám nějaký data, potřebuju je rychle někde dumpnout a nemám na to moc času, plus je to dost drahý, jak to mám udělat? A teď nám to nějak nevyšlo, takže aha, proto je JSON taková inovace a všichni ho mají rádi, a taky se to nějak dál vyvíjí, vzniklo z toho třeba Delta, Iceberg a ty Column Store souborové formáty. A to nám dalo základ – začali jsme číst jako blázni, protože kdykoliv někdo vymyslí velkou inovaci, tak většinou pak o tom sepíše knihu. A máš dvě kategorie knih – od lidí, kteří chtějí vypadat důležitě, a od těch, kteří chtějí ve větším rozsahu předat své hluboké znalosti.

Druhý typ těch knih je neuvěřitelně objevný, i kdyby byla deset let stará. Děje se to proto, že se ty obory navzájem ovlivňují, a typická situace je, že musíš zahodit polovinu toho oboru, ale ta druhá polovina zase vyživuje nějaký hype, který přichází. A ty nevíš, která polovina je která. Proto je dobré si přečíst knihu, která o tom mluví souhrnně, a udělat si vlastní názor. A to silně obrušuje hrany, když mají dva fakt dobří lidé diskutovat.

A někdo mi pak napíše, že je to můj framework, jak se nesvádět. Protože je hrozně důležité se svádět. Mimochodem, další naše pravidlo je upřímnost, zpětná vazba a schopnost ji přijmout, i když není příjemná. Třeba Radical Candor – to je pěkná a trochu dvojsmyslná kniha.

No a jak teda pracujete s knížkama? Máme seznam, reading club na Sleku, na Nosnu, snažíme se doporučovat. Když někomu dávám feedback, řeknu třeba: „Hele, to bylo fajn, jak jsi o tom mluvil, ale stojí za to přečíst tu Minto Pyramid, jak strukturovat komunikaci, aby byla pochopitelná.“ Ta je taková bible pro konzultanty, podobně jako McKinsey Way. Protože co říkáš, je super, ale obtížně se to přijímá ve formě, jakou to předkládáš. Tenhle člověk to zvládl, já trochu pomohl, ale klidně bych mohl dávat roky zpětnou vazbu.

Nejsem sice skvělý trenér, ale někdo napsal celé knihy, na kterých vyrostla generace konzultantů, kteří v tom jsou dobří. A já nechci, abys ty byl konzultant. Ale když si je přečteš a naučíš se aplikovat to na moment, kdy představuješ své myšlenky, architekturu, a jsi v pre-produkční fázi – to znamená, že už to není jen vymyšlený a ty nemáš za úkol jen vymyslet jak, ale pomáháš co se má udělat – tak plníš roli konzultanta. Tak si prostě přečti knížku. A ta knížka s tebou bude dalších deset let. Kdykoliv se zase dostaneš na tenhle typ meetingu, problém v technologii, tu knížku otevři. A nejen to – tu knížku můžeš použít jako já a říct někomu…

Pokud chceš, můžu text ještě víc zestručnit, vysvětlit nebo upravit do konkrétního stylu.

Opravený text:

Ať si ji přečte a pak se o tom pobaví. Takže cílem je, aby si každý fakt jednou měsíčně našel čas přečíst knížku. Realita je taková, že jsou lidi, co se do toho opravdu chytnou a přečtou jich hodně, a pak jsou tací, kteří si přečtou jednou za půl roku. Ale pojímám to tak, že nic nemá lepší návratnost. Nic ti nevydělá tolik jako kvalitní knížka, kterou si přečteš. A jaké jsou nejvíc data-centric knížky? Doufám, že to tady bude pak i zveřejněné. Nejvíc data-centric je tady třeba "Data Science for Business". Už jenom tím, že jde o Data Science, ať už jsem kdo jsem, je cítit, že některé věci si musíš trošku posunout. Potom knížka, kterou já hrozně rád doporučuji, je třeba "Extreme Ownership". Ta hodně pomáhá, zvlášť tady v Česku. Často vylezeme z vysoké školy a myslíme si, že nám někdo zajistí úkol, díky kterému dostaneme dobrou práci, a jen jdeme na pohovory. Ale ono je to skutečně jinak.

Nedávno jsem byl – rychlá vsuvka – s mentorem Ethanem Evansem, bývalým viceprezidentem ve AVS, což je jedna z nejvyšších pozic. Na tom školení bylo se mnou 150 lidí z různých firem, tady prostě z Meti, Googlu a dalších. A všichni přemýšleli jenom nad jedním: jak mít větší dopad v té firmě, kde pracují. Nikdo nepřemýšlel o tom, jestli je v práci spokojený. To bylo samozřejmě, že umí si vyřešit, aby je práce bavila. Zároveň ale velmi vážně řešili třeba to, jak si to nastavit doma, aby mohli podávat velký výkon na těch náročných pozicích – a velmi otevřeně to řešili. Bylo jich tam 150 a zabývali se například typickou otázkou: "Hele, mám takovéhohle píáru/nebo i šéfa a je to těžká osobnost. Jak s ním mám vycházet a tvořit efektivní tým?" Ne "Můj šéf je kretén, proto nic nemůžu", a chodím na pohovory, ale nechci mu to říct, protože by to byl těžký rozhovor". Nechci mu dát feedback, proto máme…

A ta kultura – a není to jednoduché – učit se dávat i přijímat feedback, a zároveň rychle je lepší než kvalitně. Což nutně vede k tomu, že ne každý feedback bude jednoduchý. Protože když dáš dobrý feedback, budeš ho připravovat třeba měsíc. A když někomu dáš feedback s měsíčním zpožděním, tak se mu ho fakt blbě zpracovává. Takže je mnohem lepší pracovat na té kultuře. Je to individuální, já bych tady nechtěl… to je přesně problém radical candor – té metodiky, která tam je, je skvělá. Špatné ale je, že autorka zjistila, že se to prodává tak, že najdeš přesně toho egoistického, obtížného šéfa – mírně řečeno – který má problém, že ho zaměstnanci nemají rádi, a proto si zaplatí její konzultace, jak to pomocí zpětné vazby zlepšit. Pro ni je to skvělý vstup, jak uspět. Ale pointa je, že tenhle mechanismus je vykreslený příliš pozitivně.

Když dáváš feedback, nikdy bys neměl druhého zranit. Tedy, když dáváš feedback méně seniornímu člověku, neměl bys ho zranit. Pokud ale dáváš feedback víc seniornímu člověku, neměl bys brát ohledy na to, jestli ho zraníš, nebo ne. Od toho je seniorita, aby ten feedback ustál. A ono se to také líp ustojí. Kdy…

Zde je opravený text:

Když ti něco říká jeden z padesáti lidí, se kterými kooperuješ, tak většinou to neneseš tak těžce, jako když ti feedback dává tvůj šéf, o kterém si myslíš, že je polobouk, a ty jsi junior. Takže je důležité tohle správně nastavit, a není to jednoduché. Jsme všichni nerdy. Kdo z nás umí citlivě pracovat s feedbackem a je v tý firmě people člověk? Po těch letech jsme lepší a nějak jsme to vybudovali – a to je zase trochu vzkaz k nám do firmy. Pokud tady někdo stragluje, ať už jedním nebo druhým směrem, vždycky jsem tu já a další lidi, na které se můžete obrátit – proto má každý mentora, proto je tu Hanka, proto já a Petr a další manažeři chodíme do kuchyňky. Snažíme se ty příběhy poslouchat a vnímat, protože udržet tu vysoce výkonnou kulturu, která tlačí inovaci, kde se neustále prolínají různé backgroundy, a která nutí rychlost a zpětnou vazbu, to je výzva.

Radical Candor je pro nás jedna z klíčových knih. Ale podle mě je to spíš návod, jak dávat zpětnou vazbu nahoru. Není to kniha pro lidi, kteří přemýšlí, jak kontrolovat lidi pod sebou. Pro ně by měla být tato kniha zakázaná, zamčená a měli by číst úplně jiné knihy, třeba „Jak vést těžké rozhovory“ a další.

Pointa je, že pokud dávám feedback někomu, kdo ho nemusí ustát, tak ho během feedbacku trochu „rozbiju“, ale pak ho musím umět složit zpátky, aby odcházel s inspirací, ne se pocitem, že se po něm někdo vozil. Radši celý feedback nedodám, než abych riskoval, že ho na konci nezvládnu správně složit. To je však úplně něco jiného.

Ale pro člověka, který má v práci nadřízeného, je dobré si Radical Candor přečíst a otestovat, jak to dopadne. Hodně to napoví, jak dlouho v té firmě chce ještě být. Protože od toho tam ten šéf přece je – abych mu mohl říkat těžké feedbacky. A pokud jsme byli třeba na meetupu, kde mě šéf ztrapnil před celým týmem a já nechápu proč, měl by to vědět. Možná má nějaké vysvětlení, možná bychom byli kamarádi, kdybych ho chápal, a možná ne. Vědět, jestli vysvětlení má nebo ne, je alfa i omega týmové dynamiky, a to jsme u toho extreme ownershipu.

Pokud si řeknu, že mi je jedno, jaká je dynamika mého týmu, protože přece nejsem team leader, tak mi to ani nenáleží. Tak se nemůžu divit, že ta dynamika je špatná, když jsem něco, co je pro mě důležité, delegoval na někoho jiného – přitom vždy představuju nějakou část. Mně osobně hodně sedí a líbí se mi, že první na celém seznamu je extreme ownership. Trochu to vnímám tak, že to byla tvoje cesta: nikdy jsi neřešil jenom tu svou „škatuľku“, ale ptal ses „proč?“ a „proč?“ – a proaktivně jsi zapojoval ostatní, abys problém vyřešil, ne jen splnil svoje zadání. To tě pak vedlo k Petrovi a DataSentiks.

Story DataSentiks mi přijde, že stojí právě na pevných základech a na tom, že jste si vzali za své nějaké hodnoty, a nevytvořili jste si prostory, ve kterých na vás nemůžou. Díky tomu jste vyrostli a daří se vám stále víc a víc dávat větší potenciál.

Pokud potřebujete ještě něco upravit, dejte vědět!

Jasně, tady je opravený text:

Myslím si, že to je skvělá rada na závěr pro kohokoliv, kdo nás dneska poslouchal – brát ty věci za své.

Brát za ně zodpovědnost, když se něco týká mě, tak to řešit, i když to třeba nemám přímo v popisu práce. Možná takhle agilně se každý ve svém životě dostaneme k většímu štěstí v práci, ve vztazích a ke spokojenějšímu životu obecně. Já určitě nasdílím celý ten seznam, protože mě překvapilo, jak zajímavý je ten seznam literatury. Spoustu těch věcí znám, ale nečekal bych, že v data science firmě to bude povinná literatura. To mě fakt baví.

Honzo, moc ti děkuju, těším se na náš další rozhovor, kde se třeba pustíme do superpočítačů, AI a do toho, jak spolu tyto dva obory souvisí, co z toho může vzniknout a proč dneska superpočítače dávají smysl. Děkuju, že jsi nás provedl Datacentrixem a svojí kariérou. Zase někdy brzy příště.

Taky děkuju za tu příležitost. A možná příště místo mě pozveme někoho jiného, protože tohle byl pohled mě jako CTO na celou problematiku. Kdyby tady byli třeba David Vopelka, Petr Bednařík, Ondra Funyok nebo další lidé, říkali by úplně jiné věci, které je formovaly. A to jsou zase jiné backgroundy. Je důležité udělat si vlastní názor. Nemáme jedinou historii, kterou bychom měli všichni vyprávět, protože nikdo neví, jak se to vyvine. Máme jednu verzi historie, kterou říkáme dnes, ale může být, že nás tady někdo bude poslouchat za rok, dva nebo pár měsíců. A kdybych teď měl shrnout, jak to vidíme, za rok už se budeme bavit jinak o HPC, možná bude jasné, kam trh směřuje i celý svět. A dnešní rozhovor pak možná nebude dávat příliš smysl.

Proto jsem mluvil o trendech, proto jsou tady ty knížky. Budu moc rád, když si někdo některou přečte a dá vědět, ať už tobě, nebo třeba na LinkedInu, že si z toho něco odnesl. A vlastně, co jsem říkal – klidně zapomeňte! Ty knížky napsali chytřejší lidi, než jsem já, dali si s tím víc práce než já s přípravou na tuto schůzku. Náš příběh je pořád malý a nezajímavý vedle velkých AI příběhů, které píší větší firmy s mnohem větším počtem lidí než máme my. Ale příběh se stále píše, takže držím palce a moc děkuju.

A díky, že jste doposlouchali až sem. Také děkujeme našim partnerům: Index, Saska, Bystreet, Colors of Data, Revolt BI, Good Data, Keboola, Emark, Carl Data Company, DataMind, Notino a Flow.

Pokud chcete zůstat v obraze, co se české datové scény a globálních datových technologií týče, nezapomeňte se registrovat k odběru našeho týdenního newsletteru na datatalk.cz.

Nechť vás provází data.

Pokud chceš, můžu to ještě upravit do více formální nebo naopak uvolněnější podoby.

Podcast

Data Talk #147: Jan Procházka (DataSentics)

Strojový přepis

Odebírejte Data Talk