Data Talk #148: Michal Najman (Aim)

V novém díle Data Talk podcastu si Jirka Vichrek a Barbora Hinnerová povídali s Michalem Najmanem, zakladatelem a CEO Aim, o cestě od robotiky a kybernetiky na ČVUT přes výzkum malwaru v Avastu/Genu až po vlastní startup. Michal popsal, jak ho práce na detekci podvodných e-mailů inspirovala k vybudování vertikální AI platformy pro „osobní business briefing“, určené hlavně VC partnerům a startup founderům. Sdílel zkušenosti z chaotických začátků, kdy před stavbou produktu nejdřív validoval problém u cílové skupiny, i proč považuje data a human-in-the-loop přístup za klíčovou konkurenční výhodu. Diskuse se dotkla technických aspektů stavby AI produktů, rychlého prototypování pomocí generativních nástrojů a toho, jak se mění role programátorů v době, kdy 95 % kódu generuje AI. Michal také nastínil, kam Aim míří, jak plánuje expanzi na americký trh a proč je podle něj v roce 2025 jedinou správnou strategií AI startupu rychlá validace a důraz na unikátní data.

Strojový přepis

Dobrý den, moje jméno je Jirka Vicherek.
Ahoj všem, moje jméno je Barbara Hinerová.
A vítáme vás u dalšího dílu podcastu Datatalk.
Naším dnešním hostem je Michal Najman, founder a CEO EIMO.
Ahoj Michale.
Ahoj, ahoj všichni.

Dneska se s Michalem podíváme na produkty postavené na jazykových modelech a generativní AI, protože právě jeden takový produkt v EIMu staví. Michal si založil startup LLM Qum a AI se ale věnuje dlouhodobě, takže se podíváme i na to, co měl na svědomí v Genu, jeho předchozím působišti, a také kam se trh vyvíjí. A pokud byste chtěli sami stavět AI startup v dnešní době, Michal za poslední dva roky získal spoustu zkušeností, které se vám budou hodit.

Začněme ale od začátku, Michale. Kde začala tvoje cesta v data science a IT a jak se to překlopilo do startupové historie?

Já jsem kdysi dávno na střední škole dělal weby, to byl můj vstup, ale to zajímavé podle mě začalo až na FEL ČVUT, kde jsem studoval nejdřív kybernetiku a robotiku a potom umělou inteligenci na magisterském studiu.

– Takže jsi studoval super obor. Když jsi to začal studovat, tušil jsi, že to bude takhle cool?
– Netušil, netušil. Dokonce sousloví „umělá inteligence“ tehdy bylo takové divné. Bylo to prostě o humanoidních robotech, kteří vám vyperou, a bylo to obrovské sci-fi. To, co mě na tom zaujalo, byla spíš robotika a vůbec způsob, jak přivést inteligentní věci do normálního života. To mi přišlo strašně zajímavé. Když jsem byl na otevřeném dni na FELu a ukazovali tam robotické ruky, strašně mě to zaujalo. Říkal jsem si: „Jo, super, tohle chci dělat.“ Postupně jsem zjistil, že mě baví spíš kódování než tranzistory, a přirozeně jsem přešel do umělé inteligence. Machine learning a data science mě hodně bavily.

Měl jsi v tom nějakou specializaci, na co ses zaměřoval a jaký byl tvůj skillset, když jsi absolvoval?

Když jsem vyšel z ČVUT, hodně jsem se zaměřoval na machine learning a teorií učení. Dělal jsem na to bakalářku i diplomku. Byl jsem také na stáži ve Finsku u profesora Matase, kde jsme dělali „dense captioning“, což byla v té době nová metoda, kdy máte obrázek a chcete ho popsat. Cool na tom bylo, že dokázala popsat více objektů na jednom obrázku, nejen jeden.

Kdy se to všechno odehrálo, kdy jsi byl na té stáži a kdy to všechno začalo?

Na té stáži jsem byl na konci bakalářského studia. Je to docela vtipná historka: byl jsem na Erasmu ve Finsku, kde semestr začínal dřív, takže ještě v Česku probíhalo zkouškové. Neměl jsem dodělanou jednu zkoušku právě u profesora Matase. Když jsem mu psal, že se nebudu moct dostavit ústní zkoušku, protože už jsem ve Finsku, napsal mi, že nevadí, že právě letí do Tampere, přesedá ve Helsinkách, a tak se můžeme potkat a udělat ústní zkoušku na letišti. Tak jsem tam s ním tu zkoušku skládal a dopadlo to skvěle, myslím. A na základě toho mě profesor Matas pozval...

Na tu stáž jsme se začali zabývat tím skeptickým přístupem. A co to byl za rok? 2017, 2018, něco takového. 2017, 2018. Pracoval jsi při škole? Jo, vždycky jsem se snažil něco dělat, takže například jsem byl v Social Breakers jako stážista, chvilku jsem byl v Data Breakers, což byla moje první zkušenost ve startupu – bylo to strašně zajímavé pracovat v malém týmu na něčem zajímavém, vlastně vyvíjet inteligentní produkt. Byl jsem také v Qminers, kde jsem dělal kvantové výpočty. Pak přišel ten gen? Pak přišel ten gen, no, a to bylo trochu propojeno s tím, že jsem diplomovou práci dělal pro Trend Micro.

Šlo o generální strojové učení a mým vedoucím byl Vilem Lysý, který byl jedním z těch lidí, kteří s profesorem Pechoučkem odešli do Avastu, když se tam stal CTO. A já jsem v té době také nastupoval do Avastu, takže se to pěkně spojilo a díky tomu jsem mohl být součástí Moonshots týmu, který tam Michal Pechouček založil. Tak se na něj pojďme podívat. Rok 2019, ty nastupuješ do Avastu, konkrétně do Moonshots týmu. Jak ten tým vypadal, čemu jste se věnovali, jaká byla tvoje role? Ten tým byl research laboratoř a velkým cílem bylo vzít umělou inteligenci a změnit způsob detekce virů a malwaru tak, aby fungovala automaticky, sama od sebe. Začínali jsme úplně od nuly, postupně jsme procházeli jednotlivá oddělení Avast a snažili se pochopit, jak to funguje, co je jejich know-how a kde jsou možnosti ke zlepšení. Vzniklo několik nápadů, některé jsme rychle zavrhli, ale dva byly nejzajímavější.

První byl automatické generování pravidel pro detekci malwaru. Malware se do určité míry popisuje pravidly, která píší analytici, a my jsme chtěli tato pravidla generovat automaticky. Druhý zajímavý problém byla predikce vývoje jednotlivých malwarových rodin. Nakonec jsme ukázali, že to jde do jisté míry predikovat i do krátké budoucnosti, a na základě toho lze postavit lepší detektor, který už při učení chápe, jakým směrem se malwarová rodina bude vyvíjet, a je tak vlastně o krok napřed.

Jak ten tým vypadal? Nakonec byl zhruba 10 lidí, přičemž jej vedli tři profesoři z ČVUT: Bráňa Bušanský, Vilem Lysý a Tomáš Pevný. Potom jsme tam byli všichni ostatní – jejich bývalí studenti – a společně jsme se snažili to posouvat dál. Co byla tvoje role? Jaký stack jsi používal? Co to všechno znamenalo? Jsem příjemně překvapený, jaký byl ten research a jak byl produktový – nezačali jste hned trénovat modely. No vlastně jsme samozřejmě začali, ale primárně jsem používal Python, i když v Avastu jsme chvíli používali i Julii, což bylo nejlepší i nejhorší rozhodnutí zároveň. K tomu se můžeme ještě vrátit. Julia je ještě bolestivé téma pro mnohé...

Ho. Ano, ano, ano, je to tak. Jinak na začátku to vždycky začíná s nějakou datovou analýzou, což znamená použití Pythonu a Jupyter notebooku, práce s velkými daty a tak dále. Postupně pak děláš experimenty, celý ten research stack, jako jsou weights and biases a podobné věci. A na konci, když se experimenty povedou, je potřeba to dostat do produkce, což jsou všechny ty MLOps nebo AI Ops nástroje.

Takže jste měli tyto role v týmu rozdělené?
My jsme byli strašně punkoví, protože jsme přicházeli z univerzity a všichni v týmu jsme si mysleli, že umíme všechno, takže jsme všichni dělali všechno. Což samozřejmě dopadalo tak, že ne všechno fungovalo. Ale nějak se to vždycky uklepalo a věci končily v produkci.

A jak dlouho vlastně tahle celá etapa v týmu trvala?
Já jsem tam byl necelé čtyři roky. A po celou dobu teda v tom projektu Moonchild?
Moonchild. Ano. Ke konci, když vyšla GPT, se ukázalo, že svět nevyhnutelně směřuje k transformérům. My jsme tehdy i testovali... nebo jak bych to řekl... V té době se malware svět začal jaksi uklidňovat, naopak začaly přicházet nové textové skimy, například přes SMS nebo e-maily.

Začala to být nová hrozba a právě tady se problém a řešení pěkně spojily, takže jsme hodně začali pracovat i na klasifikátorech scamů za pomoci LLM.
U toho bych chvilku zůstal, protože mám pocit, že tam začíná ten nápad na AIM, ne?
Jo, asi ano, minimálně technická inspirace. Když vyšel GPT-2, byl to jeden z nejlepších paperů, které jsem kdy četl. Strašně zajímavá věc. Od té doby jsme vlastně jen řešili návaznost na ten jeden paper. Teď se začínají objevovat jiné přístupy, ale vlastně děláme to, že prodlužujeme osu, kam se to dá vyškalovat, tedy scaling log, který ten Ilja nakreslil.

Když jste četli GPT-2 paper, potom jste rozvíjeli myšlenky a GPT pak dostalo prioritu?
Ano, nakonec se z toho stal i produkt v produkci přímo.
Proveď nás prosím tou produktovou cestou, co se tam dělo.
Začalo to tak, že jeden Avastí tým přišel na to, že je velká příležitost detekovat e-maily, ale pomocí jednoduchých pravidel se jim to nedařilo. Takže jsme s menším týmem začali pracovat na tom, že zkusíme natrénovat nějaký LLM, který by mohl dělat klasifikaci a detekovat scamy. Ukázalo se, že to docela funguje, že jsou relativně zajímavé příležitosti tohoto řešení.

Ale… jako vždycky, je to o datech. Chybějí data, nebo je těžké je získat. Pokud si to správně pamatuji, tehdy se toho chopil CTO Michal Pechouček, kterému se ten nápad, že bychom dokázali dělat něco na základě textů, líbil. Udělali jsme demo, kde jsme ukázali, že se scamy dají detekovat a respektive… [text končí]

Tady je opravený text:

Nejdřív to nešlo. A on to odprezentoval boardu. Ten board řekl: „Super, tohle je něco zajímavého, pojďme se do toho víc pustit.“ Pak se chvilinku hledal způsob, jak to zproduktizovat. Vznikl nápad, že velká příležitost je, když to popíšu úplně jednoduše, určitě to znáte - rodiče vám píšou: „Hele, přišel mi tady SMS, přišel mi tady ten mail, mám se bát, co se děje?“ Myšlenka byla: pojďme udělat nějakého pomocníka, který rodičům pomůže říct, jestli daný text je scam nebo není.

A tak vznikla Gini, Gini Scam Detector, na kterým pracoval velký tým. Začali jsme řešit, jak zkombinovat používání veřejných APIček, jako OpenAI, jak tam zakomponovat vnitřní datasety, naučené klasifikátory a třeba i nějaké pravidlové systémy. V ten moment to začalo být zajímavé, protože kombinace těchto možností, správně uměřená a vedená jako rozhodovací strom, který rozhoduje, která komponenta rozhoduje, byla ta cesta. Později jsem odešel a tým to dál rozvíjel a dotáhl skvělý produkt. Produkt je opravdu zajímavý.

A co pro tebe byl ten průlomový moment, kdy ses opravdu rozhodl, že půjdeš do tohohle projektu? V týmu skvělý firmy, máme produkt, který škáluje a využívá nejnovější technologie s podporou skvělých profesionálů v zádech. Převážně byly pozitivní motivace, ale i mírně negativní. Jednak jsem tam byl dlouho, což bylo trošku negativní. Pozitivní motivace byla to, že bylo zřejmé, že je obrovská příležitost stavět zajímavé produkty nad LLM-kama. Protože jsem tomu dlouho rozuměl, chtěl jsem si splnit sen založit startup. Teď je příležitost, tak jdu do toho. Dva měsíce jsem váhal, jestli dám výpověď, ale nakonec jsem se rozhoupal a začal hledat tu správnou cestu.

A kdy přesně jsi to udělal, jak jsi začal pracovat na svém projektu? Zhruba před dvěma roky. Probíhalo to docela chaoticky a bláznivě, protože i když jsem měl startupové zkušenosti a vždy mě to zajímalo, byl jsem zároveň unavený z korporátu. Samozřejmě jsou horší korporáty, ale musel jsem zjistit, jaká je správná cesta.

Tak pojďme se podívat na ty začátky. Fascinuje mě, že ses rozhoupal, dal výpověď a pak řešil, co ten startup vlastně bude dělat. Samozřejmě jsem měl plný šuplík nápadů. Rada číslo jedna: to nestačí. Tak pojďme se mrknout do tvého chaotického startupového deníku, možná tam něco najdeme. Pre-idea fáze… Mě vždycky zajímala práce s informacemi, takže jsem věděl, že...

Pokud chceš, mohu text dále upravit nebo rozčlenit do přehlednější podoby.

Tady je opravený text:

To má být něco v tomhle prostoru. A teď třeba planetární myšlenka byla: hele, pojďme tady generovat média personalizovaně. Tam je malý problém – nikdo nechce platit za média. A zaměřili jste se vždycky na nějaký problém, který jste chtěli vyřešit, nebo prostě třeba teďka řeknete: budeme něco generovat a uvidíme, co to udělá? No, ze začátku to bylo tak, že párkrát jsme říkali: pojďme něco udělat, postavme něco a uvidíme, co se stane, což samozřejmě vždycky skončí špatně. Takže jsem se moc snažil získávat informace z internetu, že jo, je tam spousta návodů, jak dělat startupy. Y Combinator má skvělé přednášky, doporučuji – Startup School. Ano. A v jeden moment jsem začal dělat věci naopak, že jsem začal nejdřív prodávat, a až potom stavět produkt. Americký styl. No jasně. Přesně, přesně, no nevím. A to se nám taky docela podařilo. My jsme vlastně před tím, než vznikl AIM v jeho současné podobě, ještě s jedním kamarádem na chvíli dělali deep research pro konzultačky – ještě předtím, než byl big deep research trend. To byl trochu problém, ale nejdřív jsme jim prodávali research, třeba EY, BCG a podobným.

Bylo to tak, že jste jim prodávali konkrétně research, nebo nějakou technologii, která to dělala?

Dělali jsme product discovery. Přišli jsme za nějakým partnerem a řekli: myslíme si, že máte tenhle problém, je to pravda? Pak vznikla diskuze a řekli jsme: ano, to už umíme, to zvládneme. Když nám řekli: máme tady nějaký projekt, kde to můžeme otestovat, zeptali jsme se: za kolik? A pak jsme šli programovat.

Jaká pro tebe byla změna, z hardcore inženýra, který pracuje na produktu, na někoho, kdo dělá sales, mluví s lidmi, kteří by to mohli chtít, a žádá o peníze?

Je to těžké, obrovská změna mindsetu. Zejména na technologických školách, hlavně tady v Česku, se učíme jít do detailu, vysvětlovat všechny technické vymoženosti, ukazovat grafy, jak to funguje a tak. Což je přesně to, co je ve sales úplně na posledním místě, že jo? Takže to bylo těžké. Několikrát to nevyšlo, a když už to bylo potřetí nebo počtvrté, tak už to bylo alespoň průměrné.

Z čeho jsi žil v té době? Nebo z čeho jsi to živil?

Teď poprvé máme nějaký kšeft pro velké konzultačky, ale do té doby jsme bootstrapovali, ne? Kolik vás bylo a znamenal bootstrapping, že saháš do úspor?

Byli jsme tři a bootstrapovali jsme. A je potřeba říct, že si tohle mohl dovolit jen díky tomu, že v Avastu se rozdávají akcie jako performance motivace, což je skvělá věc.

Konkrétně jako RSJ. A je to něco, co v ekosystému celkově umožňuje, aby lidi mohli…

Jestli chceš, můžu opravit dál nebo doplnit celý text.

Opravený text:

Udělali to a mohli jít do toho rizika a prostě začít něco stavět a financovat to ze svého. Je strašně super, že to RSJ dělá, a měly by to dělat úplně všechny firmy. Mně zase přijde fascinující toto období. Takže jsi odešel z Genu, kde se o tebe... z pohodlíčka? Jo, prostě tam se starali o toho AAA zaměstnance, co na těch nových projektech všechno dělá... Který může být pohodlnější, protože má ty akcie. Přesně. A tak jsi šel dělat startup a vymyslet něco nového, najednou to pálíš. Jak dlouhou jsi měl runway? Co kdybys se nechal znovu zaměstnat? Jak vypadal tvůj den? Já jsem do toho šel all in. Počítal jsem s tím, že to prostě nějak vyjde, takže jsem se nechtěl nechat zaměstnat a myslel jsem si naivně, že to bude trvat čtyři měsíce a hotovo. Bavil jsem se s jedním zkušeným kamarádem, manažerem, který mi řekl: “Počítej aspoň rok.” A já mu říkal: “Ne, v pohodě.” Nakonec k té investici došlo až za rok a půl, za rok a tři čtvrtě. Takže rok a tři čtvrtě jsem si utáhl z akcií. Něco jsem si vydělal i po cestě, třeba za ty deep researche pro různé konzultačky? Jo, ale bylo to velice daleko od break even. Jasně. Spíš to byla produktová discovery, spíš to bylo tak, že ve chvíli, kdy platí za tohle, můžeme to zautomatizovat a na tom postavit produkt.

Je potřeba říct, že vlastně s těmi konzultačkami byl ten deep research vlastně slepou větví. Jednak proto, že se objevil opravdový deep research od ChatGPT, od OpenAI a Perplexity a tak dále. A za druhé, je těžké dělat startup, kde je cílovkou enterprise, která je prostě pomalá a má čtyřměsíční sales cycle. Super.

Než se dostaneme k Aimu a podíváme se na tu poslední iteraci, co bylo tvé priority schéma? Co jsi věděl? Bude to tubičkový, bude to usíčkový, bude to postavené na LLMkách, protože to je technologie, která roste? Má to být škálovatelné, má to být v budoucnu unicorn? Jaká byla tvoje kritéria prioritizační matice těch nápadů a možností?

Priorita číslo jedna byla obrovský trh, priorita číslo dvě bylo, aby to bylo technologicky náročné, protože tam jsem viděl svou přidanou hodnotu, a priorita číslo tři byla odzvalidovat nějakou trakci nebo nějaký early zájem. Super.

Tak pojďme k Aimu. Co je Aim? Jaký je váš one-minute pitch?

Aim je tvůj osobní business briefing, díky kterému nestrácíš přehled a můžeš se lépe strategicky rozhodovat. Dobře. Hlavně velký trh, asi. Super.

Naši primární zákazníci jsou momentálně fondy, například VC fondy, konkrétně VC partneři v těch fondech, a také foundry startupů, do kterých ty fondy investují. Primární případ je, že tady je strašně moc informací, všichni známe information overload z našeho osobního života, a v businessovém kontextu je to o to horší, protože unikají skutečné příležitosti. Signál versus noise.

Přesně. A teď, co je ta příležitost? To je třeba situace, kdy...

Pokud chcete, mohu upravit dál, dejte vědět.

Tak se jeho CEO rozpovídal v podcastu a ve třetí hodině už zapomněl na svůj media trénink a začal tam dropovat zajímavá čísla jako burn rate, margin a další, na základě kterých se můžeš benchmarkovat například. No a jak vedla cesta k tomu, jak to ověřili? Nezní to jako něco, co jsi vymyslel doma na papíře nebo vytáhl ze šuplíku, zní to jako vycizelovaný, odpivotovaný produkt.

Jo, vlastně když se malinko vrátím k tomu, když bylo jasné, že to s těma konzultačkama bude těžké, tak v tu dobu jsem...

Už nějakou dobu jsem se bavil s investiční skupinou Myton, speciálně s Tomášem Matějčkem, se kterým jsme začali meditat nad tím, že tady je podobný problém, ale pro úplně jinou cílovou skupinu. Říkali jsme tomu AI monitoring – věc, kterou oni interně provozovali, akorát to dělal člověk, analytik, který byl na to učený a měl na starost monitorování trhu pro konkrétní společnost. My jsme udělali demo, ve kterém jsme ukázali, že to, co už jsme vymysleli, má příslib, že lze tento problém řešit pomocí naší technologie. Na základě toho vznikla investice od Mytonu.

Další obrovská výhoda spolupráce s Mytonem byla, že bylo relativně jednoduché dostat se ke spoustě zajímavých lidí, se kterými jsem potom mohl dělat product discovery. Tyto rozhovory nám pomohly pochopit, jak konzumují informace, jak se rozhodují, kde jsou jejich klíčové insighty. Najednou se tam objevil určitý vzorec, některé typické ICP persony, například analytik ve výšičku dělá toto, výši partner potřebuje tohle, startup founder zase má jiné problémy a podobně. Vybrali jsme si pak tyto dvě skupiny, o kterých jsem zmiňoval, a pro ně začali dělat reporty.

Co se týče fundraisingu, ten jsi měl díky tomu, že jsi produkt řešil s Tomášem – jasné, že jsi se k Mytonu dostal v rámci startupové story, kdy už jsi začal budovat kontakty ve výšičkách, aby věděli, že na něčem pracuješ, a až budeš ready, měli připravené šeky. Já jsem ještě před odchodem z Avastu psal výšičkám, setkal se s nimi a zároveň jim průběžně aktualizoval informace o tom, jak se nám daří, co děláme, že to ještě není ready na investování. Nějakou dobu jsme pak zkoušeli, jestli už je to hotové, ale nebylo. Myslím, že právě dlouhodobý kontakt hodně pomohl. S Mytonem jsme mluvili minimálně tři čtvrtě roku před samotnou investicí.

V jakém stavu byl tedy produkt při investici? V podstatě na nule – jen demo. Šlo především o to zvalidovat a slyšet od několika, vlastně od mnoha lidí, že mají stejný problém. Jejich slovy ten stejný problém – information overload v byznysovém kontextu. A až potom jsme začali stavět produkt.

Tady je opravený text:

S tím, že na začátku to bylo prostě úplně rozbité demo, které skoro nic nedělalo. V podstatě polovinu z toho jsme udělali manuálně. Jenom jsme sledovali, jestli lidi ten osobní briefing zajímá, jestli si to rozklikávají a jestli tam jsou nějaké zajímavé informace. A na základě toho jsme iterovali. Takže zajímavé informace byly, sehnali jste dostatek lidí, aby vám řekli, že to je problém a že jim to pomáhá. Potom proběhla investice a začali jste dělat produkt.

Myslím, že reálně jsme pořád na začátku nějakého MVP, protože já bych byl strašně přísný v definici produktu. MVP je něco, co stabilně vydělává a zákazníkovi opakovaně dokáže dodat hodnotu, za kterou je ochotný platit. My jsme velkou část byli v discovery fázi, zkoušeli jsme různé věci a chtěli jsme jen zvalidovat, jestli automaticky nebo polautomaticky dokážeme uživateli dodat nějaký insight, třeba najít – jak jsem říkal v tom podcastu – něco zajímavého, nebo na Redditu vyhrabat nějakou zajímavou informaci, která se pak promítne do byznysu. Jedna z našich metrik je, že ten VC partner to vezme a pošle to startupu, a tím tak nějak zvaliduje, že to zajímá i jich. Sdílení je jedna z validačních metrik.

Kdy proběhla investice? Je červenec 2025. Investice byla v březnu. Tak co je AIM dneska?

Když se podíváš do vašeho gitu nebo na tým, popíšeš nám, kde jste k polovině roku 2025, pár měsíců po přísední investici?
Jo, ok. AIM je teď čerstvě platforma, a to od minulého týdne. Do té doby to byly reporty, které jsme posílali nejprve v PDF, poté jako unikátní odkaz vygenerovaný jen pro jednoho člověka. Co se týče tech stacku, je to převážně Python, hodně Next.js a Node.js na frontendu. Hodně kódu je napsaného kurzorem, V0 nebo podobnými nástroji. Je to částečně běžící na GCP a sama konzumuje informace.

Co se týče týmu, je nás pět. Máme tři technické lidi, jednu analytičku (ex-Deloitte), která je takovým "human in the loop" – jakýmsi quality assurance krokem na konci celé pipeline, a zajišťuje, že se uživateli nedostane žádný nesmysl. Plus novou produkťačku, která nedávno nastoupila.

Co se týče salesu, ten na sebe bereš ty jako founder?
Ano, přesně tak. Studoval jsem kombinatorickou optimalizaci, machine learning a transformery, abych mohl dělat sales a oslovovat lidi. Ne, dělám sales já, protože určuje směřování produktu a potřebuji vidět trh. To je správně.

Pojďme se podívat na technologii pod tím. Už víte, co stavíte – tato discovery fáze je za vámi, tak jak to začínáte stavět od nuly? Jaké věci jsou dneska přímo komodity? Jak moc mě zaujal ten vibe, že kódujete celou platformu sami, to je za mě velmi...

Pokud chceš, můžu opravit i pokračování textu.

Jistě, tady je opravený a stylisticky uhlazený text:

Zajímavé. Proveď nás tím vývojem.

95 % kódu je napsaných nějakým LLMkem. Zakládáme si na tom a chceme, aby to bylo víc než 95 %. Vývoj u nás probíhá tak, že… nebo možná bych začal tím, co se změnilo díky tomu, že máme k dispozici nástroje jako kurzor a v0. Vždycky byl problém s tím udělat to „nemíčko“. Celý lean startup je založený na tom, že programování trvá dlouho a je drahé, a tím pádem chceš hodně validovat, než reálně začneš kódovat. To se změnilo.

Naše první landing page byla udělaná za jeden večer – sedl jsem si k v0, něco tam napsal a už jsme měli landing page. Náš první report vznikl tím, že jsem si další večer sedl k našim APIčkám a řekl: „Hele, udělej mi z toho v kurzoru něco, co můžeme poslat klientům.“ Náš proces je tedy hodně založený na rychlém prototypování a schopnosti využít nástroje jako kurzor, v0, client (který jsme chvilku používali). Ověřujeme si, jestli je to dobré a jestli někdo něco skutečně používá.

Ale právě ta „client facing“ vrstva je podle mě unikátní v našem přístupu. Od začátku totiž nestavíme na tom, že LLM je budoucí AGI, která všechno vyřeší. My sázejme na to, že LLM je stále nedokonalý, a je potřeba postavit nějakou vrstvu nad tím modelem, která dožene těch posledních 5 % – nebo třeba jen 1 % – výkonu, aby to bylo dostatečně dokonalé.

Je to něco podobného, jako když se dělá last mile delivery – ten poslední kilometr je skutečně fakt těžký. My to proto stavíme s vědomím, že těch posledních pár procent, ta last mile, je fakt složitá.

Proto hned od začátku v týmu byla analytička, pro kterou jsme postavili interní produkt – takový glorifikovaný nástroj na labelování našich dat. Ona generuje data, ze kterých se pak můžeme učit. Těch 90 nebo 95 % práce je komodita, kde nemá smysl investovat do vlastního produktu, protože to už zvládneš ve svých předtrénovaných modelech GPT nebo podobných.

Je to to, co prostě zadáš do ChatGPT a on ti odpoví. Typicky jde o jednorázový výzkum, kdy tě zajímá nějaké téma a chceš rychle získat informace. ChatGPT, Perplexity a podobné nástroje jsou skvělé – vygenerují ti vlastní „osobní Wikipedii“, ve které můžeš zkoumat téma. To je komodita a to se nezmění.

Totéž platí i pro náš produkt. Všechny informace o trhu ve smyslu jednorázového výzkumu dnes LLM již zvládají. Tam, kde přestávají fungovat, vidíme příležitost: například potřeba projít obrovské množství zdrojů (tisíce až miliony), porozumět detailně kontextu uživatele, jeho hypotézám i byznysovým cílům.

Když všechny tyto věci spojíš dohromady, vzniká velká příležitost pro verticalizované nástroje.

Jak stavíš verticalizovaný nástroj? Co z toho je prostě GPT wrapper? Celá naše platforma je konfigurační…

Pokud chceš, mohu pokračovat v úpravě i dalšího textu.

Tady je opravený a upravený text:

Prompt nad APIčkem a kam dáváš ten kontext, logiku, jak vlastně stavíš ty občasné dotazy? Co je API call, co je prompt a co jsou další komponenty, které tvoří to srdce produktu, tu chytrou část? Zajímavé je, že bys měl začít s GPT wrapperem. Správný způsob je, že si zaregistruješ startup na Azure, dostaneš třeba deset tisíc dolarů v kreditech, přístup k OpenAI API a začneš zkoušet maximum, co dokáže správně napromptovaný GPT wrapper. Ale je potřeba všechno měřit, nastavit si byznysové metriky a sbírat data, ze kterých zjistíš, kde jsou limity tohoto GPT wrapperu. Když narazíš na nějaký limit, začíná se dít zajímavé věci – můžeš začít zkoušet fintunovat modely, využít reinforcement learning, trénovat reasoning nad modely, protože už máš data a interní produkt, kde ti analytik sdílí reasoning.

No, to jsi mi odpověděl, jak se rozhodnout. V jaké fázi jste teď vy? Začali jste GPT wrapperem a kde jste narazili na zeď? Co jsou první vaše IP, co stavíte kolem? Jednak jsou to data – ta, která jsme si sami vygenerovali expertem, a taky ta od našich uživatelů. A také máme model, který je natrénovaný na těchto datech. A ten model je co? Kde to sedí? Proveď nás architekturou. Je to fintunovaný model, který běží přes VLLM na cloudu a je to vlastně LLM, naučený řešit specifickou malou úlohu v rámci celé pipeline, kde se ukázalo, že GPT nestačí a je potřeba něco nového přidat.

Takže funguje jako "judge," nebo je součást agentního systému? Nebo je to ten, kdo rozděluje práci dál? To je docela zajímavé téma. Ukázalo se nám, že nejlépe funguje přístup "rozděl a panuj." Nejde o velkého agenta, který je zavřený v nějaké fordloupi a dělá všechnu magii s mnoha nástroji, ale o dekompozici celé úlohy na malé kroky, které vyhodnocujeme. A pokud je nějaký krok důležitý, tak ho vylepšíme. Nejpodstatnější část naší pipeline je vyhodnocení, zda je daný kus informace relevantní pro uživatele, nebo není. To umíme, myslím, úplně nejlíp ze všech – vlastně jako page rank.

Je to vlastně o tom, že v podcastu zazní nějaký kus informace a já, díky znalosti tvého kontextu, řeknu: „Hele, tohle by tě mělo zajímat.“ Je to obecný systém, ale zároveň personalizovaný. Pro každého uživatele vytváříme profil – veřejně dostupné informace, údaje, které nám sám uživatel poskytne při onboardingu, a data získaná z používání naší platformy a interakcí s ní. Čím dál tím víc j...

Pokud chceš, mohu pomoci i s pokračováním či doplněním textu.

Jasně, tady je opravený a trochu upravený text, aby byl plynulejší a srozumitelnější:

To je můj aim. Ten cíl je, aby to byl i tvůj aim – aby to byl ten tým analytiků, který tě opravdu dobře zná. Akorát to nejsou lidi, ale spíš platforma, ve které si ukládáš informace, konzumuješ je a spolu se svým týmem diskutuješ nad těmi daty a děláš správná rozhodnutí.

Ještě jsi zmiňoval, že to dekomponujete a nějakým způsobem to připodobnil microservices, architektuře nebo funkcím – jaký je podle tebe trade-off? Nemusíš spouštět víc najednou? Třeba jsme tady měli příklad od Carl Data Company, kteří všechno drží v jednom promptu – mají čtyřstránkový prompt a tím, že mají jednu úlohu, ji v batchi splní, což je pak jednodušší na údržbu. Kolik modulů vy máte? Je to škálovatelné?

Já ani nevím, asi hodně, třeba 15, 20, něco takového. A pořád se to mění, neustále vznikají a zanikají, a ty prompty jsou různě dlouhé. Máme tam komponenty, které dělají kombinatorickou optimalizaci, abychom vymysleli, co do promptu patří. Takže ty prompty se nám vlastně mění pod rukama podle toho, co zrovna nejlépe funguje, a najednou se dostaneme ke správnému promptu.

Super. A jak potom funguje ta customizace pro uživatele? Máte nějaký core toho, co systém dělá, a jak dlouho trvá onboarding nového uživatele, který si to chce nastavit podle sebe? Dělá si to sám, nebo to mu připravujete vy?

Děláme to my. Vlastně celý onboarding začíná patnáctiminutovým callem se mnou, kde si povídáme o tvých byznysových cílech a snažíme se pochopit, jaké akce chceš dělat na základě informací, které ti dodáme. Z toho pak stavíme tvůj profil, a samozřejmě používáme i veřejně dostupné informace o tobě. Pak je to samozřejmě práce nás, kteří to tobě nastavujeme. To rozhodnutí je racionální, protože stále děláme discovery – stále zjišťujeme, k čemu to dál chceš použít a proč vlastně chceš informace. Samotná inteligence, tedy získávání informací, je k ničemu, když tam není nějaká akce.

Mně se líbí, že pro tuhle cílovku jsou některé produkty jako jedna věc a druhá je prémiový produkt na míru. Tohle to všechno posiluje. Miluju onboarding Superhumanu – to je naše velká motivace dělat to podobně.

Superhuman je podobné místo, kam mi chodí informace – takže to je boží.

Moje otázka je, kde držíte tu logiku? Když máte třeba 15 až 19 automatizačních schémat nebo komponent, máte tam jeden univerzální prompt pro všechno, nebo kde držíte byznysovou a informační logiku v té záplavě agentů?

Hele, zkoušeli jsme agenty, protože v dnešní době je agent takový systém, kdy LLM rozhoduje, co se bude dělat, jaký krok se exekuuje. Ale nedokázali jsme to udělat tak, aby to pořádně fungovalo. Takže byznysová logika je v normálním kódu, a chytré části, kde je třeba reasoning nebo něco podobného, jsou v LLM.

Pokud chceš, můžu ještě více upravit styl nebo konkrétní části.

Zde je opravený text:

Když je nějaké generování textu, tak jsou to ty LLMkové modely. A úplně specificky část našeho systému tvoří mikroservisy, které jsou volané z PubSubu, a část našeho systému, naštěstí stále méně, jsou Jupyter notebooky, které se pustí a začnou něco dělat. Jste teď v Discovery?

No, čas našeho systému běží v kontejneru na Azure a má k tomu API. Mně se hrozně líbí, jak malou hodnotu přikládáš samotnému kódu v tuhle chvíli. Jak jsi hrdý na to, kolik kódu vygenerovalo AI a jak to prostě zahazuješ, jak se rozhodneš, že není třeba ho teď v Discovery dělat – to je přístup, který bych ocenil u víc startup founderů, protože oni často tři roky něco staví, aby zjistili, že to nikdo nechce – to je nejčastější příběh.

Co mě hodně zaujalo, je, že několikrát jsi mluvil o vaší kolegyni analytičce a o tom, že její input je součástí IP. Pro mě je to něco nového – zaměstnat někoho přímo z cílové skupiny, aby byl human in the loop neboli poskytoval zpětnou vazbu. Co tě k tomu vede? Vysvětli to, podle mě na tom stojí váš aparát a je to hodně neobvyklé.

Myslím si, že je to správná strategie pro AI startupy v roce 2025. Jediná možná vlastně. Máš dvě možnosti: buď jsi ve velmi jednoduché oblasti, kde ChatGPT stačí a máš vyhráno, a jediné, co řešíš, je go to market a škálování. Nebo jsi v prostoru, kde ChatGPT nebo jakýkoli jiný LLM model nestačí, a v tom případě potřebuješ do systému dostat znalost – ten last mile, jak jsem o tom mluvil.

A není nic jednoduššího než zapojit do procesu člověka, který to umí dělat, který rozumí problematice. Jeho úkolem je fungovat jako flight operátor – stejně jako operátoři na letišti řídí, která letadla přistávají, které ne, tak podobně to dělá naše analytička. Pro ni jsme postavili interní produkt, který nazýváme back office. Do něj jsme vložili daleko více úsilí než do reálného klientského produktu, protože v tom je naše rodinné stříbro.

Každý týden překopáváme back office, měníme tam jednotlivá rozhodnutí a i způsob, jak analytička zadává informace. A nejen ona, mimochodem – už jsme začali zapojovat i programátory, aby generovali reporty, aby si vyzkoušeli celý ten proces a lépe pochopili, v čem to funguje a kde to ještě není dokonalé.

Zpočátku to bylo jen o tom, že analytička vyhodnocovala, které informace jsou relevantní. Teď už dokážeme predikovat, co bude relevantní, modelujeme témata, která jsou důležitá pro naše uživatele. A analytička pak řekne: „Tohle je dobré, ale vychází to z nějakého zdroje, který není zas až tak důvěryhodný. Co kdybychom použili jiný zdroj? Nebo tohle ještě nechceme pustit.“ Označí tu informaci, my si to zaznamenáme a na základě toho zlepšujeme náš systém, aby příští sprint byl zase o něco lepší.

Je v Repre vůbec prostor pro ChatGPT?

Pokud chceš, mohu text ještě více zpřehlednit nebo upravit styl.

Zde je opravený text s lepší gramatikou, interpunkcí a stylistikou:

Je to možnost – když to někdo nasadí, buď je to jednoduchý trh (simple market) a dáme ChatGPT do Repre, ale tak to budu používat ChatGPT, ne? To je ten problém – na začátku vzniklo spousta takových produktů, ale s každou novou verzí ChatGPT to mám přímo v té aplikaci, takže ten trh mi zmizí.

My sázíme vlastně na dvě věci. První je verticalizovaný nástroj, což je knowledge base a konzumace informací. To je to, na co stojíme, a bude to vždy lepší než general purpose nástroj. To je jeden náš bet. Druhý bet jsou data, která získáme díky human-in-the-loop, který máme. Ta data jsou tak strašně cenná, že nikdy nebudou ve veřejných datasetech nebo v náhodných odpovědích ChatGPT, které máte vždycky na výběr. Ta data nikdy nebudou veřejná, a tím pádem velcí poskytovatelé se na nich nemohou učit, nebo je nebudou mít k dispozici, aby se mohli naučit podobnou úlohu jako my. A tím pádem jim nezbude nic jiného než jít stejnou cestou jako my, nebo nás koupit. Ano, a to se mi líbí – že někdo s backgroundem v té science, kdo tady dělal pro Jen, ve svém startupu vytvoří větší hodnotu než modelům a té práci v AI. Jednou dáváš feedback uživatelů, jsi client-facing, a za druhé buduješ ta data, že pokud tě někdo koupí za pár let, nebo tvá valuace bude postavená na těchto datech, na tomto know-how. To mi přijde logické, ale bohužel běžné není.

Je to něco, co tě naučil Jen – že cokoliv postavíš nad tím? Nebo jaká byla tvoje meditace potom s Mitonem? Myslím, že inspirace primárně přišla ze dvou knížek: Lean Startup a Running Lean. Zejména Running Lean je jako kuchařka na to, jak dělat Lean Startup – s příklady i pro “blbečky”, takže i když nechceš, tak když to čteš, pochopíš, jak na to. Sbírat data a nasazovat human-in-the-loop tam ale není? Ne, to přišlo nějak samo. Přijde mi, že je to nejvíc racionální způsob, jak to dělat.

Tak to děláme? Jasně, určitě, 100 %. Na druhou stranu vidím, že to naši posluchači – nebo část z nich – opravdu potřebují slyšet, protože když mentoruji startupy, tak tohle je ono. Už jste to prodali, bavili jste se o cílovce, řešíte problém. Co potom bude hodnota startupu jako takového, nebo firmy? Co tvoří hodnotu, není kód, ale právě know-how a data, která zvládnete vytvořit.

Ještě co je dobré, aby zaznělo, je to, že v early stage vás hodně hodnotí i podle toho, jak se dostanete ke zákazníkům, jaký máte go-to-market. To je úplně netechnická věc, ale extrémně důležitá. Protože když pak děláte pitch investorovi, je to druhá otázka, kterou se zeptá. Speciálně u nás máme krásnou synergii mezi VC partnerem, který používá náš produkt, a startup founderem, do kterého je ten...

Pokud potřebujete, mohu opravit text i dále nebo úplně dokončit, stačí říct!

Tady je opravený text:

VC founder zainvestovaný. Že vlastně přirozeně se chtějí bavit o stejných věcech a chtějí spolu sdílet ta data, a tím pádem, když se my dostaneme k jednomu, máme velkou šanci dostat se i k tomu druhému. Co je zajímavé na naší strategii, je to, že ti VC partneři si typicky dělají osobní digest na future fund returners, tedy na ty nejlepší koně ve svém portfoliu. A tím pádem se my dostaneme do těch startupů, do těch firem, které mají největší šanci uspět. No a budeme růst s nimi. Když začnou používat náš produkt, porosteme s nimi, jak se oni budou zlepšovat.

A to mě přivádí k další otázce. Ty jsi tady párkrát mluvil o tom, jak dělat startup v roce 2025. Mám pocit, že tady přišla jistá skepse a trh šel dolů, že startupový trh je na tom hůř ve všech ohledech než třeba před čtyřmi lety. Jak to ovlivnilo tebe?

Navíc mě zajímá cílovka, výšičká startupy – hodně SaaSových firem na tomhle vlastně vyhořelo tím, že šel trh dolů, a jejich primární zákazníci šli dolů. Pro vás to bude jiné, protože jdete z nuly, takže to může jít jen nahoru. Ovlivnilo tohle něco? A máš nějaké rady, které vycházejí z Lean Startup přístupu – například, že vždy všechno nejdřív ověřit, než začnete kódovat, protože kódování je drahé? Dnes je kódování spíš superlevné a můžeš začít rovnou kódovat, a až s prototypem jít k zákazníkovi. Jsou tam takové věci, týkající se trhu, financí startupů, nebo vlastně startupového know-how, které jsme díky projektům (jejichž jméno jsi uvedl/neuvedl) překonali? Spíš se všechno zrychlilo. A možnost udělat jednoduchý mini produkt či prototyp za jeden večer ti umožňuje dělat víc iterací, víc validovat. Můžeš pro každého svého klienta udělat úplně novou věc a vyzkoušet, jestli to na ně bude fungovat. A to je, myslím, ta věc, která je teď jiná.

Zároveň to znamená, že průměrný web je dnes strašně jednoduché udělat. Samozřejmě, skvělý web stále potřebuje dobrého frontend developera a designéra, ale „good enough“ web je komodita.

Kdyby ten trh byl v roce 2023 opravdu špatný, když se v Česku podíváte na statistiky, vůbec se tu neinvestovalo. Dělala se jen follow-up kola a bylo tedy dobré startup nezakládat v roce 2023. Ale teď je to lepší – investic je víc, dochází k oživení.

Navíc vy jste v AI space, my jsme taky v AI space, a primárně cílíme na americký trh. Proto jsme americká firma a chceme oslovovat primárně americké investory. A tam teď panuje akcelerace – akcelerace, akcelerace. Takže všechno nám hraje do karet – ta mise mít méně lidí, kteří budou používat AI nástroje a budou daleko efektivnější.

To je to, na čem jedeme a co chceme podporovat. Akorát to děláme speciálně v tom prostoru monitoringu informací, osobních knowledge bází a sdílení informací.

Náš cíl je, asi to znáte, když...

Pokud chceš, mohu text ještě upravit či zkrátit podle potřeby.

Posloucháte takové ty velké podcasty, jako je třeba All In podcast, a všimnete si, jak jsou strašně nabrífovaní. Teď tam o něčem mluví, mají spoustu insightů a vypadá to, že se v tom mega orientují, tak jakoby superlidi. Samozřejmě, že mají nějaký letecký tým, který jim připravuje podklady, scoutuje informace, třídí je a vymýšlí, jak se o tom bude mluvit. Proto mají ti lidé nějakou unfair advantage.

Já si myslím, že už není potřeba mít takový tým, díky kterému budete vypadat chytře, ale stačí mít AIM, a ten vám pomůže prostě být superhuman. Plán je začít v úzké, velmi nízké vertikále a potom škálovat na další role.

Přesně tak, ten problém information overloadu známe všichni a netýká se jenom founderů a VC partnerů, ale všech rozhodovacích osob, které potřebují dělat kvalitní byznysová rozhodnutí. To je náš trh. Všichni totiž chceme stavět vlastní knowledge báze a mít přehled, abychom mohli lépe rozhodovat.

Je proto racionální začít s minisegmentem, a to jsou VC partneři a startupfoundři. Pokud nás poslouchají founderové nebo VC partneři a ještě nevyzkoušeli AIM, měli by ho určitě vyzkoušet.

Kolik vlastně máme VC partnerů a startupfoundrů, kteří AIM už využívají? Naše metrika jsou reporty – posíláme biweekly reporty a těch jsme udělali vyšší desítky, možná i přes sto.

Z toho, co říkáte, se mi moc líbí přístup Lean Startup a Running Lean. Je vidět, že jste na začátku a děláte racionální rozhodnutí, jak se zrychlit, místo abyste stavěli robustní infrastrukturu.

Mluvili jste o vibe codingu a o tom, kolik kódu se generuje. Je to udržitelné? V discovery fázi, při prototypování a tvorbě MVP je to přesně ta fáze “notebooku”. Je to skvělé, dostane vás to někam, je super s tím začít, ale není to stavění na dlouhou trať.

Přesně tak – bagr na vrapce. Kdy bude ten strop, kdy bude třeba vzít celou platformu a začít ji programovat tak, aby byla totálně robustní a enterprise ready pro třeba CEO Danone?

Naše metrika jsou reporty, jak jsem říkal, posíláme biweekly reporty a těch máme desítky, možná už přes sto.

Zkrátka, v některých věcech jste na začátku, ale děláte racionální rozhodnutí, abyste se zrychlili, ne abyste zatím stavěli robustní infrastrukturu. V discovery fázi, prototypování a MVP je to ideální fáze notebooku, která vás dostane někam dál.

Opravný text:

Je super s nimi začít a nebrat bagr na vrapce. Přesně tak, bagr na vrapce. Tak kde je ten strop, kdy budeš muset vzít celou platformu a začít ji programovat tak, aby byla totálně robustní, enterprise ready pro CEO Danone? Hele, i Jupyter Notebook může běžet v produkci a je takový ten success case, myslím, z OpenAI, kde jeden z jejich high performing zaměstnanců nedělá nic jiného, než píše notebooky, které pak běží v produkci někde.

To znamená, že ano, chápu, když děláte software pro banku, je potřeba mít miliardy testů a vědět, že to běží dobře, a to dává smysl. Ale podle mě je důležité si klást otázku, nakolik je racionální dělat bulletproof software a nakolik je lepší být rychlý, přihazovat tam funkcionality a být rychlejší než jakákoliv konkurence nebo kdokoliv jiný na světě. Myslím si, že pro nás, zejména ve světě AI, je to to druhé. Když bychom vymýšleli, jak kód udělat o trošku efektivnější a lepší, utečou nám všichni ostatní.

Takže věříš tomu, že touhle formou to půjde a že uživatel si raději vybere hodnotu těch informací než ten kabátek, ve kterém je to dodávané? Jo, vlastně ano, ale druhým dechem dodávám – musí to fungovat. Je potřeba, aby se uživatel mohl přihlásit, to byl náš dnešní ranní fail. Musí se hodnota dostat k uživateli. Podle mě je správná metrika, jestli uživatel tu hodnotu dostal, a jak složité bylo se k ní dostat. Ano, přesně, a jestli se k ní dostal efektivně – a že už to není pixel perfect, kdo to řeší?

Co znamená, když tolik kódu generuje AI? Znamená to jiné operace, jiné DevOps? Znamená to, že inženýr musí umět zhodnotit kód, pochopit, jestli je dobrý nebo ne, protože už není tím, kdo ho napsal. Už ani nemůže ovlivnit, jak je napsaný, protože ten kód na pozadí píše AI, jak chce. Podle mě je to klíčový skill programátorů v letech 2025-26 – umět se podívat na kód a cítit, jestli je to dobré nebo ne. Takže dělají hlavně code review. Přesně.

Zajímá mě, jak přistupuješ k práci s verzemi, obecně k verzování produktů. Do jaké míry navazuješ na předchozí verzi a do jaké míry to celé zahodíš a napíšeš znovu? Hodně lidí lpí na tom, že kód už máme, tak ho musíme rozvíjet dál. Jak to vidíš ty?

Myslím si, že kód je disposable věc. V tomto mě strašně ovlivnil můj bývalý šéf William Lissy Zavastu, který říkal: „Když je ten kód tak škaredý, že vám nebude vadit, když se smaže,“ a to se mi fakt hodně zapsalo do hlavy. Proto je to naše mantra – nemáme žádný citový vztah ke kódu a kdy...

Opravený text:

Když to nefunguje, tak to smažeme a necháme to znovu napsat v cloudu. Například tady ten topic modeling, to je jedna komponenta, kterou máme, tak tu už jsme psali snad pětkrát, šestkrát. Nezájem? No a co? Prostě znovu a lépe. A opět, je mnohem jednodušší začít od znova na čistém papíře, když už vlastně vím, co nefunguje, vím, jak to má být, a mám nástroj, který to tady za mě jednoduše nakóduje.

Takže versioning… Versioning je prostě… Žádný gity a takovýhle věci. No samozřejmě, že máme všechno v gitu, ale je to jedna lineární věc, kdy se občas vrátíme zpět a smažeme, co tam bylo. A je to – prostě teď. Mně se tohle hrozně líbí, že kód je nástroj, jak se dostat k hodnotě pro uživatele. A to je celé.

Co vás čeká v budoucnu? Tady jste na startupovém začátku, vypadá to, že nejhorší období máte za sebou, a teď super, teď už stačí najít ten product-market fit. Jaké jsou další kroky? Co už víš, že bude? Jak se podle tebe změní AI landscape?

ChatGPT nějakou část komoditizuje, ať už vaší infrastruktury nebo obecně. Kam to celé směřuje? Já začnu dáma. My teď škálujeme uživatele, to znamená, nabíráme foundry a VC partnery a všechny ostatní, kteří potřebují osobní byznysový briefing. Chceme prostě co nejvíc potestovat co nejvíc use case a co nejvíc uživatelů. Kdyby to někoho zajímalo, napište mi na LinkedInu, domluvíme se.

To, co nás teď čeká, je škálování a ověřování na více uživatelích. Myslím si, že velká výzva bude v tom, jak se vyvíjejí velké platformy typu ChatGPT, Anthropic a podobně. A jde vidět, že se zaměřují hodně na koncové uživatele, což je pro nás skvělé. Pokud to tak půjde dál, bude to v pohodě.

Zároveň ale stále platí, že my máme data, neustále získáváme nová data, která jsou unikátní a nikdo jiný je nemá – například data o preferencích našich uživatelů. Díky tomu si budujeme jakýsi obranný val, který se postupně zvětšuje a stává se vyšším. Myslím si, že to je základ byznysové teze, na které nyní stavíme.

Co nás ještě čeká? Brzy se dostaneme do fáze, kdy budeme hledat seed investici, pravděpodobně na podzim, uvidíme. A budeme ji shánět v Americe.

Dobře. Takže budete pravděpodobně hledat i další lidi, kteří by se k vám přidali. A když budete hledat investici v Americe a chcete se soustředit hlavně na americký trh – nabíráte ještě programátory?

Neustále nabíráme. Všechny. Potřebujeme ruce. A proč? Těch 5 %, co nenabaví kódu? Potřebujeme data scientisty, LLM inženýry, AI inženýry – ať už tomu říkáte jakkoliv. Prostě lidi, kteří mají zkušenosti s tím, jak se staví AI systémy, kteří dokážou dostat do produkce něco, co si třeba sami natrénovali. Speciálně pokud vás zajímá DPO a reinforcement learning, tak nám napište.

A proč by měli chtít k vám?

(Poznámka: Text končí neúplně, chybí závěr otázky a odpovědi.)

Tady je opravený text:

H je teď docela poptávka. No je, je, je. Chtějí? Měli by jít? Chtějí. Měli by chtít. Myslím si, že děláme strašně zajímavý produkt postavený na technologiích těch nejnovějších cutting edge, které teď jsou. A pokud si někdo chce vyzkoušet, jak zefektivnit svoji práci pomocí těchto wipe coding nástrojů a zároveň dělat tool, který je nejlepší ve svých vertikálách, tak AIM je ta správná cesta. K tomu nemám co dodat.

No a proč data scientisty? Proč ne klasické softwarové inženýry? Právě to, co mi připadá, je, že z AI se staly modely – komodita. Vy tady máte hodně toho, tak proč směřujete víc k data science a reinforcement learning než ke klasickým softwarovým inženýrům a softwarovým produktům?

Protože to zajímavé, co vyděláme, je ta last mile, to je těch posledních 5 %, 1 % výkonu, a na to potřebuješ ty datové inženýry, ty strašně chytré lidi, kteří vezmou data, pochopí byznysový problém, dokážou ho nějak namodelovat a ideálně ještě nasadit model, který škálovatelně někde běží. Takže ta last mile, těch posledních 5 %, je z velké části tradiční machine learning. Jo, v zásadě ano, je to prostě standardní data science, s tím, že máš k dispozici cloud nebo Kurzor a vlastně definuješ ten experiment a on ho nějak píše za tebe. A samozřejmě nejen data scientisty potřebujeme i devops lidi, aby to dobře běželo, potřebujeme šikovné full stack vývojáře, kteří zajistí, že z toho API opravdu…

vznikne fungující web. Proto se ten Kurzor, jak jsem říkal, občas chová trochu blbě. Hledáme šikovné inženýry na celém spektru, kteří mají rádi GCP, Azure, mikroservisy, dělají v Pythonu, Node.js nebo Next.js a chtějí pracovat na cutting-edge technologii.

No a všem, kteří toto poslouchají, doporučujeme Data Talk newsletter, kde uslyšíte o tom, že AIM nabral další kolo financování a rozšiřuje kanceláře. Za mě doporučujeme – je skvělé, že něco takového tady vzniká. Moc mě baví startupový přístup, opravdu že to někdo bere za ten správný konec a nejdřív hledá byznys a trh a až potom staví.

Tak děkujeme moc, že jsme tady na začátku, ještě v early stage, když to není ještě úplně hotové a je to asi stále na cestě. Držíme moc palce a určitě se tady nevidíme a neslyšíme naposled. Díky moc za rozhovor. Díky.

Děkujeme, že jste doposlouchali až sem. A díky taky našim partnerům, členům Data Talk klubu. Těmi jsou: Intex, Saska, Bystreet, Colors of Data, Revolt BI, GoodData, Keboola, Emark, Carl Data Company, DataMind, Notino a FLO.

A pokud chcete zůstat v obraze, co se české datové scény a globálních datových technologií týče, nezapomeňte se registrovat k odběru našeho týdenního newsletteru na datatalk.cz. Nechť vás provází data.

Pokud bys chtěl ještě nějaké stylistické úpravy nebo vysvětlit konkrétní části, dej vědět.

Podcast

Data Talk #148: Michal Najman (Aim)

Strojový přepis

Odebírejte Data Talk