Ahoj všichni. V tomhle článku se podíváme podrobněji na to, jak kontext přímo ovlivňuje výstupy, které vám AI dává…
Už v červnu 2025 napsal Andrej Karpathy (slovensko‑kanadský počítačový vědec, jeden z nejznámějších odborníků na hluboké učení a počítačové vidění, který patřil k zakládajícím členům OpenAI a vedl AI tým pro Autopilot v Tesle.) na X jednu krátkou větu:
„+1 pro context engineering před prompt engineering."
Pro mnoho lidí to mohlo znít jen jako další z mnoha tweetů od nějakého AI vědátora. Jenže za tři měsíce mu k tomu přitakal v komentáři i Tobi Lütke (CEO Shopify). A pak na toto téma Anthropic vydal průvodce, který si během týdne přečetlo půl milionu lidí.
Pojďme si rozebrat, o co vlastně jde. A hlavně - proč by vás to mělo zajímat, i když nestavíte žádné složité AI struktury.
Začneme mýtem, kterému možná stále věříte
„AI si pamatuje, co jsme si kdy řekli."
To ale není tak úplně pravda🙂
Samotný jazykový model - tedy ten „mozek" ChatGPT, Claude nebo Gemini - si sám o sobě nepamatuje vůbec nic.
Je to jako šachista s krátkodobou amnézií: pokaždé, když mu něco pošlete, dostane od vás směsici znaků, odehraje podle toho svůj tah a pak úplně zapomene, že jste spolu hráli.
Proč tedy máte pocit, že si ChatGPT pamatuje, o čem jste se bavili? Protože nad tím modelem běží chytrá aplikace, která za vás dělá několik věcí najednou:
- V rámci jednoho chatu aplikace modelu při každé nové zprávě pošle celou dosavadní konverzaci - takže model „ví", o čem jste se bavili před deseti minutami.
- Napříč chaty (pokud máte zapnutou paměť) si aplikace vede zvlášť něco jako zápisník = ukládá si fakta o vás, vaše preference, jména vašich projektů. A tenhle zápisník vám při každé nové konverzaci potichu přibalí k modelu.
- Vlastní vzpomínky mezi chaty (funkce „Reference chat history", dostupná pro Plus a Pro uživatele) - ChatGPT může sám vytáhnout relevantní útržky ze starších rozhovorů, když usoudí, že by se hodily.
Klíčové je tohle: ať už jde o čerstvou zprávu, celou dosavadní konverzaci, nebo vzpomínky z minulého měsíce - v momentě, kdy vám AI model odpovídá, je to všechno součástí jednoho balíku informací, který mu vaše aplikace poslala. Mimo tenhle balík pro samotný AI model nic z toho ale neexistuje.
A proto, když budete chtít stejný úkol řešit na jiném ChatGPT účtu nebo dokonce v jiném AI nástroji (např. Claude), AI model o tom úkolu samozřejmě nebude mít ani páru a musíte mu ten balík informací znovu zaplnit odpovídajícím kontextem.
Tento balík má svůj název - říká se mu kontextové okno. A jeho kvalita rozhoduje o tom, jestli dostanete geniální odpověď, nebo zmatený blábol.
Váš prompt = to, co jste zrovna napsali - je jen jedna část toho balíku. Zbytek tvoří systémové instrukce aplikace, vaše uložené preference, dosavadní konverzace, útržky ze starších chatů, případně soubory, které jste přiložili. A umění poskládat celý ten balík tak, aby z něj AI vytěžila maximum, má svůj název - context engineering.
Co přesně Karpathy řekl a proč se to chytlo
Karpathy ve svém příspěvku vysvětluje, že u seriózních AI aplikací (ChatGPT, Claude, Gemni apod.) je hlavní „kouzlo“ v tom, jak jí připravíš vstupy a obalové řešení, ne v tom, jak chytrý máš jeden prompt.
Laicky vysvětleno
- Nejde jen o to napsat jeden chytrý příkaz (prompt), ale poskládat pro AI správné podklady: zadání, příklady, dokumenty, historii konverzace atd., aby měla všechno důležité na jednom místě.
- Když jí toho dáš málo nebo ve špatném formátu, nepochopí úkol; když toho nahrneš moc nebo nesmysly, bude to drahé a výsledek horší.
- Navíc dobrá AI aplikace musí umět rozdělit problém na kroky, správně balit data do „oken“, volit vhodný model, kontrolovat a opravovat výstupy, hlídat bezpečnost, testovat kvalitu, paralelizovat atd.
- To všechno dohromady je velká, složitá vrstva softwaru kolem modelu, takže nazývat to jen „ChatGPT wrapper“ (nějaký obal) je podle něj úplně mimo.
Milion tokenů vám k ničemu nebude. A tady je důkaz
Velcí hráči se teď předhánějí v tom, kdo nabídne větší kontextové okno. Gemini má milion. ChatGPT taky. Llama 4 dokonce deset milionů. Zní to krásně, vždyť víc místa musí znamenat lepší odpovědi, ne?
No - ani ne. 🙂
Vědci z Chroma Research otestovali osmnáct nejlepších modelů a zjistili znepokojivou věc. Jakmile kontextové okno zaplníte, přesnost začne klesat. Pojmenovali to context rot, kontextová hniloba. Model teoreticky zvládne milion tokenů, ale v praxi se někdy kolem 128 až 200 tisíců začne chovat jako unavený student u páté hodiny zkoušky. Ignoruje důležité věci, plete pozice, vymýšlí si. Dokonce i triviální úkol „zopakuj slovo, které se objeví na konci textu" mu dělá v dlouhém kontextu problém.
Víte, jak to funguje u vás v kanceláři? Čím víc papírů na stole, tím hůř najdete ten, co zrovna potřebujete. Anthropic to ve svém manuálu nazývá „pozornostní rozpočet". Model má omezený budget pozornosti a vy ho utrácíte každou další informací, kterou dovnitř strčíte.
Dobrý context engineering neznamená hledat největší okno. Znamená to najít nejmenší možnou sadu tokenů s největším signálem.
Čtyři pilíře, které vám ušetří měsíce experimentů
Firma LangChain, jeden z nejpoužívanějších nástrojů pro stavbu AI agentů, celý obor shrnula do čtyř slov. Zapamatujte si je. Je to mapa, podle které se můžete v context engineeringu orientovat.
1. Write, neboli zapisuj ven z okna.
Agent (tedy AI, která pro vás samostatně plní úkoly) si ukládá věci, co bude potřebovat později, do externího úložiště. Může to být scratchpad (v překladu: poznámkový blok stranou), vlastní poznámky nebo dlouhodobá paměť. Díky tomu si neplete aktuální konverzaci zbytečnostmi. Typický příklad? Claude Code (nástroj pro programování od Anthropicu) si vede soubor TODO.md s průběhem práce. Kdybychom to přenesli do vašeho života, je to jako vést si zápisník při schůzce, místo abyste se snažili všechno zapamatovat v hlavě.
2. Select, neboli vybírej, co pustíš dovnitř.
Místo toho, aby AI dostala všechno naráz, pouštějte dovnitř jen to, co se v dané chvíli opravdu hodí. Typicky přes RAG (zkratka pro Retrieval-Augmented Generation, tedy „generování obohacené o vyhledávání", kdy si model sáhne do vaší knihovny dokumentů a vytáhne jen relevantní kousek) nebo přes nástroje, kterými si AI otevře konkrétní soubor v pravou chvíli.
3. Compress, neboli zhušťuj.
Když se kontextové okno začíná plnit, udělejte shrnutí. Důležitá rozhodnutí a nedořešené problémy si ponechte, zbytek zahoďte. Anthropic (firma, která vyvíjí Claude) tomu říká compaction (v překladu: stlačení) a popisuje to jako „první páku, za kterou zatáhnete, když chcete, aby se AI v dlouhé úloze neztrácela".
4. Isolate, neboli odděluj.
Těžkou a rozsáhlou práci nechte dělat jiného agenta v odděleném kontextovém okně. Hlavní agent od něj dostane zpátky jen stručné shrnutí na 1 000 až 2 000 tokenů, místo aby se musel prohrabávat desetitisíci tokenů z prohledávání souborů. Je to jako když si šéf nechá od asistenta připravit výtah z padesátistránkové zprávy, místo aby to četl celé sám.
Pokud si z celého článku máte zapamatovat jedinou věc, ať jsou to tato čtyři slova: Write, Select, Compress, Isolate.
Vlastní knowledge base. To je ten poklad, který podceňujete
Pokud máte vlastní pořádně uspořádanou sbírku dokumentů, poznámek, příkladů a popsaných postupů, jste ve výhodě proti někomu, kdo má sice chytřejší AI ale jinak žádné kontextové podklady.
Proč? Protože taková sbírka je tool agnostic (v překladu: nezávislá na konkrétním nástroji, dá se použít kdekoliv). Dneska ji nahrajete do Claude, zítra do ChatGPT, pozítří do Gemini. Je to váš majetek. Model je jenom nástroj, co si na daný týden vyberete podle nálady nebo ceny.
Andrej Karpathy si sám buduje osobní znalostní základnu, protože ví, že skutečná hodnota se hromadí v kontextu, tedy v těch informacích, které AI dodáte, a ne v samotném modelu. Modely se mění každý měsíc. Vaše znalostní základna vám zůstane napořád.
Z toho plyne jednoduchý závěr pro každého, kdo to s AI myslí vážně. Přestaňte honit „nejlepší model týdne". Místo toho investujte do svého kontextu. Do knihovny osvědčených promptů (tedy zadání, která se vám už v minulosti vyplatila), do dobře popsané firemní dokumentace, do šablon a postupů. Tedy do věcí, které vám přežijí tři generace AI modelů a budou vám sloužit dál.
Jak to zařídit prakticky, i když nejste ajťák
Tohle fakt nemusí být složité. Tady je pět věcí, které si můžete vyzkoušet už tento týden.
Zaprvé, začněte sbírat svoji knowledge base.
Stačí jeden Notion nebo Google Drive a v něm složka „AI kontext". Patří tam styl vaší firmy, tón komunikace, vzorové e-maily, časté otázky od zákazníků, popis produktů, FAQ. Všechno, co znovu a znovu vysvětlujete modelu.
Zadruhé, naučte se formulovat úkol jako balíček.
Ne „napiš e-mail zákazníkovi", ale „Jsem [role]. Píšu zákazníkovi, který [situace]. Náš tón je [popis]. Cíl e-mailu je [cíl]. Délka [limit]. Přiložené dokumenty obsahují [obsah]."
Tohle je celý rozdíl mezi průměrnou odpovědí a tou, po které si zamnete ruce.
Zatřetí, v agentických nástrojích využívejte CLAUDE.md, Custom Instructions nebo projekty.
Všude tam patří trvalý kontext, který se k vaší konverzaci připojí automaticky. Nemusíte ho tak psát pořád dokola.
Začtvrté, vyhazujte staré věci.
Kontextové okno není nekonečné. Starou konverzaci, která už nedává smysl, klidně zahoďte a otevřete novou s aktualizovaným shrnutím. Méně šumu, vyšší přesnost. Je to trochu kontraintuitivní, ale funguje to.
Zapáté, zkuste just-in-time přístup.
Místo strkání všech dokumentů do chatu rovnou dejte modelu odkazy na dokumenty a naučte ho sáhnout si pro ně, až budou potřeba. Přesně tak to dělá Claude Code se svými příkazy grep a glob.
Co si z toho odnést
Prompt engineering byl fajn fenomén roku 2023. Pomohl nám pochopit, že zadání má formu. Ale dneska už je to jen jeden řádek ve větší knize. Ta větší kniha se jmenuje context engineering a je o tom, co všechno pošleme modelu do okna, jak, kdy, v jakém pořadí a z jakého zdroje.
Dobrá zpráva? Tohle se dá naučit. Nepotřebujete k tomu inženýrský diplom. Stačí si všímat, jak pracujete, co opakujete, co vás bolí, a tyhle věci si zapsat do vlastní knowledge base. A pak je systematicky předávat modelu.
Špatná zpráva? Kdo to neudělá, bude za rok pozadu. Ne proto, že by měl horší model. Ale proto, že bude mít horší kontext.
A jak jste na tom vy? Vedete si nějakou AI knowledge base, nebo pokaždé ťukáte všechno znovu?
Praktické ukázky, jak tohle řešit, sdílíme společně v našem NaučímeAI klubu. Připojte se k nám.
Autor: Jakub Baxa, spoluzakladatel NaučímeAI s.r.o.





















