0 Úvod ⏱️ 5 min

Proč tokeny vůbec řešit

Každá AI služba má svůj limit — kolik toho zvládnete za hodinu, den nebo týden. Ten limit se neměří v počtu zpráv, ale v tokenech. Když pochopíte, co token je a kde se ho spotřebuje nejvíc, přestanete narážet na zeď uprostřed práce a z jednoho předplatného vytěžíte mnohem víc.

Tenhle kurz není o teorii. Je o tom, jak prakticky šetřit: kdy stačí slabší model, k čemu je nastavení „effort", jak rozdělit úkol mezi dva modely a jak rozvrhnout náročnou práci podle toho, kdy se vám limit obnoví.

Pro koho to je: pro ty, kdo už AI běžně používají a chtějí z předplatného (Claude, ChatGPT a podobně) dostat maximum. Základy promptování tu nepotřebujete — máme na ně samostatný kurz.

Tři věci, které platí u všech AI

~2 min

🎟️ Limit se měří v tokenech, ne ve zprávách. Jedna dlouhá konverzace s přílohami spotřebuje víc než deset krátkých dotazů.
⚖️ Víc výkonu = víc spotřeby. Silnější model a hlubší „přemýšlení" dávají lepší výsledky, ale ukrojí z limitu rychleji. Trik je platit za výkon jen tam, kde se vyplatí.
⏰ Limit se obnovuje v čase. Nemusíte čekat na půlnoc — okna se posouvají. Když víte jak, dá se kolem nich naplánovat.

Jak kurz funguje: taháky a šablony kopírujete tlačítkem „Kopírovat". Kvízy jdou opakovat. Postup se ukládá ve vašem prohlížeči. V modulu 5 je interaktivní kalkulačka, kde si spotřebu osaháte sami. Celý kurz lze vytisknout (tlačítko nahoře).

1 Modul 1 · Klíčový ⏱️ 10 min

Co je vlastně token

Token je nejmenší kousek textu, se kterým jazykový model pracuje. Není to ani písmeno, ani celé slovo — je to něco mezi. Krátké běžné slovo se vejde do jednoho tokenu, delší nebo méně časté se rozpadne na dva i tři kousky.

1a · Jak se text dělí na tokeny

~3 min

Podívejte se, jak se na tokeny rozpadne jednoduchá anglická věta. Každý barevný blok je jeden token:

Iloveprogramming!

„programming" se rozpadlo na tři tokeny, „I" a „love" jsou po jednom.

U češtiny s diakritikou a delšími tvary je dělení hustší — stejně dlouhý text v češtině sní zpravidla víc tokenů než v angličtině:

Milujiprogramování!

Stejný význam, ale víc tokenů. Proto je práce v češtině na limit o něco náročnější.

Hrubé pravidlo: jeden token ≈ 4 znaky ≈ 0,75 slova v angličtině. Pro češtinu počítejte spíš s tím, že na jedno slovo padne token i víc. Běžná stránka A4 (kolem 500 slov) vyjde v angličtině zhruba na 650 tokenů, v češtině o dost víc.

1b · Proč to AI vůbec dělá

~3 min

Model nečte text po písmenech ani po slovech — čte ho po tokenech a předpovídá, jaký token nejspíš přijde další. Tokeny jsou tedy zároveň měrná jednotka práce: kolik jich model přečte na vstupu a kolik vytvoří na výstupu, podle toho se počítá spotřeba i cena.

Proto se v ceníku API platí „za milion tokenů" a proto se i vaše předplatné vyčerpává podle tokenů, ne podle počtu odeslaných zpráv.

Kvíz

Co je token?

2 Modul 2 · Klíčový ⏱️ 12 min

Jak se tokeny spotřebovávají

Tady většina lidí podceňuje realitu. Spotřebovává se totiž vstup i výstup — nejen to, co AI napíše, ale i celý text, který do ní pošlete. A to nejdůležitější: při každé nové zprávě si model znovu načítá celou historii konverzace, aby udržel kontext.

Tichý žrout tokenů: jedno krátké „díky" na konci dvouhodinové konverzace s několika přiloženými PDF není zadarmo. Model si kvůli němu znovu projede úplně všechno, co bylo předtím. Čím delší vlákno, tím dražší každá další zpráva.

2a · Čtyři faktory, které spotřebu řídí

~5 min

Délka a typ dotazu

Krátká otázka vs. rozbor dlouhého dokumentu.

„Kolik je hodin?" × analýza smlouvy

Velikost kontextu

Nahrané soubory, dlouhá historie, obrázky.

počítá se při každém kole znovu

Použitý model

Silnější (Opus) spotřebuje víc než lehčí (Sonnet).

modul 3

Nastavení effort

Kolik model „přemýšlí", než odpoví.

modul 4

2b · Proč dlouhá konverzace zdražuje

~4 min

Představte si konverzaci jako sněhovou kouli. S každou zprávou se nabaluje historie, kterou model musí pokaždé celou přečíst:

✗ Jedno nekonečné vlákno

50 zpráv v jediném chatu, každá další čte historii všech předchozích → spotřeba roste s každým kolem.

U dlouhých vláken zaplatíte za stejnou otázku násobně víc než na začátku.

✓ Nové vlákno na nové téma

Skončili jste téma? Začněte čistý chat. Model nečte zbytečnou historii a každá zpráva je levná.

Drží to spotřebu nízko a navíc se AI líp soustředí na aktuální zadání.

Kvíz

Proč krátké „děkuji" na konci dlouhé konverzace stojí víc tokenů, než byste čekali?

3 Modul 3 · Klíčový ⏱️ 10 min

Modely: Opus vs. Sonnet

Většina služeb nabízí víc modelů — od lehkých a rychlých po silné a důkladné. Liší se výpočetní náročností, a tím i spotřebou. U Claude jsou to třeba Haiku (nejlehčí), Sonnet (vyvážený) a Opus (nejsilnější); u jiných služeb to funguje obdobně.

3a · Tři váhové kategorie

~3 min

🪶

Lehký (Haiku)

Rychlý a nejlevnější. Na jednoduché a hromadné úkoly. Na co: rychlé odpovědi, přepisy, klasifikace.

⚖️

Vyvážený (Sonnet)

Dobrý poměr výkon/cena. Zvládne většinu běžné práce. Na co: rozbory, koncepty, běžné psaní.

🧠

Silný (Opus)

Nejhlubší uvažování, nejvyšší spotřeba. Na co: složité úlohy, finální kontrola, těžké ladění.

A co úplná špička? Nad řadou Opus existuje i nejnovější, ještě výkonnější třída modelů (u Claude třeba Fable 5 z tzv. „Mythos" třídy). Jsou schopnější než Opus, ale taky dražší a hůř dostupné — pro běžnou práci je nepotřebujete. Berte je jako těžkou techniku na výjimečně náročné úkoly; všechno ostatní v tomto kurzu platí pro ně stejně.

Nepoužívejte kanón na vrabce. Drtivá většina běžných úkolů — přepis, shrnutí, jednoduchá rešerše, koncept e-mailu — nepotřebuje nejsilnější model. Ten si schovejte na věci, kde se hloubka vyplatí: složité uvažování o víc proměnných, návrh architektury, ladění netriviálního kódu, finální kontrola.

3b · Kdy který model

~4 min

Úkol	Doporučený model	Proč
Přepis, překlad, shrnutí	Lehký	Mechanická práce, nepotřebuje hloubku.
Běžné psaní, rozbor, koncept	Vyvážený	Dobrý poměr kvalita/spotřeba.
Složitá analýza, návrh, ladění	Silný	Vyplatí se zaplatit za přesnost.
Finální kontrola výstupu	Silný	Odhalí chyby, které slabší přehlédne.

Kvíz

Potřebujete přeložit deset krátkých e-mailů. Který model zvolíte?

4 Modul 4 · Klíčový ⏱️ 10 min

Nastavení „effort"

Tohle je nejpodceňovanější přepínač posledního roku. Vedle volby modelu se objevil parametr effort — kolik „přemýšlení" má model do odpovědi vložit, než začne psát. U Claude jsou dnes typicky úrovně low, medium, high, xhigh a max (ne každý model podporuje všechny). Princip je u všech služeb stejný: vyšší effort = lepší odpovědi, ale pomalejší a větší spotřeba limitu.

Effort a „přemýšlení" nejsou totéž. Effort je o rozsahu — kolik kroků model udělá od otázky k odpovědi. Nízký effort se drží přesně toho, na co jste se zeptali. Vysoký zkoumá okolí, zvažuje hraniční případy, dělá víc kroků a jde dál než nezbytné minimum.

4a · Co která úroveň znamená

~4 min

Úroveň	Na co	Spotřeba
Low	Klasifikace, rychlé dotazy, „stačí dost dobře a rychle".	nejnižší
Medium	Vyvážená volba pro běžnou práci.	střední
High	Složitější uvažování, kde kvalita je důležitější než rychlost.	vyšší
xhigh / max	Nejnáročnější úlohy bez ohledu na cenu (kód, těžké rozbory).	nejvyšší

Pozor na příliš nízký effort. Umí kvalitu srazit víc, než byste čekali — projeví se to ve všem: méně kroků, méně vysvětlení, u kódu méně komentářů. U složité úlohy je proto lepší zvednout effort, než to obcházet chytrými prompty.

4b · Praktické pravidlo

~3 min

✗ Effort natvrdo na max

Necháte max na všechno, i na „přepiš tuhle větu". Limit mizí zbytečně rychle.

Platíte za hloubku i tam, kde stačí pár tokenů.

✓ Effort podle úkolu

Běžná práce na medium, složité věci na high, max jen výjimečně.

Drtina práce zvládne medium — a vy ušetříte výrazně.

Kvíz

Co dělá nastavení „effort"?

5 Modul 5 · Vyzkoušejte ⏱️ 8 min

Kalkulačka spotřeby — osahejte si to

Teď si to spojíme. Posuňte si délku zadání, vyberte model a effort a sledujte, jak se mění odhadovaná spotřeba. Čísla jsou orientační — slouží k pochopení poměrů, ne k přesnému účtování.

🧮 Odhad spotřeby

Délka zadání + historie: 500 slov

Model

Effort

Jazyk

Odhadovaná spotřeba na jednu odpověď

— tokenů

Cvičení: nastavte stejné zadání nejdřív na Lehký + Low, pak na Silný + Max. Rozdíl ve spotřebě bývá několikanásobný — u krátkých dotazů s těžkým přemýšlením i přes desetinásobek. Přesně tady se rozhoduje, jak rychle narazíte na limit.

5a · Kolik tokenů vlastně mám?

~3 min

Aby ta čísla dávala smysl, je dobré vědět, s čím hospodaříte. Předplatným si nekupujete pevný balík tokenů na měsíc, ale kapacitu na časové okno, která se průběžně obnovuje. U Claude jde o klouzavé 5hodinové okno — kolik se do něj vejde, závisí na plánu:

Plán Claude	Orientačně na 5h okno	Pro koho
Pro	~ 44 000 tokenů	Běžné denní použití.
Max 5×	~ 88 000 tokenů	Intenzivnější práce, víc sezení denně.
Max 20×	~ 220 000 tokenů	Náročné projekty, dlouhé agentní úlohy.

Čísla berte orientačně. Anthropic dnes limity neudává v pevných tokenech, ale relativně — reálná kapacita kolísá podle modelu, délky konverzace, příloh a vytížení serverů. Uvedené hodnoty vycházejí z měření komunity, ne z oficiálních pevných limitů. Navíc nad 5hodinovým oknem běží ještě týdenní strop (modul 7). Porovnejte si výše spočítanou spotřebu s těmito čísly: u plánu Pro vám jedna těžká odpověď (Silný + Max) ukrojí znatelný kus celého okna.

6 Modul 6 · Klíčový ⏱️ 12 min

Chytré strategie úspory

Teď to nejdůležitější — jak všechno spojit dohromady. Dvě hlavní strategie vám ušetří nejvíc: kombinace modelů a správné nastavení effortu.

6a · Slabší model na rozbor, silný na finále

~5 min

Nabízí se otázka: pustit rovnou nejsilnější model, nebo kombinovat? Odpověď: kombinace se vyplatí, ale ne vždy. Funguje to takhle:

Slabší model (Sonnet) na úvodní rozbor — zmapuje problém, navrhne strukturu, vytahá fakta, udělá první návrh. Spotřebuje málo a hrubá práce mu jde dobře.
Silný model (Opus) na finále a kontrolu — řešení posoudí, najde chyby v uvažování, doladí hraniční případy a dá tomu finální kvalitu.

✓ Kombinace se vyplatí

Úloha jde rozdělit na „nasbírej a naskládej" (levné) a „rozhodni a zkontroluj" (drahé).

Hrubou objemovou práci odbavíte levně, drahý výpočet platíte jen za to podstatné.

✗ Kombinace nepomůže

Úloha je monoliticky složitá — i rozbor vyžaduje hloubku (těžká matematika, návrh architektury, bezpečnostní analýza).

Slabší model udělá rozbor, který silný stejně celý přepracuje — zaplatíte dvakrát.

Pravidlo: čím líp jde úloha rozdělit na sběr a rozhodnutí, tím víc se kombinace vyplatí. Čím je monoliticky složitá, tím spíš jeďte rovnou silný model s vyšším effortem. A logicky: slabšímu modelu na rozbor stačí medium, silnému na kontrolu dejte high — dvojitá úspora.

6b · Reálné scénáře (rozklikněte)

~4 min

📝 Dlouhý článek nebo report +

Situace: Píšete delší text — potřebujete rešerši, strukturu i finální vychytání.

Slabší model na sběr podkladů a první draft (hodně textu, nízká cena). Pak přepnete na silný model: „Projdi tento draft, najdi slabá místa v argumentaci a navrhni úpravy." Drahý výpočet padne jen na to, co ho potřebuje.

💻 Ladění kódu +

Situace: Máte chybu, kterou nevidíte.

U netriviálních chyb se kombinace často nevyplatí — rozbor i řešení vyžadují hloubku. Jeďte rovnou silný model s vysokým effortem (nebo „max" u čistě kódových úloh). Naopak rutinní úpravy a formátování klidně na lehkém modelu.

📨 Hromada krátkých úkolů +

Situace: Deset přepisů, překladů nebo krátkých odpovědí.

Tady silný model jen plýtvá. Lehký model + low effort odbaví celou dávku za zlomek spotřeby a kvalita je u takhle jednoduchých úkolů srovnatelná.

Kvíz

Kdy se NEvyplatí rozbor na slabším modelu a finále na silném?

7 Modul 7 ⏱️ 8 min

Reset limitů a plánování v čase

Druhá velká úspora není o tom, co spustíte, ale kdy. Vyplatí se pochopit, jak se limit obnovuje — pak se kolem něj dá naplánovat náročná práce.

7a · Jak reset funguje

~3 min

U většiny dnešních předplatných (Claude, ChatGPT) nejde o pevný reset o půlnoci. Krátkodobý limit běží typicky v klouzavém okně (u Claude pětihodinovém) navázaném na vaši první zprávu. Posouvá se s časem: počítá se spotřeba za posledních pět hodin, takže co jste spotřebovali třeba v 9:00, se vám uvolní zase ve 14:00. U Claude k tomu běží i týdenní strop v klouzavém 7denním okně, taky navázaný na první zprávu cyklu, ne na pondělní půlnoc.

Jedna peněženka pro všechno. U Claude se z jednoho limitu čerpá konverzace ve webu, desktop aplikace, Claude Code i další nástroje pod stejným účtem. Placené API přes klíč se obvykle účtuje zvlášť (konkrétní pravidla se ale čas od času mění, ověřte si je v nastavení účtu).

7b · Strategie „ráno zadám, večer dokončím"

~3 min

Tahle strategie se hodí každému, kdo přes den pracuje a osobní AI u toho nepotřebuje:

⏰ Rozvržení dne

Jak rozložit náročnou práci

Ráno (třeba u snídaně) zadáte náročnou dávku a klidně spotřebujete velkou část okna — silný model s vysokým effortem na to, co potřebuje hloubku.
Přes den AI nepoužíváte — klouzavé okno se mezitím obnoví.
Po návratu domů máte limit zase k dispozici a práci dokončíte, zkontrolujete, doladíte. Claude i ostatní agenti přitom navážou tam, kde skončili — stačí pokračovat ve stejné konverzaci.

Háček: funguje to jen, dokud nenarazíte na týdenní strop. Proto sledujte ukazatel spotřeby — kdo je ve středu na 70 % týdenního limitu, má problém s plánováním, ne s denním oknem.

Sledujte ukazatel spotřeby před začátkem velké úlohy, ne až když narazíte na zeď. Reálná čísla a čas resetu, která vidíte přímo v aplikaci, jsou spolehlivější než jakýkoliv odhad.

Kvíz

Kdy se u Claude obnoví krátkodobý limit?

8 Kuchařka ⏱️ k vracení

Taháky a řešení potíží

Tahle část je vaše rychlá kuchařka — vracejte se sem. Hotové návyky na úsporu, šablony k okopírování a tabulka, co dělat, když narazíte na limit.

8a · Návyky, které šetří limit (rozklikněte)

tahák

🧹 Práce s konverzací+

Začínejte nové vlákno na nové téma:

Skončili jste téma? Otevřete čistý chat. Model pak nečte zbytečnou historii a každá zpráva je levná — navíc se líp soustředí.

Nenahrávejte zbytečně velké soubory:

Pokud z dlouhého PDF potřebujete jen kousek, vytáhněte relevantní část. Celý dokument se počítá při každém kole konverzace.

⚙️ Model a effort+

Default effort přepínejte podle úkolu:

Nenechávejte ho natvrdo na max. Drtina práce zvládne medium; max jen na opravdu náročné věci.

Slabší model na objem, silný na finále:

Když jde úloha rozdělit, nechte hrubou práci na lehkém modelu a jen kontrolu na silném.

⏰ Plánování v čase+

Náročné dávky na začátek okna:

Plánujte je na začátek klouzavého okna, ne na konec, kdy už je skoro plné.

Sledujte ukazatel spotřeby:

Před velkou úlohou mrkněte na stránku se spotřebou. Hlídejte hlavně týdenní strop.

8b · Šablona: nechte AI šetřit za vás

kopírovat

Když chcete u delší práce držet spotřebu nízko, vložte na začátek konverzace tuhle hlavičku. AI pak nebude plýtvat na zbytečné úvody a rozbory:

Pracuj úsporně a věcně: - Odpovídej rovnou, bez dlouhých úvodů a shrnutí toho, co jsem napsal. - Když je úkol jednoduchý, nepřemýšlej nahlas a dej krátkou odpověď. - U složitější věci se nejdřív zeptej, jestli mám doplnit kontext, ať to netrefuješ naslepo. - Drž se přesně toho, na co se ptám, nerozšiřuj zadání sám. Potvrď jednou větou a počkej na můj dotaz.

8c · Když narazíte na limit (řešení potíží)

tahák

🚫 Došel mi limit uprostřed práce

Zkontrolujte stránku se spotřebou — uvidíte přesný čas resetu. Okno se posouvá s časem: co jste spotřebovali například v 9:00, se vám uvolní zase ve 14:00. Nemusíte tedy čekat na konec dne, ale na chvíli, kdy vaše dřívější spotřeba „zestárne" o pět hodin.

😵 Limit mizí rychleji než dřív

Zkontrolujte délku vláken a effort. Dlouhá konverzace + max na všechno je nejčastější příčina.

📎 Velká příloha = rychlý úbytek

Vytáhněte z dokumentu jen relevantní část. Celá příloha se čte při každém kole znovu.

🐢 Odpovědi jsou pomalé

Snižte effort. Low nebo medium je u běžných úkolů rychlejší a kvalita stačí.

🤔 Nevím, jestli mám na úkol limit

Mrkněte na ukazatel spotřeby před startem. Hlídejte hlavně týdenní strop, ne jen denní okno.

⏸️ Limit došel uprostřed rozdělané práce

Nevadí — Claude (a nejspíš i další AI agenti) dokáže navázat tam, kde skončil. Po obnovení okna pokračujte ve stejné konverzaci nebo mu řekněte „pokračuj, kde jsi přestal". Kontext zůstává zachovaný.

Zlaté pravidlo úspory: platit za výkon jen tam, kde se vyplatí. Slabší model + nižší effort + krátká vlákna = většina práce za zlomek spotřeby. Silný model a vysoký effort si schovejte na to, co opravdu rozhoduje.

✓ Závěr ⏱️ 3 min

Shrnutí a co dál

Hotovo — prošli jste celým kurzem. Shrnutí do jedné věty: tokeny jsou jednotky práce a vy rozhodujete, kolik jich utratíte. Když víte, kde se spotřebuje nejvíc — dlouhá vlákna, silný model, vysoký effort — a platíte za výkon jen tam, kde se vyplatí, natáhnete předplatné limity překvapivě daleko.

✅ Závěrečný checklist — odškrtejte si

Vím, co je token a že se počítá vstup i výstup. Chápu, proč dlouhá konverzace s přílohami spotřebovává čím dál víc. Umím vybrat model podle úkolu — lehký, vyvážený, silný. Vím, k čemu je effort a že ho mám přepínat podle úkolu, ne nechávat na max. Vyzkoušel/a jsem kalkulačku a vidím, jak velký je rozdíl ve spotřebě. Umím rozdělit úlohu: slabší model na rozbor, silný na finále — a vím, kdy to nedělat. Vím, jak se obnovuje limit, a umím podle toho rozvrhnout náročnou práci. Hlídám si ukazatel spotřeby, hlavně týdenní strop.

Užitečné odkazy

ClaudeNastavení modelu i effortu, stránka se spotřebou v Settings → Usage. ChatGPTVolba modelu, limity na časovém okně podle plánu. Google GeminiUniverzální AI od Googlu s vlastními limity. Chiptron.czDalší články o AI, technice a chytrých nástrojích.

Začněte jednou změnou. Příští týden zkuste jediné: přepínejte model a effort podle úkolu místo „pořád to nejsilnější". Sami uvidíte, o kolik dál vám limit vydrží. A když si nebudete vědět rady, vraťte se do Kuchařky.

Začínáte s AI od nuly? Než budete řešit tokeny, mrkněte na základy — jak psát prompty, generovat text i obrázky a používat AI bezpečně. Přejít na kurz „Všeobecné základy AI" →

🌱 Poslední otázka na závěr

Která jedna věc z tohoto kurzu vám podle vás ušetří nejvíc limitu — a vyzkoušíte ji už tento týden?

Tento kurz je zdarma

Pokud vám pomohl a chcete podpořit jeho tvorbu, můžete nakupovat na Alze přes tento odkaz — nic vás to navíc nestojí a nám to pomůže.

Jde o affiliate odkaz, z nákupu nám náleží malá provize.

Proč tokeny vůbec řešit

Tři věci, které platí u všech AI

Co je vlastně token

1a · Jak se text dělí na tokeny

1b · Proč to AI vůbec dělá

Jak se tokeny spotřebovávají

2a · Čtyři faktory, které spotřebu řídí

Délka a typ dotazu

Velikost kontextu

Použitý model

Nastavení effort

2b · Proč dlouhá konverzace zdražuje

Modely: Opus vs. Sonnet

3a · Tři váhové kategorie

Lehký (Haiku)

Vyvážený (Sonnet)

Silný (Opus)

3b · Kdy který model

Nastavení „effort"

4a · Co která úroveň znamená

4b · Praktické pravidlo

Kalkulačka spotřeby — osahejte si to

🧮 Odhad spotřeby

5a · Kolik tokenů vlastně mám?

Chytré strategie úspory

6a · Slabší model na rozbor, silný na finále

6b · Reálné scénáře (rozklikněte)

Reset limitů a plánování v čase

7a · Jak reset funguje

7b · Strategie „ráno zadám, večer dokončím"

Jak rozložit náročnou práci

Taháky a řešení potíží

8a · Návyky, které šetří limit (rozklikněte)

8b · Šablona: nechte AI šetřit za vás

8c · Když narazíte na limit (řešení potíží)

Shrnutí a co dál

✅ Závěrečný checklist — odškrtejte si

Užitečné odkazy

🌱 Poslední otázka na závěr

Tento kurz je zdarma 💛

Tento kurz je zdarma