Postup uložen ✓
← Zpět na výběr kurzu Praktický kurz • Pro pokročilejší uživatele

Tokeny a limity AI

Platíte za AI předplatné a pořád narážíte na „dosáhli jste limitu"? Nebo vás zajímá, proč jedna konverzace ubere víc než druhá? Tenhle kurz vás naučí, jak to celé funguje — co je token, kde se spotřebovává nejvíc, čím se liší silný a slabý model, k čemu je nastavení „effort" a jak chytře rozložit práci. Z jednoho předplatného tak dostanete klidně dvojnásobek užitku.

⏱️ cca 75 minut 🎯 8 modulů 🧮 kalkulačka spotřeby 📋 taháky a strategie

📋 Co vás v kurzu čeká

  1. Úvod — proč tokeny vůbec řešit5 min
  2. Modul 1 — Co je token ⭐10 min
  3. Modul 2 — Jak se tokeny spotřebovávají ⭐12 min
  4. Modul 3 — Modely: Opus vs. Sonnet ⭐10 min
  5. Modul 4 — Nastavení „effort" ⭐10 min
  6. Modul 5 — Kalkulačka spotřeby (vyzkoušejte)8 min
  7. Modul 6 — Chytré strategie úspory ⭐12 min
  8. Modul 7 — Reset limitů a plánování v čase8 min
  9. Kuchařka — taháky a řešení potížítahák
0 Úvod ⏱️ 5 min

Proč tokeny vůbec řešit

Každá AI služba má svůj limit — kolik toho zvládnete za hodinu, den nebo týden. Ten limit se neměří v počtu zpráv, ale v tokenech. Když pochopíte, co token je a kde se ho spotřebuje nejvíc, přestanete narážet na zeď uprostřed práce a z jednoho předplatného vytěžíte mnohem víc.

Tenhle kurz není o teorii. Je o tom, jak prakticky šetřit: kdy stačí slabší model, k čemu je nastavení „effort", jak rozdělit úkol mezi dva modely a jak rozvrhnout náročnou práci podle toho, kdy se vám limit obnoví.

Pro koho to je: pro ty, kdo už AI běžně používají a chtějí z předplatného (Claude, ChatGPT a podobně) dostat maximum. Základy promptování tu nepotřebujete — máme na ně samostatný kurz.

Tři věci, které platí u všech AI

~2 min
Jak kurz funguje: taháky a šablony kopírujete tlačítkem „Kopírovat". Kvízy jdou opakovat. Postup se ukládá ve vašem prohlížeči. V modulu 5 je interaktivní kalkulačka, kde si spotřebu osaháte sami. Celý kurz lze vytisknout (tlačítko nahoře).
1 Modul 1 · Klíčový ⏱️ 10 min

Co je vlastně token

Token je nejmenší kousek textu, se kterým jazykový model pracuje. Není to ani písmeno, ani celé slovo — je to něco mezi. Krátké běžné slovo se vejde do jednoho tokenu, delší nebo méně časté se rozpadne na dva i tři kousky.

1a · Jak se text dělí na tokeny

~3 min

Podívejte se, jak se na tokeny rozpadne jednoduchá anglická věta. Každý barevný blok je jeden token:

Iloveprogramming!

„programming" se rozpadlo na tři tokeny, „I" a „love" jsou po jednom.

U češtiny s diakritikou a delšími tvary je dělení hustší — stejně dlouhý text v češtině sní zpravidla víc tokenů než v angličtině:

Milujiprogramo!

Stejný význam, ale víc tokenů. Proto je práce v češtině na limit o něco náročnější.

Hrubé pravidlo: jeden token ≈ 4 znaky0,75 slova v angličtině. Pro češtinu počítejte spíš s tím, že na jedno slovo padne token i víc. Běžná stránka A4 (kolem 500 slov) vyjde v angličtině zhruba na 650 tokenů, v češtině o dost víc.

1b · Proč to AI vůbec dělá

~3 min

Model nečte text po písmenech ani po slovech — čte ho po tokenech a předpovídá, jaký token nejspíš přijde další. Tokeny jsou tedy zároveň měrná jednotka práce: kolik jich model přečte na vstupu a kolik vytvoří na výstupu, podle toho se počítá spotřeba i cena.

Proto se v ceníku API platí „za milion tokenů" a proto se i vaše předplatné vyčerpává podle tokenů, ne podle počtu odeslaných zpráv.

Kvíz

Co je token?

2 Modul 2 · Klíčový ⏱️ 12 min

Jak se tokeny spotřebovávají

Tady většina lidí podceňuje realitu. Spotřebovává se totiž vstup i výstup — nejen to, co AI napíše, ale i celý text, který do ní pošlete. A to nejdůležitější: při každé nové zprávě si model znovu načítá celou historii konverzace, aby udržel kontext.

Tichý žrout tokenů: jedno krátké „díky" na konci dvouhodinové konverzace s několika přiloženými PDF není zadarmo. Model si kvůli němu znovu projede úplně všechno, co bylo předtím. Čím delší vlákno, tím dražší každá další zpráva.

2a · Čtyři faktory, které spotřebu řídí

~5 min
1

Délka a typ dotazu

Krátká otázka vs. rozbor dlouhého dokumentu.

„Kolik je hodin?" × analýza smlouvy
2

Velikost kontextu

Nahrané soubory, dlouhá historie, obrázky.

počítá se při každém kole znovu
3

Použitý model

Silnější (Opus) spotřebuje víc než lehčí (Sonnet).

modul 3
4

Nastavení effort

Kolik model „přemýšlí", než odpoví.

modul 4

2b · Proč dlouhá konverzace zdražuje

~4 min

Představte si konverzaci jako sněhovou kouli. S každou zprávou se nabaluje historie, kterou model musí pokaždé celou přečíst:

✗ Jedno nekonečné vlákno

50 zpráv v jediném chatu, každá další čte historii všech předchozích → spotřeba roste s každým kolem.

U dlouhých vláken zaplatíte za stejnou otázku násobně víc než na začátku.
✓ Nové vlákno na nové téma

Skončili jste téma? Začněte čistý chat. Model nečte zbytečnou historii a každá zpráva je levná.

Drží to spotřebu nízko a navíc se AI líp soustředí na aktuální zadání.
Kvíz

Proč krátké „děkuji" na konci dlouhé konverzace stojí víc tokenů, než byste čekali?

3 Modul 3 · Klíčový ⏱️ 10 min

Modely: Opus vs. Sonnet

Většina služeb nabízí víc modelů — od lehkých a rychlých po silné a důkladné. Liší se výpočetní náročností, a tím i spotřebou. U Claude jsou to třeba Haiku (nejlehčí), Sonnet (vyvážený) a Opus (nejsilnější); u jiných služeb to funguje obdobně.

3a · Tři váhové kategorie

~3 min
🪶

Lehký (Haiku)

Rychlý a nejlevnější. Na jednoduché a hromadné úkoly. Na co: rychlé odpovědi, přepisy, klasifikace.

⚖️

Vyvážený (Sonnet)

Dobrý poměr výkon/cena. Zvládne většinu běžné práce. Na co: rozbory, koncepty, běžné psaní.

🧠

Silný (Opus)

Nejhlubší uvažování, nejvyšší spotřeba. Na co: složité úlohy, finální kontrola, těžké ladění.

A co úplná špička? Nad řadou Opus existuje i nejnovější, ještě výkonnější třída modelů (u Claude třeba Fable 5 z tzv. „Mythos" třídy). Jsou schopnější než Opus, ale taky dražší a hůř dostupné — pro běžnou práci je nepotřebujete. Berte je jako těžkou techniku na výjimečně náročné úkoly; všechno ostatní v tomto kurzu platí pro ně stejně.
Nepoužívejte kanón na vrabce. Drtivá většina běžných úkolů — přepis, shrnutí, jednoduchá rešerše, koncept e-mailu — nepotřebuje nejsilnější model. Ten si schovejte na věci, kde se hloubka vyplatí: složité uvažování o víc proměnných, návrh architektury, ladění netriviálního kódu, finální kontrola.

3b · Kdy který model

~4 min
ÚkolDoporučený modelProč
Přepis, překlad, shrnutíLehkýMechanická práce, nepotřebuje hloubku.
Běžné psaní, rozbor, konceptVyváženýDobrý poměr kvalita/spotřeba.
Složitá analýza, návrh, laděníSilnýVyplatí se zaplatit za přesnost.
Finální kontrola výstupuSilnýOdhalí chyby, které slabší přehlédne.
Kvíz

Potřebujete přeložit deset krátkých e-mailů. Který model zvolíte?

4 Modul 4 · Klíčový ⏱️ 10 min

Nastavení „effort"

Tohle je nejpodceňovanější přepínač posledního roku. Vedle volby modelu se objevil parametr effort — kolik „přemýšlení" má model do odpovědi vložit, než začne psát. U Claude jsou dnes typicky úrovně low, medium, high, xhigh a max (ne každý model podporuje všechny). Princip je u všech služeb stejný: vyšší effort = lepší odpovědi, ale pomalejší a větší spotřeba limitu.

Effort a „přemýšlení" nejsou totéž. Effort je o rozsahu — kolik kroků model udělá od otázky k odpovědi. Nízký effort se drží přesně toho, na co jste se zeptali. Vysoký zkoumá okolí, zvažuje hraniční případy, dělá víc kroků a jde dál než nezbytné minimum.

4a · Co která úroveň znamená

~4 min
ÚroveňNa coSpotřeba
LowKlasifikace, rychlé dotazy, „stačí dost dobře a rychle".nejnižší
MediumVyvážená volba pro běžnou práci.střední
HighSložitější uvažování, kde kvalita je důležitější než rychlost.vyšší
xhigh / maxNejnáročnější úlohy bez ohledu na cenu (kód, těžké rozbory).nejvyšší
Pozor na příliš nízký effort. Umí kvalitu srazit víc, než byste čekali — projeví se to ve všem: méně kroků, méně vysvětlení, u kódu méně komentářů. U složité úlohy je proto lepší zvednout effort, než to obcházet chytrými prompty.

4b · Praktické pravidlo

~3 min
✗ Effort natvrdo na max

Necháte max na všechno, i na „přepiš tuhle větu". Limit mizí zbytečně rychle.

Platíte za hloubku i tam, kde stačí pár tokenů.
✓ Effort podle úkolu

Běžná práce na medium, složité věci na high, max jen výjimečně.

Drtina práce zvládne medium — a vy ušetříte výrazně.
Kvíz

Co dělá nastavení „effort"?

5 Modul 5 · Vyzkoušejte ⏱️ 8 min

Kalkulačka spotřeby — osahejte si to

Teď si to spojíme. Posuňte si délku zadání, vyberte model a effort a sledujte, jak se mění odhadovaná spotřeba. Čísla jsou orientační — slouží k pochopení poměrů, ne k přesnému účtování.

🧮 Odhad spotřeby

Odhadovaná spotřeba na jednu odpověď
— tokenů
Cvičení: nastavte stejné zadání nejdřív na Lehký + Low, pak na Silný + Max. Rozdíl ve spotřebě bývá několikanásobný — u krátkých dotazů s těžkým přemýšlením i přes desetinásobek. Přesně tady se rozhoduje, jak rychle narazíte na limit.

5a · Kolik tokenů vlastně mám?

~3 min

Aby ta čísla dávala smysl, je dobré vědět, s čím hospodaříte. Předplatným si nekupujete pevný balík tokenů na měsíc, ale kapacitu na časové okno, která se průběžně obnovuje. U Claude jde o klouzavé 5hodinové okno — kolik se do něj vejde, závisí na plánu:

Plán ClaudeOrientačně na 5h oknoPro koho
Pro~ 44 000 tokenůBěžné denní použití.
Max 5×~ 88 000 tokenůIntenzivnější práce, víc sezení denně.
Max 20×~ 220 000 tokenůNáročné projekty, dlouhé agentní úlohy.
Čísla berte orientačně. Anthropic dnes limity neudává v pevných tokenech, ale relativně — reálná kapacita kolísá podle modelu, délky konverzace, příloh a vytížení serverů. Uvedené hodnoty vycházejí z měření komunity, ne z oficiálních pevných limitů. Navíc nad 5hodinovým oknem běží ještě týdenní strop (modul 7). Porovnejte si výše spočítanou spotřebu s těmito čísly: u plánu Pro vám jedna těžká odpověď (Silný + Max) ukrojí znatelný kus celého okna.
6 Modul 6 · Klíčový ⏱️ 12 min

Chytré strategie úspory

Teď to nejdůležitější — jak všechno spojit dohromady. Dvě hlavní strategie vám ušetří nejvíc: kombinace modelů a správné nastavení effortu.

6a · Slabší model na rozbor, silný na finále

~5 min

Nabízí se otázka: pustit rovnou nejsilnější model, nebo kombinovat? Odpověď: kombinace se vyplatí, ale ne vždy. Funguje to takhle:

✓ Kombinace se vyplatí

Úloha jde rozdělit na „nasbírej a naskládej" (levné) a „rozhodni a zkontroluj" (drahé).

Hrubou objemovou práci odbavíte levně, drahý výpočet platíte jen za to podstatné.
✗ Kombinace nepomůže

Úloha je monoliticky složitá — i rozbor vyžaduje hloubku (těžká matematika, návrh architektury, bezpečnostní analýza).

Slabší model udělá rozbor, který silný stejně celý přepracuje — zaplatíte dvakrát.
Pravidlo: čím líp jde úloha rozdělit na sběr a rozhodnutí, tím víc se kombinace vyplatí. Čím je monoliticky složitá, tím spíš jeďte rovnou silný model s vyšším effortem. A logicky: slabšímu modelu na rozbor stačí medium, silnému na kontrolu dejte high — dvojitá úspora.

6b · Reálné scénáře (rozklikněte)

~4 min
📝 Dlouhý článek nebo report +

Situace: Píšete delší text — potřebujete rešerši, strukturu i finální vychytání.

Slabší model na sběr podkladů a první draft (hodně textu, nízká cena). Pak přepnete na silný model: „Projdi tento draft, najdi slabá místa v argumentaci a navrhni úpravy." Drahý výpočet padne jen na to, co ho potřebuje.

💻 Ladění kódu +

Situace: Máte chybu, kterou nevidíte.

U netriviálních chyb se kombinace často nevyplatí — rozbor i řešení vyžadují hloubku. Jeďte rovnou silný model s vysokým effortem (nebo „max" u čistě kódových úloh). Naopak rutinní úpravy a formátování klidně na lehkém modelu.

📨 Hromada krátkých úkolů +

Situace: Deset přepisů, překladů nebo krátkých odpovědí.

Tady silný model jen plýtvá. Lehký model + low effort odbaví celou dávku za zlomek spotřeby a kvalita je u takhle jednoduchých úkolů srovnatelná.

Kvíz

Kdy se NEvyplatí rozbor na slabším modelu a finále na silném?

7 Modul 7 ⏱️ 8 min

Reset limitů a plánování v čase

Druhá velká úspora není o tom, co spustíte, ale kdy. Vyplatí se pochopit, jak se limit obnovuje — pak se kolem něj dá naplánovat náročná práce.

7a · Jak reset funguje

~3 min

U většiny dnešních předplatných (Claude, ChatGPT) nejde o pevný reset o půlnoci. Krátkodobý limit běží typicky v klouzavém okně (u Claude pětihodinovém) navázaném na vaši první zprávu. Posouvá se s časem: počítá se spotřeba za posledních pět hodin, takže co jste spotřebovali třeba v 9:00, se vám uvolní zase ve 14:00. U Claude k tomu běží i týdenní strop v klouzavém 7denním okně, taky navázaný na první zprávu cyklu, ne na pondělní půlnoc.

Jedna peněženka pro všechno. U Claude se z jednoho limitu čerpá konverzace ve webu, desktop aplikace, Claude Code i další nástroje pod stejným účtem. Placené API přes klíč se obvykle účtuje zvlášť (konkrétní pravidla se ale čas od času mění, ověřte si je v nastavení účtu).

7b · Strategie „ráno zadám, večer dokončím"

~3 min

Tahle strategie se hodí každému, kdo přes den pracuje a osobní AI u toho nepotřebuje:

⏰ Rozvržení dne

Jak rozložit náročnou práci

  1. Ráno (třeba u snídaně) zadáte náročnou dávku a klidně spotřebujete velkou část okna — silný model s vysokým effortem na to, co potřebuje hloubku.
  2. Přes den AI nepoužíváte — klouzavé okno se mezitím obnoví.
  3. Po návratu domů máte limit zase k dispozici a práci dokončíte, zkontrolujete, doladíte. Claude i ostatní agenti přitom navážou tam, kde skončili — stačí pokračovat ve stejné konverzaci.
Háček: funguje to jen, dokud nenarazíte na týdenní strop. Proto sledujte ukazatel spotřeby — kdo je ve středu na 70 % týdenního limitu, má problém s plánováním, ne s denním oknem.
Sledujte ukazatel spotřeby před začátkem velké úlohy, ne až když narazíte na zeď. Reálná čísla a čas resetu, která vidíte přímo v aplikaci, jsou spolehlivější než jakýkoliv odhad.
Kvíz

Kdy se u Claude obnoví krátkodobý limit?

8 Kuchařka ⏱️ k vracení

Taháky a řešení potíží

Tahle část je vaše rychlá kuchařka — vracejte se sem. Hotové návyky na úsporu, šablony k okopírování a tabulka, co dělat, když narazíte na limit.

8a · Návyky, které šetří limit (rozklikněte)

tahák
🧹 Práce s konverzací+
Začínejte nové vlákno na nové téma:

Skončili jste téma? Otevřete čistý chat. Model pak nečte zbytečnou historii a každá zpráva je levná — navíc se líp soustředí.

Nenahrávejte zbytečně velké soubory:

Pokud z dlouhého PDF potřebujete jen kousek, vytáhněte relevantní část. Celý dokument se počítá při každém kole konverzace.

⚙️ Model a effort+
Default effort přepínejte podle úkolu:

Nenechávejte ho natvrdo na max. Drtina práce zvládne medium; max jen na opravdu náročné věci.

Slabší model na objem, silný na finále:

Když jde úloha rozdělit, nechte hrubou práci na lehkém modelu a jen kontrolu na silném.

Plánování v čase+
Náročné dávky na začátek okna:

Plánujte je na začátek klouzavého okna, ne na konec, kdy už je skoro plné.

Sledujte ukazatel spotřeby:

Před velkou úlohou mrkněte na stránku se spotřebou. Hlídejte hlavně týdenní strop.

8b · Šablona: nechte AI šetřit za vás

kopírovat

Když chcete u delší práce držet spotřebu nízko, vložte na začátek konverzace tuhle hlavičku. AI pak nebude plýtvat na zbytečné úvody a rozbory:

Pracuj úsporně a věcně: - Odpovídej rovnou, bez dlouhých úvodů a shrnutí toho, co jsem napsal. - Když je úkol jednoduchý, nepřemýšlej nahlas a dej krátkou odpověď. - U složitější věci se nejdřív zeptej, jestli mám doplnit kontext, ať to netrefuješ naslepo. - Drž se přesně toho, na co se ptám, nerozšiřuj zadání sám. Potvrď jednou větou a počkej na můj dotaz.

8c · Když narazíte na limit (řešení potíží)

tahák
🚫 Došel mi limit uprostřed práce
Zkontrolujte stránku se spotřebou — uvidíte přesný čas resetu. Okno se posouvá s časem: co jste spotřebovali například v 9:00, se vám uvolní zase ve 14:00. Nemusíte tedy čekat na konec dne, ale na chvíli, kdy vaše dřívější spotřeba „zestárne" o pět hodin.
😵 Limit mizí rychleji než dřív
Zkontrolujte délku vláken a effort. Dlouhá konverzace + max na všechno je nejčastější příčina.
📎 Velká příloha = rychlý úbytek
Vytáhněte z dokumentu jen relevantní část. Celá příloha se čte při každém kole znovu.
🐢 Odpovědi jsou pomalé
Snižte effort. Low nebo medium je u běžných úkolů rychlejší a kvalita stačí.
🤔 Nevím, jestli mám na úkol limit
Mrkněte na ukazatel spotřeby před startem. Hlídejte hlavně týdenní strop, ne jen denní okno.
⏸️ Limit došel uprostřed rozdělané práce
Nevadí — Claude (a nejspíš i další AI agenti) dokáže navázat tam, kde skončil. Po obnovení okna pokračujte ve stejné konverzaci nebo mu řekněte „pokračuj, kde jsi přestal". Kontext zůstává zachovaný.
Zlaté pravidlo úspory: platit za výkon jen tam, kde se vyplatí. Slabší model + nižší effort + krátká vlákna = většina práce za zlomek spotřeby. Silný model a vysoký effort si schovejte na to, co opravdu rozhoduje.
Závěr ⏱️ 3 min

Shrnutí a co dál

Hotovo — prošli jste celým kurzem. Shrnutí do jedné věty: tokeny jsou jednotky práce a vy rozhodujete, kolik jich utratíte. Když víte, kde se spotřebuje nejvíc — dlouhá vlákna, silný model, vysoký effort — a platíte za výkon jen tam, kde se vyplatí, natáhnete předplatné limity překvapivě daleko.

✅ Závěrečný checklist — odškrtejte si

Užitečné odkazy

Začněte jednou změnou. Příští týden zkuste jediné: přepínejte model a effort podle úkolu místo „pořád to nejsilnější". Sami uvidíte, o kolik dál vám limit vydrží. A když si nebudete vědět rady, vraťte se do Kuchařky.

🌱 Poslední otázka na závěr

  • Která jedna věc z tohoto kurzu vám podle vás ušetří nejvíc limitu — a vyzkoušíte ji už tento týden?

Tento kurz je zdarma

Pokud vám pomohl a chcete podpořit jeho tvorbu, můžete nakupovat na Alze přes tento odkaz — nic vás to navíc nestojí a nám to pomůže.

Jde o affiliate odkaz, z nákupu nám náleží malá provize.