Platíte za AI předplatné a pořád narážíte na „dosáhli jste limitu"? Nebo vás zajímá, proč jedna konverzace ubere víc než druhá? Tenhle kurz vás naučí, jak to celé funguje — co je token, kde se spotřebovává nejvíc, čím se liší silný a slabý model, k čemu je nastavení „effort" a jak chytře rozložit práci. Z jednoho předplatného tak dostanete klidně dvojnásobek užitku.
Každá AI služba má svůj limit — kolik toho zvládnete za hodinu, den nebo týden. Ten limit se neměří v počtu zpráv, ale v tokenech. Když pochopíte, co token je a kde se ho spotřebuje nejvíc, přestanete narážet na zeď uprostřed práce a z jednoho předplatného vytěžíte mnohem víc.
Tenhle kurz není o teorii. Je o tom, jak prakticky šetřit: kdy stačí slabší model, k čemu je nastavení „effort", jak rozdělit úkol mezi dva modely a jak rozvrhnout náročnou práci podle toho, kdy se vám limit obnoví.
Pro koho to je: pro ty, kdo už AI běžně používají a chtějí z předplatného (Claude, ChatGPT a podobně) dostat maximum. Základy promptování tu nepotřebujete — máme na ně samostatný kurz.
Token je nejmenší kousek textu, se kterým jazykový model pracuje. Není to ani písmeno, ani celé slovo — je to něco mezi. Krátké běžné slovo se vejde do jednoho tokenu, delší nebo méně časté se rozpadne na dva i tři kousky.
Podívejte se, jak se na tokeny rozpadne jednoduchá anglická věta. Každý barevný blok je jeden token:
„programming" se rozpadlo na tři tokeny, „I" a „love" jsou po jednom.
U češtiny s diakritikou a delšími tvary je dělení hustší — stejně dlouhý text v češtině sní zpravidla víc tokenů než v angličtině:
Stejný význam, ale víc tokenů. Proto je práce v češtině na limit o něco náročnější.
Model nečte text po písmenech ani po slovech — čte ho po tokenech a předpovídá, jaký token nejspíš přijde další. Tokeny jsou tedy zároveň měrná jednotka práce: kolik jich model přečte na vstupu a kolik vytvoří na výstupu, podle toho se počítá spotřeba i cena.
Proto se v ceníku API platí „za milion tokenů" a proto se i vaše předplatné vyčerpává podle tokenů, ne podle počtu odeslaných zpráv.
Co je token?
Tady většina lidí podceňuje realitu. Spotřebovává se totiž vstup i výstup — nejen to, co AI napíše, ale i celý text, který do ní pošlete. A to nejdůležitější: při každé nové zprávě si model znovu načítá celou historii konverzace, aby udržel kontext.
Krátká otázka vs. rozbor dlouhého dokumentu.
„Kolik je hodin?" × analýza smlouvyNahrané soubory, dlouhá historie, obrázky.
počítá se při každém kole znovuSilnější (Opus) spotřebuje víc než lehčí (Sonnet).
modul 3Kolik model „přemýšlí", než odpoví.
modul 4Představte si konverzaci jako sněhovou kouli. S každou zprávou se nabaluje historie, kterou model musí pokaždé celou přečíst:
50 zpráv v jediném chatu, každá další čte historii všech předchozích → spotřeba roste s každým kolem.
Skončili jste téma? Začněte čistý chat. Model nečte zbytečnou historii a každá zpráva je levná.
Proč krátké „děkuji" na konci dlouhé konverzace stojí víc tokenů, než byste čekali?
Většina služeb nabízí víc modelů — od lehkých a rychlých po silné a důkladné. Liší se výpočetní náročností, a tím i spotřebou. U Claude jsou to třeba Haiku (nejlehčí), Sonnet (vyvážený) a Opus (nejsilnější); u jiných služeb to funguje obdobně.
Rychlý a nejlevnější. Na jednoduché a hromadné úkoly. Na co: rychlé odpovědi, přepisy, klasifikace.
Dobrý poměr výkon/cena. Zvládne většinu běžné práce. Na co: rozbory, koncepty, běžné psaní.
Nejhlubší uvažování, nejvyšší spotřeba. Na co: složité úlohy, finální kontrola, těžké ladění.
| Úkol | Doporučený model | Proč |
|---|---|---|
| Přepis, překlad, shrnutí | Lehký | Mechanická práce, nepotřebuje hloubku. |
| Běžné psaní, rozbor, koncept | Vyvážený | Dobrý poměr kvalita/spotřeba. |
| Složitá analýza, návrh, ladění | Silný | Vyplatí se zaplatit za přesnost. |
| Finální kontrola výstupu | Silný | Odhalí chyby, které slabší přehlédne. |
Potřebujete přeložit deset krátkých e-mailů. Který model zvolíte?
Tohle je nejpodceňovanější přepínač posledního roku. Vedle volby modelu se objevil parametr effort — kolik „přemýšlení" má model do odpovědi vložit, než začne psát. U Claude jsou dnes typicky úrovně low, medium, high, xhigh a max (ne každý model podporuje všechny). Princip je u všech služeb stejný: vyšší effort = lepší odpovědi, ale pomalejší a větší spotřeba limitu.
| Úroveň | Na co | Spotřeba |
|---|---|---|
| Low | Klasifikace, rychlé dotazy, „stačí dost dobře a rychle". | nejnižší |
| Medium | Vyvážená volba pro běžnou práci. | střední |
| High | Složitější uvažování, kde kvalita je důležitější než rychlost. | vyšší |
| xhigh / max | Nejnáročnější úlohy bez ohledu na cenu (kód, těžké rozbory). | nejvyšší |
Necháte max na všechno, i na „přepiš tuhle větu". Limit mizí zbytečně rychle.
Běžná práce na medium, složité věci na high, max jen výjimečně.
Co dělá nastavení „effort"?
Teď si to spojíme. Posuňte si délku zadání, vyberte model a effort a sledujte, jak se mění odhadovaná spotřeba. Čísla jsou orientační — slouží k pochopení poměrů, ne k přesnému účtování.
Aby ta čísla dávala smysl, je dobré vědět, s čím hospodaříte. Předplatným si nekupujete pevný balík tokenů na měsíc, ale kapacitu na časové okno, která se průběžně obnovuje. U Claude jde o klouzavé 5hodinové okno — kolik se do něj vejde, závisí na plánu:
| Plán Claude | Orientačně na 5h okno | Pro koho |
|---|---|---|
| Pro | ~ 44 000 tokenů | Běžné denní použití. |
| Max 5× | ~ 88 000 tokenů | Intenzivnější práce, víc sezení denně. |
| Max 20× | ~ 220 000 tokenů | Náročné projekty, dlouhé agentní úlohy. |
Teď to nejdůležitější — jak všechno spojit dohromady. Dvě hlavní strategie vám ušetří nejvíc: kombinace modelů a správné nastavení effortu.
Nabízí se otázka: pustit rovnou nejsilnější model, nebo kombinovat? Odpověď: kombinace se vyplatí, ale ne vždy. Funguje to takhle:
Úloha jde rozdělit na „nasbírej a naskládej" (levné) a „rozhodni a zkontroluj" (drahé).
Úloha je monoliticky složitá — i rozbor vyžaduje hloubku (těžká matematika, návrh architektury, bezpečnostní analýza).
Situace: Píšete delší text — potřebujete rešerši, strukturu i finální vychytání.
Slabší model na sběr podkladů a první draft (hodně textu, nízká cena). Pak přepnete na silný model: „Projdi tento draft, najdi slabá místa v argumentaci a navrhni úpravy." Drahý výpočet padne jen na to, co ho potřebuje.
Situace: Máte chybu, kterou nevidíte.
U netriviálních chyb se kombinace často nevyplatí — rozbor i řešení vyžadují hloubku. Jeďte rovnou silný model s vysokým effortem (nebo „max" u čistě kódových úloh). Naopak rutinní úpravy a formátování klidně na lehkém modelu.
Situace: Deset přepisů, překladů nebo krátkých odpovědí.
Tady silný model jen plýtvá. Lehký model + low effort odbaví celou dávku za zlomek spotřeby a kvalita je u takhle jednoduchých úkolů srovnatelná.
Kdy se NEvyplatí rozbor na slabším modelu a finále na silném?
Druhá velká úspora není o tom, co spustíte, ale kdy. Vyplatí se pochopit, jak se limit obnovuje — pak se kolem něj dá naplánovat náročná práce.
U většiny dnešních předplatných (Claude, ChatGPT) nejde o pevný reset o půlnoci. Krátkodobý limit běží typicky v klouzavém okně (u Claude pětihodinovém) navázaném na vaši první zprávu. Posouvá se s časem: počítá se spotřeba za posledních pět hodin, takže co jste spotřebovali třeba v 9:00, se vám uvolní zase ve 14:00. U Claude k tomu běží i týdenní strop v klouzavém 7denním okně, taky navázaný na první zprávu cyklu, ne na pondělní půlnoc.
Tahle strategie se hodí každému, kdo přes den pracuje a osobní AI u toho nepotřebuje:
Kdy se u Claude obnoví krátkodobý limit?
Tahle část je vaše rychlá kuchařka — vracejte se sem. Hotové návyky na úsporu, šablony k okopírování a tabulka, co dělat, když narazíte na limit.
Skončili jste téma? Otevřete čistý chat. Model pak nečte zbytečnou historii a každá zpráva je levná — navíc se líp soustředí.
Pokud z dlouhého PDF potřebujete jen kousek, vytáhněte relevantní část. Celý dokument se počítá při každém kole konverzace.
Nenechávejte ho natvrdo na max. Drtina práce zvládne medium; max jen na opravdu náročné věci.
Když jde úloha rozdělit, nechte hrubou práci na lehkém modelu a jen kontrolu na silném.
Plánujte je na začátek klouzavého okna, ne na konec, kdy už je skoro plné.
Před velkou úlohou mrkněte na stránku se spotřebou. Hlídejte hlavně týdenní strop.
Když chcete u delší práce držet spotřebu nízko, vložte na začátek konverzace tuhle hlavičku. AI pak nebude plýtvat na zbytečné úvody a rozbory:
max na všechno je nejčastější příčina.Low nebo medium je u běžných úkolů rychlejší a kvalita stačí.Hotovo — prošli jste celým kurzem. Shrnutí do jedné věty: tokeny jsou jednotky práce a vy rozhodujete, kolik jich utratíte. Když víte, kde se spotřebuje nejvíc — dlouhá vlákna, silný model, vysoký effort — a platíte za výkon jen tam, kde se vyplatí, natáhnete předplatné limity překvapivě daleko.
Pokud vám pomohl a chcete podpořit jeho tvorbu, můžete nakupovat na Alze přes tento odkaz — nic vás to navíc nestojí a nám to pomůže.
Jde o affiliate odkaz, z nákupu nám náleží malá provize.