Propaganda už dávno není jen plakát a patetický projev. Dnes běží v memech, krátkých videích a nenápadných „otázkách“ pod posty. A právě tady ChatGPT mění hru: zvládá kontext, emoce i multimodální signály. Není to kouzelná hůlka. Ale když ho zapojíte do promyšleného workflow, ušetří dny ruční práce, zvedne kvalitu a dá vašemu týmu náskok. V tomhle textu ukážu, co se reálně změnilo v roce 2025, jak ten systém postavit, co měřit, na čem to padá a jak to dělat bezpečně v češtině. Sedím v Plzni, zrovna prší, a to je ideální čas dát dohromady funkční návod bez teorie navíc.

TL;DR a přehled: co přesně se změnilo a proč to řešit teď

detekce propagandy se od roku 2023 posunula z klíčových slov k sémantice a kontextu. ChatGPT vám dovolí označit sporný obsah podle rétorických technik (apel na strach, „jen se ptám“, bandwagon), rozlišit satiru od manipulace a propojit text s obrazem a metadaty. Ale dává smysl jen jako součást procesu s lidmi v posledním kroku. Tady je stručný souhrn:

  • Co se změnilo: z keyword filtrů na sémantickou klasifikaci, z jednoho modelu na orchestraci (text, vizuál, provenience), z „blokuj“ na „triážuj“.
  • Co od toho čekat: 60-85 % přesnost u krátkých textů out-of-the-box, až 90 % s adaptací na doménu a jazyk, výrazné snížení času na analýzu (typicky 3-5×).
  • Kde to selže: satira, ironie, lokální slang, nově vzniklé kódy a memy, vysoce kontextové narážky, koordinované „nenápadné“ kampaně.
  • Co potřebujete: jasnou taxonomii technik, malý ale kvalitní vzorek ručně značených dat, promyšlené prompty, kontrolu kvality, auditní stopu a lidský dohled.
  • Proč teď: tlak na transparentnost (DSA v EU), příchod standardů provenience (C2PA), a dostupné multimodální modely, které zvládnou text+obraz v jednom běhu.

Jaké „joby“ chcete pravděpodobně splnit po kliknutí na tenhle titulek? Z praxe vychází šestička:

  • Postavit funkční pipeline, která z příspěvků dělá rozhodnutí „zvýraznit/poslat ke kontrole/odložit“.
  • Najít vhodnou taxonomii technik propagandy a sladit tým na definicích.
  • Nastavit prompty, prahy a metriky tak, aby to bylo přesné a škálovatelné.
  • Vyřešit multimodál - memy, screenshoty, titulky videí - a provázat to s proveniencí obsahu.
  • Ošetřit rizika: falešné poplachy, satira, bias, náklady, GDPR a audit.
  • Mít konkrétní příklady, checklisty a kroky „co zítra spustit“.

Pro důvěryhodnost pár pevných opěrných bodů, které tenhle návod drží při zemi: rámec řízení rizik NIST AI RMF (2023), povinnosti transparentnosti pro VLOPs v EU podle DSA (od 2024), přijatý AI Act (2024) s náběhem povinností do 2026, standard C2PA pro obsahovou provenienci (verze 2024), metodiky NATO StratCom COE k taktikám informačních operací (2023) a klasická taxonomie Institute for Propaganda Analysis (1937). OpenAI od 2024 nabízí specializovaný „moderation“ endpoint; ChatGPT (multimodální) zvládá i OCR a popisy vizuálu. V Česku můžete narazit na specifika: slovní kódování, diakritické obraty, směs češtiny a slovenštiny, i lokální narativy mapované CTHH a NÚKIB.

Postup krok za krokem: od dat k rozhodnutí (pipeline, prompty, metriky)

Postup krok za krokem: od dat k rozhodnutí (pipeline, prompty, metriky)

Tady je praktický postup, který nasadíte v redakci, na platformě nebo v brand safety týmu. Rozkouskovaný na malé, kontrolovatelné kroky.

1) Ujasněte si, co vlastně označujete

  • Definice: Propaganda není každý ostrý názor. Pracujte s rétorickými technikami: apel na strach, bandwagon ("všichni přece..."), card stacking (vybíravé argumenty), transfer (přiřazení negativní/pozitivní aury), testimonial (neoprávněná autorita), name-calling, JAQing off ("jen se ptám").
  • Taxonomie: Začněte jednoduchým jádrem (7-10 technik). Pro praxi je dobré kombinovat IPA (1937) s moderními rámci tzv. 4D (Dismiss, Distort, Distract, Dismay - Ben Nimmo) a doplnit lokální prvky (např. „odstřižené kořeny“ - pseudo-historické generalizace).
  • Rozlišení: „Propaganda“ vs „legitimní přesvědčování“ vs „satira“. Uveďte příklady pro každý typ, ať tým ladí shodu.

2) Posbírejte malý, ale kvalitní vzorek

  • Stačí 500-2 000 příkladů pro prvotní kalibraci. Mix: texty (komentáře, titulky, články), obrázky s textem (memy), screenshoty.
  • Jazyky a styl: Čeština se skloňuje a ohýbá - zahrňte varianty s/bez diakritiky, slang, emotikony, kódová slova.
  • Labeling: 2-3 nezávislí anotátoři. Cílte na Cohenovu kappu ≥ 0,6. Spory řešte konsenzem s příklady „hran“.
  • Ochrana dat: anonymizujte osobní údaje, držte se zásad minimalizace (GDPR). Sudá čísla ticketů = osobní obsah posílat až po pseudonymizaci.

3) Vytvořte prompty, které vracejí konzistentní strukturu

  • System role: Stručně vymezte, co je cílem (identifikace technik propagandy, ne posuzování pravdivosti světa), jazyk (čeština), a požadovanou strukturu výstupu.
  • Output: JSON pole typu: {"label": [„propaganda“, „persuasion“, „satire“, „neutral"], "techniques": [..], "emotions": [..], "certainty": 0-1, "rationale": 1-2 věty, "route": [„human_review“ | „auto_flag“ | „ignore"]}.
  • Bez „magie“: Nepotřebujete dlouhé prompt romány. Důležitější je pár ostrých příkladů v češtině (2-4 na techniku) a negativní příklady (co je jen názor nebo humor).
  • Kalibrace: Požádejte o „certainty“ a hlavně o „route“. V integraci pak přepište „route“ na akci podle prahů.

4) Vrstvěte signály: text, obraz, provenience

  • Text: Klasifikace příspěvku + kontext vlákna (posledních 5-10 zpráv). Kontext často převrátí význam.
  • Obraz: Použijte multimodální analýzu. OCR textu z obrázku + popis vizuálních prvků (symboly, vlajky, vodoznaky).
  • Provenience: Zkontrolujte C2PA podpisy, metadata a historii editací. Když je asset důvěryhodně podepsaný (zpravodajství), použijte mírnější prahy.
  • Zdroj účtu: Nové anonymní účty + vysoká kadence + opakující se narativ = zvýšit skóre rizika (ale ne brát jako důkaz samo o sobě).

5) Nastavte prahy, metriky a učení z provozu

  • Primární metriky: F1 a PR-AUC (v nevyvážených datech lepší než ROC-AUC). Sledujte falešně pozitivní pro satiru a legitimní kritiku.
  • Prahy: Začněte třemi zónami - vysoká jistota (≥ 0,8) = auto-flag; střed (0,4-0,79) = human review; nízká (< 0,4) = ignorovat s logem.
  • Režimy: „High-precision“ (pro tvrdé zásahy, např. reklamy) vs „High-recall“ (monitoring kampaní). Přepínejte podle použití.
  • Kalibrace: Self-consistency - 3-5 běhů s drobnou variací promptu a majority vote. Stabilizujete výstup bez trénování vlastního modelu.
  • Drift: Každý měsíc přírůstek 200-500 ručních anotací z horkých témat. Přeučte pravidla/ukázky, ať držíte krok s novým slangem.

6) Integrace do nástrojů a týmu

  • Triáž: Fronta s prioritami, SLA 2-5 minut pro střední riziko, 30 sekund pro exploity (spam vlny). Notifikace přes Slack/Teams.
  • UX pro editory: Jedno kliknutí na „satira“, „legitimní kritika“, „manipulativní apel“ a okamžitý feedback zpět do systému.
  • Audit: Logujte vstup, výstup, verze promptu, čas, rozhodnutí člověka. V DSA auditech vám to zachrání nervy.

7) Bezpečnost, bias a právo

  • Bias: Testujte napříč skupinami a tématy. Slepé testy s anotátory. Když model tvrději „trestá“ určitý názorový proud, vracejte se k definicím technik.
  • GDPR: Minimalizace, pseudonymizace, retenční limit (např. 90 dní), přístup jen pro roli. Udělejte si ROPA a DPIA - zabere to den, ale máte klid.
  • Zodpovědnost: Nechte poslední slovo člověku u zásahů s dopadem. Dejte dohromady rychlé odvolání/appeal (i interně).
  • Standardy: Oporu máte v NIST AI RMF, DSA transparentnosti a v interních pravidlech platformy. Pro multimédia využívejte C2PA.

Rozhodovací mini-strom

  • Je obsah multimodální (obraz+text)? Ano → OCR + multimodální analýza + C2PA check. Ne → textová analýza + kontext vlákna.
  • Jistota >= 0,8 a obsah používá vysoce škodlivé techniky (apel na násilí)? → Auto-flag + lidské potvrzení do 30 s.
  • Jistota 0,4-0,79 nebo téma s vysokým reputačním rizikem (volby, zdraví)? → Human review v prioritní frontě.
  • Satira signály (známé satirické účty, ironické značky)? → Nižší váha, ruční ověření.

Heuristiky z terénu

  • Směs emodži a interpunkce (!!!), generické nepřátelské skupiny („oni“, „tamhleti“), a katastrofický framing často zvedá riziko o 0,1-0,2.
  • „Jen se ptám“ + sugestivní spojka („protože všichni víme, že…“) je slabá maskovací technika - přidejte pravidlo pro JAQing off.
  • Recyklované memy s novým textem? Dejte hash vizuálu a udržujte reputační databázi šablon.

Checklist k nasazení (rychlá kontrola před startem)

  • Máme taxonomii (max 10 technik) s příklady ANO/NE?
  • Máme 500-2 000 anotovaných vzorků a kappu ≥ 0,6?
  • Máme prompty se strukturovaným výstupem a 2-4 ukázkami na techniku?
  • Nastavené prahy a režimy (precision vs recall) podle použití?
  • Logování, auditní stopa, retenční politika a DPIA hotové?
  • Escalation playbook pro citlivé případy a apel/odvolání?
Příklady z praxe, vzorce a pasti + mini‑FAQ a další kroky

Příklady z praxe, vzorce a pasti + mini‑FAQ a další kroky

Žádná metoda není lepší než její hranové případy. Tady jsou reálné vzorce, co v češtině potkávám nejčastěji, a jak je ChatGPT chytá.

Příklad 1: „Strach + generalizace“ (text)

„Jestli tohle projde, zakážou nám mluvit a zavedou body jako v Číně. Všichni, kdo mlčí, jsou součástí plánu.“

  • Techniky: apel na strach, bandwagon („všichni“), card stacking (bez faktů), transfer (strašák Čína).
  • Co dělá ChatGPT dobře: pozná emocionální eskalaci, šablonovité srovnání, chybějící oporu.
  • Na co pozor: kdyby byl přidaný legitimní odkaz na regulaci, potřeba přepnout do human review.

Příklad 2: „Jen se ptám“ (komentář)

„Nesnažím se nikoho přesvědčovat, jen se ptám, proč mají ‚oni‘ vždycky prospěch, když se stane XY?“

  • Techniky: JAQing off, nejasný nepřítel („oni“), náznak konspirace bez důkazů.
  • Model: spolehlivě klasifikuje jako manipulativní dotaz ve střední jistotě (0,5-0,7).
  • Akce: human review, protože některé investigativní dotazy mohou vypadat podobně.

Příklad 3: Meme (obraz + text)

Obrázek: dav s transparenty, přes to nápis CAPS: „PROBER SE, OVCE!“. V rohu logo neznámé stránky.

  • Techniky: name-calling („ovce“), dehumanizace, bandwagon („prober se“ jako tlak).
  • Multimodál: OCR vytáhne text, vizuál přidá signál nátlaku. C2PA chybí → žádná důvěryhodnost.
  • Akce: střední až vysoké riziko, pro brand safety auto-flag, pro otevřené diskuse human review.

Příklad 4: Satira (parodie)

„Vládní plán na kontrolu počasí: deštníky zdarma, ale jen v pondělí.“ Publikováno známým satirickým účtem.

  • Techniky: ironie a satira. Ne propaganda.
  • Model: někdy označí jako „nesmysl“, ale bez škodlivé manipulace. Zdroje a kontext účtu snižují jistotu zásahu.
  • Pravidlo: whitelisting ověřených satirických kanálů + vizuální značení humoru.

Co se kazí nejčastěji

  • Satira jako propaganda: řešení - whitelists, kontext účtu, kontrola tónu.
  • Přenos do jiné domény: model fungoval na covidu, selže u energetiky. Řešení - průběžné vzorkování a přiučení na nových tématech.
  • Emoji a kódové fráze: „🌙“ místo slova, interní narážky. Řešení - udržovat katalog kódů a memů, využít komunitní repozitář.
  • Screenshoty textu: bez OCR model nevidí nic. Řešení - povinný OCR krok.
  • Hallucinace v „rationale“: model si někdy domyslí kontext. Řešení - omezit délku rationale, nevázat rozhodnutí jen na vysvětlení.

Jak měřit, že to fakt pomáhá

  • První měsíc: baseline bez modelu - kolik kusů/čas/zásahy. Druhý měsíc: s modelem - srovnání F1, false positives na satiru, průměrný čas na kus.
  • Business metrika: o kolik dřív zachytíte vlnu (čas od prvního výskytu do alertu), kolik šetříte času editorů (člověkohodiny).
  • Reputační metrika: pokles eskalací od uživatelů, počet úspěšných odvolání (chcete málo, ale ne nulu).

Mini‑FAQ

  • Umí to automaticky mazat? - Může, ale nedoporučuju bez lidské validace. Pro tvrdé zásahy je bezpečnější režim high‑precision + human‑in‑the‑loop.
  • Co multimodální obsah? - Analyzujte obraz+text v jednom kroku a přidejte C2PA/metadata. Bez OCR vám projde půlka memů.
  • Jak na více jazyků? - Per‑jazykové prompty + malé lokální datasety. Češtinu a slovenštinu dejte do jednoho režimu s rozlišením diakritiky.
  • Co s GDPR? - Minimalizovat, pseudonymizovat, krátká retenční doba, DPIA. Logujte jen nezbytné.
  • Nevytváří to bias? - Testujte A/B na vyvážených vzorcích, dělejte slepé re‑labely. Když bias najdete, upravte definice a příklady v promptu.
  • Nepotřebuju vlastní model? - Většinou ne. Orchestrace + dobré prompty + průběžné učení z anotací dá 80-90 % toho, co chcete.

Další kroky podle typu týmu

  • Malá redakce: Začněte s monitoringem a triáží. 1 den na nastavení promptů, 1 týden na sběr 500 vzorků. Integrujte do Slacku a tabulky s přehledem.
  • Platforma/SaaS: API orchestrátor (fronta, retry, caching), režimy precision/recall, dynamické prahy, samostatná fronta pro multimédia.
  • Brand safety: Přísnější prahy, whitelist satiry, černá listina repetitivních šablon memů, reporty pro klienty s vysvětlením bez žargonu.
  • NGO/fact‑checking: Zachycení vln, timeline narativů, graf opakovaných tvrzení. Využijte RAG s lokálním korpusem fact‑checků (EDMO, Demagog.cz).

„Kuchařka“ promptu (co má obsahovat)

  • Cíl: „Identifikuj manipulační techniky a rozlišení propaganda/persuasion/satire/neutral. Bez hodnocení pravdy světa.“
  • Jazyk: „Čeština, krátké odpovědi, JSON.“
  • Kontext: „Zvaž i posledních X zpráv, pokud jsou.“
  • Výstup: label, techniques, emotions, certainty, rationale (max 2 věty), route.
  • Příklady: 2-4 pozitivní (apel na strach, JAQing off) a 2-4 negativní (satira, legitimní kritika).

Taktické tipy na náklady a rychlost

  • Caching: Identické vstupy = reuse výstupu 24-72 h.
  • Batching: Sloučit komentáře z vlákna, ale nenechte to přesáhnout 1-2 odstavce na kus.
  • „Gating“: Nejprve lehký filtr (toxicity/spam), až pak detailní propaganda analýza.
  • Self‑consistency jen u střední zóny - jinak pálíte kredit.

K čemu se odkazovat, když potřebujete autoritu

  • NIST AI Risk Management Framework (2023) - jak řídit rizika a dokumentovat.
  • EU Digital Services Act (od 2024) - povinné procesy pro velké platformy, transparentní moderace.
  • EU AI Act (2024) - zásady pro vysoce rizikové systémy a dokumentace; už teď se vyplatí držet principů.
  • NATO StratCom COE (2023) - katalog taktik informačních operací.
  • Institute for Propaganda Analysis (1937) - klasická typologie, stále užitečná v praxi.
  • C2PA (2024) - standard pro digitální podpisy obsahu a historii editací.

Troubleshooting

  • Falešně pozitivní na satiru: Přidejte negativní příklady satiry do promptu, whitelists, nižší váha u ověřených účtů.
  • Model „zjemňuje“ posudky: Zkraťte rationale, žádejte explicitní „techniques“ a „route“. Přidejte tvrdé příklady.
  • Velké téma se náhle kazí: Přidat 100-200 nových anotací, aktualizovat příklady, na týden zpřísnit human review.
  • Náklady stoupají: Gating, caching, batch, self‑consistency jen u střední zóny. Omezte délku vstupu.
  • Memy unikají: Povinné OCR, reputační hash šablon, vizuální klíčová slova v promptu (symboly, vlajky, slogany).

Krátký „den v provozu“ (reálný rytmus)

  • Ráno: Výstup z noční fronty - 20 položek středního rizika k ruční kontrole, trendy narativů, 3 nové šablony memů do katalogu.
  • Dopoledne: Úprava prahů kvůli vlně v diskusi o energiích; přidání 30 příkladů do promptu.
  • Odpoledne: Meeting s právníkem - kontrola DPIA a apel/odvolání procesů. Krátké školení pro nové editory.
  • Večer: Report - F1, počet zásahů, čas ušetřený na kus, 3 případy, kde rozhodl člověk jinak než model → zpětná vazba do datasetu.

ChatGPT neodstraní dilemata. Ale dá vám čas na to důležité: kde vede hranice mezi ostrou debatou a manipulací, a jak to obhájit veřejně i před auditem. V Plzni to řešíme se stejnými nástrahami jako kdokoli jinde: memy mění tvář, kódová slova se rodí přes noc a dobrá satira vypadá „podezřele“. Rozdíl dělá disciplína v procesech a to, že si stojíte za definicemi. Zbytek už je řemeslo.