Komunistou musí být i umělá inteligence. Jak Čína kontroluje jazykové modely?

Začátkem května čínská policie zadržela muže kvůli obvinění, že vytvořil a šířil falešnou zprávu. S pomocí ChatGPT napsal článek o nehodě vlaku, který si přečetlo asi 15 tisíc lidí. Jde o první případ zatčení, které souvisí s generováním obsahu jazykovými modely.

Tamní uživatelé nacházejí cesty, kterými můžou Velkou čínskou firewall obejít.

Pro Čínu představují vlakové havárie obzvlášť citlivé téma. V roce 2011 státní média čelila kritice, že dostatečně neinformovala o srážce dvou souprav blízko města Wen-Čou. Zemřelo tam více než 40 lidí.

Chatbot, vytvořený americkou společností OpenAI, Peking oficiálně zakázal. Přesto tamní uživatelé nacházejí cesty, kterými můžou Velkou čínskou firewall obejít. Primárně to dělají prostřednictvím VPN, zatímco vláda i režimní média upozorňují na potenciál šíření americké propagandy. Novináři z deníku China Daily ve videu vysvětlují, že odpovědi ChatGPT na otázky ohledně provincie Sin-ťiang reflektují oficiální stanoviska Washingtonu. V „autonomní oblasti“ přitom dochází k systematickému porušování lidských práv a útlaku (nejen) ujgurské menšiny. Režim to však vytrvale popírá.

Made in China

Omezený přístup k ChatGPT ještě neznamená, že se čínské společnosti nesnaží vyvíjet vlastní jazykové modely. Řada společností plánuje vytvořit podobné konverzační nástroje a následně je integrovat do svých produktů. Přestože se zdaleka nejedná o první pokusy, právě chatovací prostředí je významně přibližuje široké veřejnosti.

V březnu 2023 společnost Baidu představila Ernieho. Místo praktické ukázky jeho fungování ale ukázala jen krátká videa. Prezentace působila nepřesvědčivě a firmě výrazně poklesly akcie. První recenze naznačovaly, že Ernie nemůže konkurovat západním chatům. Přitom dokáže reagovat podobně jako aktuálně volně dostupná verze ChatGPT, jak odhalily pozdější analýz y. Na rozdíl od ní umí dokonce vytvářet obrázky. Momentálně k němu má přístup jen úzký okruh uživatelů, kteří ho testují.

Dalším dlouho očekávaným modelem je „Tongyi Qianwen“, což znamená „Pravda z tisíce otázek“. V květnu letošního roku ho spustila společnost Alibaba a chystá se ho postupně začleňovat, nejdřív do aplikace DingTalk pro podnikovou komunikaci. Tongyi Qianwen by během schůzky psal poznámky a e-maily. Přestože je v porovnání s ChatGPT úzce zaměřený, podle Alibaby by mohl popularizovat umělou inteligenci.

Kyberprostor à la Peking

Čínská komunistická strana spolu s prezidentem Si Ťin-pchingem dlouhodobě usiluje o regulaci algoritmů i umělé inteligence. Sloužit mají primárně jejich cílům, což zapadá do celkového konceptu kybernetické suverenity. Ta zdůrazňuje ústřední roli státu, který v rámci svých hranic řídí a kontroluje internet i data.

Specificky na jazykové modely se vztahuje nová legislativa. Čínští vývojáři podle ní nesou zodpovědnost jak za datasety použité k jejich vytrénování, tak za nevhodné odpovědi. Společnosti musí zajistit, aby sdělení vygenerované AI ztělesňoval o základní socialistické hodnoty. Nesmí vyjadřovat nic, co by podkopávalo státní moc nebo socialistický systém a podporovalo separatismus, terorismus nebo extremismus. Nemůže ani jinak oslabovat národní jednotu a narušovat hospodářský a společenský řád.

Čtěte také: Bodu, od kterého už umělá inteligence nepůjde vypnout, si ani nemusíme všimnout, říká Kulveit

Kromě politicky citlivého obsahu se strana snaží regulovat také morálku. Není možné, aby umělá inteligence podporovala diskriminaci nebo zobrazovala násilné či obscénní informace. Legislativa dále vyžaduje, aby data použitá k trénování modelu nezasahovala do duševního vlastnictví. Osobní informace může využívat jen se souhlasem.

Rychlý konec modelu ChatYuan od firmy Yuan Yu ukazuje, že „nepatřičné“ odpovědi žádná tolerance nečeká. Při dotazu na stav čínské ekonomiky vyjmenoval řadu problémů, s nimiž země zápolí. V případě války na Ukrajině označil za agresora Rusko, což neodpovídá oficiální rétorice Pekingu. Po třech dnech chat přestal fungovat.

AI musí odrážet postoje strany

Čínské společnosti mohou vytrénovat model na pečlivě zvoleném balíčku dat bez kontroverzních tvrzení. Vyvíjí se však dál, a když se připojí na internet, může reagovat nepředvídatelně. Kreativnější uživatelé navíc umí model zmást a u sporných témat obejít naučené fráze.

Na dotazy spojené s původem viru SARS-CoV-2 a politikou nulového covidu Ernie reaguje buď vyhýbavě, nebo vůbec.

K mnohem širší škále témat musí čínské chaty oproti těm západním zaujímat určité postoje. ChatGPT interaguje s lidmi a získává od nich zpětnou vazbu. Postupně se tak učí nakládat s choulostivými tématy a předsudky, například se společenskými stereotypy nebo diskriminací. Čínské modely se však potřebují naučit odpovídat na otázky, které podléhají cenzuře.

Na dotazy spojené s původem viru SARS-CoV-2 a politikou nulového covidu Ernie reaguje buď vyhýbavě, nebo vůbec. Zdrženlivě také hovoří o generálním tajemníkovi Si-Ťin-pchingovi a jeho politických krocích. Opatrnost se týká i medvídka Pú, ke kterému byl Si často připodobňován. V roce 2017 proto komunistická strana zakázala kresleného hrdinu zmiňovat na sociálních sítích a rozhodnutí vzali v potaz i tvůrci Ernieho.

Tamní legislativa také vyžaduje, aby chaty prošly bezpečnostním hodnocením, než budou k dispozici širší veřejnosti. V případě uživatelů musí provozovatelé ověřovat jejich identitu a poskytnout detaily ohledně rozsahu používaných dat. Loni vznikl registr algoritmů, který se původně vztahoval na sociální média. Ta totiž musí na základě zákona zveřejňovat algoritmické detaily včetně zobrazovaných doporučení. Schopnosti úředníků v této oblasti sice zůstávají nejasné, u jazykových modelů však může jít hlavně o kontrolu, jestli komunikují citlivá témata podle představ komunistické strany.

Protože čínské chatboty musí zrcadlit stranickou rétoriku, jejich vývoj se soustředí spíš na specifické oblasti než na vytvoření obecného modelu. Při využití v automobilovém průmyslu nebo k zapisování poznámek během pracovních schůzek nepřijde řeč na politiku.

Chybějící součástky z USA

Kromě regulací a pečlivého výběru dat pro cvičení modelu se čínské společnosti musí vypořádat s nedostatkem hardwaru. Exportní kontroly, které na zemi uvalují Spojené státy, se stupňují a zahrnují i mikroprocesory. Ty se přitom používají v cloudových prostředích pro trénování algoritmů.

Třeba ChatGPT ke svému učení a fungování potřebuje několik desítek tisíc vysoce výkonných grafických procesorů od firmy Nvidia, které od října 2022 podléhají exportním kontrolám. Tento druh umožňuje rychlý přenos dat, což je pro vytrénování klíčové. Právě tyhle mikročipy používají vývojáři ve většině čínských společností, jak ukázala podrobná analýza. Aby americká Nvidia uspokojila poptávku Pekingu, vytvořila méně výkonné typy. Jsou sice pomalejší, ale kontroly se na ně nevztahují. Celý proces prodlužují a zdražují, umožňují však vývoj technologie.

Přístup Číny může připadat atraktivní především řadě autokratických vlád.

Z dlouhodobého hlediska však zmíněná překážka na domácí půdě tlačí na rychlejší vývoj procesorů. Snižuje se tak závislost na importu důležitých zařízení ze zahraničí. Největší čínský výrobce SMIC už pravděpodobně vytvořil prototypy, které jsou jednu nebo dvě generace za mikročipy vyráběnými společností Nvidia na Tchaj-wanu. Nicméně potrvá několik let, než se dočkají široké produkce.

Kromě hardwaru se také nabízí hledání nových cest při výcviku modelů. Může jít například o optimalizaci trénovacího procesu nebo snížení časové náročnosti. Umělá inteligence navíc představuje jednu z technologických oblastí, kterým chce Peking dominovat. Vláda tak vytváří prostředí, kde podporuje výzkum a poskytuje finance. Postupně to začíná přinášet ovoce, v roce 2021 přibližně čtvrtina odborných publikací o umělé inteligenci pocházela z Číny. Jen 17 procent vzniklo ve Spojených státech.

Vzor pro další státy

Rozvoj přelomové technologie a její zpřístupnění veřejnosti provází řada etických, bezpečnostních i společenských otázek. Regulace umělé inteligence leží na stole v mnoha státech, přičemž v porovnání s Evropskou Unií a Spojenými státy je právě Čína aktivnějším, nebo spíš rychlejším hráčem.

Povaha čínského politického systému totiž umožňuje promptně reagovat na technologický pokrok a regulovat specifické aplikace. Naopak sedmadvacítka o právním ohraničení umělé inteligence už přes dva roky diskutuje. S příchodem ChatGPT pak u návrhu zákona vyplynula nutnost dalších úprav. Následné schválení a implementace pak bude záviset na jednotlivých členských státech. Uvedení legislativy do praxe může trvat klidně další dva roky, kdy už bude umělá inteligence pravděpodobně na jiné úrovni.

Dostupnost legislativní základny pro AI a přístup Číny může připadat atraktivní především řadě autokratických vlád. Ty cílí na omezení kritiky své vlády či svobody slova, případně se jim nelíbí vliv a dominance západních společností. Jmenovat můžeme Facebook nebo Google.

Čínské jazykové modely se tak mohou stát součástí projektů v rámci Digitální hedvábné stezky a doplnit stávající lákavý balíček. Ten zahrnuje vybudování digitální infrastruktury, software za dostupné ceny a vzor pro správu internetu. Spolu s rychlou tvorbou regulací to může být další krok ve sbližování Pekingu se státy globálního Jihu.

Článek vznikl ve spolupráci s týmem čínských projektů Asociace pro mezinárodní otázky (AMO).