Čínský AI psík

před 10 měsíci

Příběh jak ze žurnálu. Čínská IT garážovka i navzdory zlým sankcím dokázala vytvořit umělou inteligenci, která vítězí nad americkými giganty, jako jsou OpenAI či Google. Navíc DeepSeek (a.k.a. dý psík) nechává nahlédnout "dovnitř" svého uvažování a ke každé odpovědi podrobně vysvětluje, jak k ní došel. Odborníci i laici jsou nadšení, mluví se o revoluci v oboru umělé inteligence. Akorát že to tak úplně není.

Zdroj: AZ247

Obor AI (umělá inteligence) dlouhodobě trpí fenoménem nafouknuté bubliny - dosažené výsledky se přehání, jak jen to jde. Jedním důvodem určitě je to, že do vývoje už bylo (a ještě bude) vloženo neuvěřitelné množství kapitálu (mluví se o miliardách dolarů). V tomto případě je určitě druhý důvod i soupeření Číny a Západu - Čína si samozřejmě chce připsat mediální body k dobru, kdy jako outsider porazila západní big tech společnosti. Výsledkem je, že v tomhle oboru se z každýho prdu dělá kulička. Váš model má v testu výsledky o pár desetin procenta lepší než konkurence? Hned vypusťte tiskovou zprávu, že jste nejlepší na světě. Vydrží vám to tak tři měsíce, než vás někdo překoná. (Ostatně, když redakce Hyen začala psát tenhle článek, tak nejnovější verze modelu firmy OpenAI byla o1. Když ho dopsala, tak už to byla o3, a to jsme to měli za sobotu hotový.) Výhodou je raketově rychlý pokrok, nevýhodou spousta utopených peněz (a propálené elektřiny - s ne tak velkou nadsázkou se prorokuje, že na trénování velkých AI modelů budou mít firmy za chvíli svoje vlastní elektrárny).

Zpátky do Číny. Je pravda, že Čína dlouhodobě v AI závodě spíš zaostává. Není ale pravda, že by se tam výzkum v oboru AI nedělal a není pravda, že musela přijít geniální IT garážovka, která se zlomkovými náklady dokázala natrénovat model, který je nejlepší na světě. Je to jako obvykle o něco složitější.

Firma, která stojí za DeepSeekem, je velká finanční společnost, s majetkem 7 miliard dolarů - a to ještě před odhalením nového modelu - a do vývoje nepochybně investovala mraky peněz. Je pravda, že pro trénování využili slabší procesory (právě kvůli zmíněnému embargu na dovoz těch nejlepších Nvidia procesorů), ale i přes to muselo být trénování velmi nákladné. Částka uváděná v médiích (6 milionů dolarů) skoro určitě nezahrnuje nákup vybavení, práci programátorů, dlouholetý výzkum a testování a podobně. Nicméně je pravda, že provoz modelu je výrazně levnější - DeepSeek je úsporný a není to takový "kanón na vrabce" jako v případě ChatGPT a dalších "západních" modelů. Chleba na krámě z toho levnější asi nebude, ale AI služby nejspíš jo.

Jednou z nejzajímavějších vlastností, o které se hodně píše a mluví, je "vnitřní monolog", tj. model vám vysvětlí, jak k výsledku došel. Zase, není to žádná převratná novinka, stejnou schopnost má už několik měsíců např. i nejnovější model o1 od OpenAI, ale DeepSeek to zjevně umí líp prodat, protože média jsou z toho nadšená - můžeme se podívat pod pokličku umělé inteligence! Vidíme jí do hlavy, jak uvažuje, jak myslí! Fascinující!

Jenže ono to tak vůbec není. AI modely nemyslí, rozhodně ne ve smyslu, v jakém to chápeme my, lidé. Celý slavný vnitřní monolog vzniká tak, že DeepSeek má v sobě instrukci, která je nadřazená instrukcím od uživatele, a která říká zhruba něco jako "vygeneruj text, který podrobně popisuje, jak se dá k odpovědi dojít". Jde o imitaci přemýšlení, nedozvíme se z toho, jak model uvnitř funguje - i když určitě to může být pro spoustu případů velmi užitečné.

Kapitola sama pro sebe je čínská cenzura, která se samozřejmě projevuje i tady. Jak si už vyzkoušela spousta uživatelů, s DeepSeekem si o řadě témat vůbec nepokecáte. Pošle vás do háje s dotazem na nezávislost Tchaj-wanu, Ujgury, svobodu slova v Číně, nebo masakr na náměstí Nebeského klidu. Při podrobnějším zkoumání je vidět, že DeepSeek odpověď generuje, ale pak jí smaže a přeplácne něčím typu "sorry, tohle je mimo můj záběr, pojďme se bavit o něčem jiném". Anebo vám do textu vloží kusy oficiální čínské propagandy např. o tom, jak se v Číně mají všechny menšiny fantasticky, tančí na ulicích a jednorožci k tomu blijou duhu.

Dalším problémem je uchovávání dat. Čína má zákony na to, že stát se může dostat k datům soukromých společností, jak se mu to hodí. Což znamená, že cokoliv posíláte do DeepSeeku, v podstatě servírujete čínské vládě, což je nepřekvapivě pro spoustu lidí (a firem) problém. Redakce Hyen by vás proto ráda před jeho používáním důrazně varovala.

Vidíme tu v přímém přenosu, že státní vměšování do AI zhoršuje její kvalitu a využitelnost - a Čína bude muset najít řešení, jinak i sebelevnější modely nikdo ze západního světa prostě používat nebude.

<< zpět na hlavní stránku