Kedy Baidu sprístupní open-source verziu Ernie?

Spoločnosť avizovala oficiálne vydanie najneskôr 30. júna 2025.

Akú licenciu bude Ernie používať?

Baidu plánuje licenciu Apache 2.0 doplnenú o Responsible AI Addendum, ktorá dovoľuje komerčné využitie pri dodržaní etických smerníc.

Bude open-source balík obsahovať plné váhy modelu?

Áno, vrátane tréningových skriptov a vektorovej databázy s 1,2 bilióna tokenov, ak sa vývojár zaregistruje v Baidu AI Trust Center.

Aké riziká priná&scaron;a otvorenie tak veľkého modelu?

Možné zneužitie na dezinformácie, deepfake videá či pokročilé kyberútoky; preto Baidu zavádza watermarking a povinné red-teaming audity.

Ako môže open-source Ernie ovplyvniť globálnu AI konkurenciu?

Zvy&scaron;uje tlak na západné firmy otvoriť väč&scaron;iu časť kódu a môže presunúť časť open-source komunity k čínskej platforme, čím sa mení rovnováha inovácií.

Baidu otvára zdrojový kód Ernie: čínsky rival GPT bude open-source

Úvod

Baidu, považovaný za čínskeho priekopníka v oblasti vyhľadávania a cloudových služieb, posúva svoje ambície na ďalšiu úroveň – do 30. júna 2025 plánuje sprístupniť svoj najnovší model Ernie (Enhanced Representation through kNowledge IntEgration) pod otvorenou licenciou. Krok prichádza v momente, keď sa čínske vláda aj súkromný sektor snažia dobehnúť a potenciálne prekonať amerických rivalov v rýchlosti výskumu umelej inteligencie. Otvorenie zdrojových kódov a váh modelu však nie je len marketingovým ťahom; ide o strategické rozhodnutie, ktoré má znížiť bariéry pre vývojárov, startupy a akademikov, pričom zároveň zvyšuje šancu, že sa Ernie stane de-facto štandardom pre čínsky AI ekosystém. V tejto prvej časti článku rozoberieme, čo projekt znamená pre globálnu rovnováhu AI síl, aké technologické inovácie Ernie prináša a prečo je open-source licencia kľúčovým krokom v kontexte regulačného prostredia v Číne aj mimo nej.

Mohlo by vás zaujímať

Čo je Ernie a prečo záleží

Model Ernie sa od svojho debutu v roku 2019 vyvíjal rýchlym tempom; posledná generácia, interným označením Ernie 4.0, sa môže pochváliť 180 miliardami parametrov a rozšíreným kontextovým oknom až na 256 000 tokenov. Na rozdiel od západných protikladov stavia na tzv. „knowledge-enhanced“ architektúre: do tréningového procesu systematicky vkladá čínske encyklopedické databázy a symbolické ontológie, vďaka ktorým model nerobí len štatistické predikcie, ale aj explicitné logické inferencie. To mu v interných benchmarkoch umožnilo prekonať GPT-4 v úlohách vyžadujúcich faktickú presnosť v čínštine a v doménových testoch medicínskej terminológie. Pre čínske publikum tak Ernie predstavuje nielen jazykovú, ale aj kultúrnu konkurenčnú výhodu; dokáže správne interpretovať idiomatické výrazy, historické referencie a regiónové dialekty, čo západné modely často halucinujú alebo zjednodušujú. Pre výskumníkov je dôležitá aj dostupnosť vektorovej databázy, ktorá obsahuje 1,2 bilióna tokenov z čínskych open-access zdrojov – tá bude súčasťou open-source balíka a umožní ďalší transfer learning pre špecializované odvetvia.

Prechod Baidu na open-source

Oznámené otvorenie Ernieho prichádza so slobodnejšou licenciou, než akú ponúka väčšina západných gigantov; podľa vyhlásenia Baidu pôjde o variant Apache 2.0 with Responsible AI Addendum, ktorý umožní komerčné využitie bez licenčných poplatkov, no vyžaduje dodržiavanie etických smerníc a audit rizikových aplikácií. Otvorenie váh a tréningových kódov je zároveň podmienené registráciou v novom Baidu AI Trust Center, kde musia vývojári uviesť, aký typ produktu budú stavať. Tento krok má agentom kybernetickej bezpečnosti uľahčiť sledovanie potenciálneho zneužitia, čo je v Číne čoraz dôležitejšie vzhľadom na štátne regulácie Generative AI Management Provisions. Baidu argumentuje, že transparentnou dokumentáciou chce pritiahnuť nielen startupy, ale aj výskumné inštitúcie, ktoré doteraz narážali na nákladové bariéry pri pretrénovaní veľkých modelov. Spoločnosť pritom avizuje, že open-source release nebude „osekanou“ verziou; naopak, súčasťou balíka bude aj inštruktáž, ako škálovať inference na lacnejších čipoch Kunlun a na cloudovej platforme Baidu Qianfan, čo má výrazne znížiť TCO pre menšie tímy.

Dopad na čínsky a globálny ekosystém

Otvorenie Ernieho môže premeniť dynamiku inovácií v Číne podobne, ako kedysi Linux zmenil serverový trh. Lokálne startupy v oblastiach e-commerce, fintech či zdravotníckej diagnostiky získajú možnosť rýchlo nadviazať na robustný základ bez licenčných obmedzení. Čínske univerzity, obmedzené sankciami na americké GPU, budú môcť využívať optimalizované verzie bežiace na domácom hardvéri, čím sa zníži technologická závislosť od importu. Globálne má tento krok potenciál vyvinúť tlak na západné firmy, aby otvorili väčšie časti svojich modelov alebo riskovali odliv open-source komunity k čínskym projektom. Analytici IDC už teraz odhadujú, že open-source Ernie môže do roka zvýšiť podiel Číny na globálnom AI trhu softvéru o 2–3 percentuálne body. Zároveň však existujú obavy, či sa model nestane nástrojom pre šírenie propagandy alebo sofistikovaných deepfake útokov – otázka zodpovednosti a kontroly tak zostáva horúcou témou, ktorú budú regulátori v USA aj EÚ pozorne sledovať.

Výzvy a bezpečnosť

Aj keď open-source prístup zrýchľuje inovácie, prináša mimoriadne komplexné regulačné a právne dilemy. V čínskom prostredí musí byť každý model v súlade s pravidlami Cyberspace Administration of China o „správnom hodnotovom smerovaní“ – čo môže vývojárov prinútiť nasadzovať agresívne filtrovanie, ktoré sa ťažko replikuje mimo domáceho cloudu. Západní partneri zároveň vyjadrujú obavy, či licencia Apache 2.0 with Responsible AI Addendum nebude de facto podmienená geolokačným logovaním používateľov a povinným zdieľaním telemetrie s Baidu. Ďalším problémom je ochrana autorských práv: časť tréningových dát pochádza z čínskych sociálnych sietí, čo môže pri exporte do EÚ naraziť na smernicu DSM o text-data miningu. Otázne ostáva, kto bude právne zodpovedný za halucinácie spôsobené lokálnym doladením modelu – open-source komunita či pôvodný správca repozitára?

Baidu deklaruje, že spúšťa viacvrstvový bezpečnostný rámec. Každý oficiálny build modelu bude obsahovať kryptografický podpis a zásuvný modul na watermarking výstupov, aby bolo možné spätne overiť pôvod sporného textu alebo obrázku. Spolu s Tsinghua University sa pripravuje verejne dostupný nástroj na red-teaming, ktorý simuluje dezinformačné scenáre, prompt-injection útoky a extrakciu osobných údajov. Firemným zákazníkom Baidu ponúkne „lock-box režim“, kde váhy zostanú na dedikovanom hardvéri Kunlun 2, izolovanom od internetu a monitorovanom podľa štandardu ISO / IEC 42001 (nová norma pre AI management systems). Napriek tomu experti NATO StratCom varujú, že otvorené veľké modely môžu skomplikovať forenznú atribúciu kyberútokov, pretože útočníci získajú prístup k technologicky rovnocenným nástrojom bez finančných bariér.

Budúcnosť AI v Číne

Open-sourcovanie Ernieho zapadá do širšej štátnej stratégie „Digital China 2030“, ktorej cieľom je posunúť krajinu z pozície „továreň sveta“ do roly globálneho inovačného uzla. Domáci výrobcovia čipov – SMIC, Cambricon a Huawei Ascend – pracujú na 3 nm GPU klastroch optimalizovaných práve pre knowledge-enhanced architektúry, čo zníži prevádzkové náklady a závislosť od NVIDIA H100. Súbežne vzniká sieť provinčných dátových centier napájaných obnoviteľnou energiou z Gansu a S‘-čchuanu na „zelený tréning“ modelov. Analytici z China Renaissance očakávajú, že do roku 2027 bude mať každý z desiatich najväčších čínskych provincií vlastnú public-sector verziu Ernieho na servis elektronickej vlády a lokalizované dialektové modely pre Smart City aplikácie. Globálne firmy, ktoré pôsobia v Číne, budú musieť svoje chatboty a apky preložiť z GPT-based rozhraní na Ernie API, ak budú chcieť získať certifikát 可信AI-服务 (Trusted AI Service) – ten sa už dnes začína vyžadovať pri fintech produktoch a zdravotníckych pomôckach.

Záver

Rozhodnutie Baidu sprístupniť Ernieho pod otvorenou licenciou môže byť katalyzátorom druhej open-source vlny, ktorá zmení mocenskú mapu umelej inteligencie. Vývojári získajú prístup k jazykovo a kultúrne optimalizovanému modelu, startupy ušetria milióny na licenčných poplatkoch a čínska vláda posilní digitálnu suverenitu. Na druhej strane rastú obavy z propagandy, kybernetickej kriminality a licenčných nejasností. Kľúčom k úspechu bude transparentnosť, robustné bezpečnostné opatrenia a otvorený dialóg medzi Baidu, výskumnou komunitou a regulátormi. Ak sa podarí vybalansovať rýchlosť inovácie s globálnou zodpovednosťou, Ernie sa môže stať čínskym ekvivalentom Linuxu – platformou, na ktorej vyrastú nové generácie aplikácií od autonómnych vozidiel po medicínsku diagnostiku. V opačnom prípade hrozí, že technologická rivalita prerastie do regulačnej štiepenej reality, kde sa AI ekosystémy definitívne rozdelia na „Východ“ a „Západ“.