Vybrané články
z týdeníku The Economist

Umělá inteligence porazila člověka v další hře. Co se stane, až se naučí i podvádět?

Po vrhcábech, šachu a go dokáže umělá inteligence běžně porážet lidi už i v deskové hře Diplomacie

Umělá inteligence porazila člověka v další hře. Co se stane, až se naučí i podvádět?
ilustrační foto | Shutterstock.com

Vyhrát ve vrhcábech není nic těžkého. Šachy už jsou těžší. A go ještě těžší. Podle některých nadšenců však může umělá inteligence (AI) říci, že se dostala do hráčského klubu, až teď – protože prokázala, že dokáže bez problémů porazit lidi v Diplomacii.

Pro ty z vás, kdo tuto deskovou hru neznáte: herní plán představuje mapu Evropy těsně před první světovou válkou (až na to, že na něm příhodně, z jakéhosi důvodu, chybí Černá Hora). Každý z hráčů, ideálně v počtu sedmi, zaujme roli jedné z velmocí: Rakouska, Británie, Francie, Německa, Itálie, Ruska a Turecka. Každý má k dispozici armádu a námořnictvo a geograficky podmíněné zdroje na jejich podporu, které může využívat k zabírání sousedních teritorií, a tím pádem získávat nástroje k rozhojňování vlastních sil a umenšování sil těch ostatních.

Zuckerbergův Cicero

Trik spočívá v tom, že alespoň zpočátku se hráči nikam nedostanou, pokud neuzavřou spojenectví – herní pravidla je však nezavazují k tomu, že musí uzavřené dohody dodržovat. Teprve když jsou odhaleny příkazy pro pohyb jednotek a plavidel, jež musí být zapsány, zjistí hráč, kdo je skutečně jeho přítel a kdo nepřítel.

Cicero, program vytvořený skupinou zaměstnanců Marka Zuckerberga, kteří o sobě mluví jako o Výzkumném diplomatickém týmu AI Meta Fundamental, se ukázal jako zdatný žák. Tým v časopise Science popsal, že jeho výtvor sehrál v online lize Diplomacie čtyřicet her a skončil mezi deseti procenty nejlepších hráčů – a nikdo nepřišel na to, že se nejedná o člověka.

Dosud se ve všech herních projektech program AI učil posilováním. Opakovaně hrál sám proti sobě nebo proti jiným verzím sebe sama, jeho kroky byly zprvu náhodné a pak selektivnější. Nakonec se naučil, jak dosáhnout vytouženého cíle. I Cicero se učil tímto způsobem. To byla však jen jedna část jeho výcviku. Úspěšný hráč Diplomacie musí totiž kromě uvažování při plánování vítězné strategie ovládat také komunikační dovednosti, aby ji mohl zrealizovat.

Zásadní příspěvek týmu Meta tím pádem spočíval v tom, že učení posilováním rozšířil o zpracování přirozeného jazyka. Velké jazykové modely procvičované na obrovských objemech dat tak, aby dokázaly předpovídat vymazaná slova, mají podivuhodnou schopnost napodobovat vzorce skutečného jazyka a říkat věci, které by mohli říct lidé.

U Cicera začal tým s již vycvičeným modelem disponujícím základním porozuměním jazyku a vyladil ho dialogy z více než čtyřiceti tisíc odehraných partií, aby jej naučil specifickým vzorcům jazyka Diplomacie.

Porazit ano, podrazit ne

Při hraní se Cicero podívá na herní plán, zapamatuje si poslední tahy a učiní informovaný odhad dalšího kroku ostatních protihráčů. Pak se pokusí přijít na to, jaký další tah dává smysl pro něj, vybírá přitom z různých cílů, simuluje případné následky a poté simuluje také následnou reakci ostatních hráčů na tento krok.

Jakmile se rozhodne, co udělá, musí přijít na to, co má ostatním sdělit. Jazykový model proto předloží možné vzkazy, vyřadí špatné nápady nebo jakoukoli hatmatilku a vybere ty, jež jsou pro příjemce vhodné a u kterých mu jeho zkušenosti a algoritmy napovídají, že budou v zájmu jeho další agendy působit nejpřesvědčivěji.

Cicero dokáže vyjednávat, přesvědčovat, spolupracovat a soupeřit. Ostřílení hráči Diplomacie však chtějí vědět ještě něco: Dokáže podrazit? Podražení – tedy to, že jednu věc říkáte a jinou děláte (obzvláště v případě útoku na stávajícího spojence) – je mnohými vnímáno jako zcela zásadní rys Diplomacie. Přestože Cicero dokázal „spoluhráčům strategicky zamlčovat informace“, nikoho nepodrazil.

Možná právě absence této špetky machiavelistické bezohlednosti vysvětluje, proč skončil jen v horních desetině, a ne jako victor ludorum. 

© 2022 The Economist Newspaper Limited
All rights reserved. Publikováno na základě licence s The Economist, přeloženo týdeníkem Hrot.
Originální článek v angličtině najdete na www.economist.com