Kdo je na vrcholu ve vývoji umělé inteligence? Česko

Dva české vysokoškolské týmy patří mezi světové jedničky na poli umělé inteligence.

Kdo je na vrcholu ve vývoji umělé inteligence? Česko
ilustrační foto | Profimedia.cz

Věda, která se dělá v České republice, má často mezinárodní ohlas. České mozky bodují v mnoha oborech, tradičně také v umělé inteligenci (AI). Za zmínku stojí dva nedávné úspěchy, které zaznamenali na Fakultě informačních technologií Vysokéhoučení technického v Brně a Fakultě elektrotechnické Českého vysokého učení technického v Praze. Oba týmy patří právem mezi světové jedničky.

Rozpoznávání řeči na VUT

Vysoké učení technické v Brně se objevilo na žebříčku podle Arnet Miner v oblasti „Speech recognition“ v první pětici institucí, které ovládají oblast dolování informací z řeči. A jde o jediný pomyslný zářez České republiky. Na žebříčku dominuje VUT společně se společnostmi Google, Facebook, Carnegie Mellon University nebo IBM. Tento úspěch má na svém kontě skupina BUT Speech@FIT, kterou vede Jan Černocký z Ústavu počítačové grafiky a multimédií na Fakultě informačních technologií. Vědeckým ředitelem skupiny je Lukáš Burget. Spolu s Černockým a ještě dalším členem skupiny Pavlem Matějkou jsou zařazeni do seznamu stovky nejvlivnějších světových výzkumníků v oblasti rozpoznání řeči.

V žebříčku nejúspěšnějších vědců v oblasti umělé inteligence napříč kategoriemi se v první stovce umístil také Tomáš Mikolov, který je absolventem VUT. Nyní působí na CIIRC ČVUT. Má za sebou kariéru ve společnostech Google, Microsoft i Facebook.

Nicméně kromě umístění v žebříčku bodovala skupina BUT Speech@FIT za posledního půl roku na mnoha dalších mezinárodních soutěžích. Jedná se o „challenges“, kde jsou všem týmům k disposici stejná data, stejné podmínky a výsledky se vyhodnocují podle známé metodiky. Je v nich tedy možné se objektivně srovnat s ostatními světovými laboratořemi. Z početné konkurence soutěžících týmů se umístili na 2. místě v NIST Open Speech Analytic Technologies, kde se soutěžilo v přepisu řeči z velmi složitých prostředí. Dalším úspěchem bylo 2. místo VUT v VoxCeleb Speaker Recognition Challenge 2020 v kategorii diarizace (určení, kdo v rozhovoru kdy mluví). 3. místo obsadil systém VUT v soutěži Efficient QA na konferenci NeurIPS (zodpovídání dotazů).

„Úspěch v žebříčku nás těší, ale hodnocení může být trochu subjektivní. My více slavíme při umístění na mezinárodní soutěži. Dostaneme zadaný úkol, tedy zvukový soubor řeči, z kterého dolujeme informace,“ vysvětluje skromně Černocký, jehož skupina konkuruje světovým hráčům v poli AI a často vyhrává.

Dolování informací z řeči, které se dělá tým Černockého, není pouhé přepisování slov. Rozborem dat z řeči můžeme dostat i klíčová slova, pohlaví nebo věk – v těchto doménách lze úlohu dobře nadefinovat a korektně přepsat trénovací data. Pomocí AI lze detekovat i emoce mluvčího nebo úroveň vzdělání a další. Tady se ale AI potýká s nepřesnými daty – ani lidé si leckdy nejsou jistí.

„Já jsem na Fakultě informačních technologií skoro od jejího vzniku. Sešla se tady dobrá parta nadšených odborníků a zároveň jsme dobře zapadli do toho, co už se na vznikající fakultě dělalo. V mé skupině je dnes deset různých národností a hodně spolupracujeme se zahraničními partnery. Máme za to, že když budeme otevření – ať už v publikacích, open-source softwaru nebo právě v práci s kolegy a kolegyněmi z celého světa, vyplatí se to. A zatím to klape,“ usmívá se Černocký nad tím, v čem je skupina unikátní a co jí přináší tah na branku.

Černocký říká, že na to, jak jsme maličká země, je pozice jeho oboru velmi silná. V mezinárodní komunitě se ví, že „speech“ se dělá v USA, Číně … a v Česku. Řeč je ale jen jedno z odvětví AI, která byla podle Černockého ještě přibližně před deseti lety velmi rozdrobená – každé mělo své techniky nesrozumitelné pro „ty druhé“. To se změnilo díky neuronovým sítím a hlubokému učení – díky tomu se jednotlivé obory přiblížily, odborníci mezi sebou začali více komunikovat a celý obor to neskutečně „nakoplo“, takže experti na řeč, počítačovou lingvistiku nebo počítačové vidění dokáží mezi sebou sdílet zkušenosti.

„Protože je v České republice velká základna v AI, bodujeme a jsme hodně vidět v zahraničí. Přijde mi, že u nás to lidé zatím nevidí. To je škoda, protože si myslím, že si zasloužíme větší pozornost třeba ministerstev nebo grantových agentur. AI patří mezi významné vědecké obory v České republice. A nejenom v Brně,“ doplňuje Černocký, vyjmenovává další vynikající pracoviště v Plzni, Liberci, Ostravě a v Praze a zmiňuje také iniciativu AI Czechia, která se snaží umělou inteligenci v Česku propagovat.

Vědci z ČVUT bodovali v Amazon Research Awards

Výzkum AI na Fakultě elektrotechnické ČVUT v Praze se umístil v prestižním Amazon Research Awards. Projekty byly hodnoceny z hlediska vědy, kreativity a potenciálu ovlivnit společnost. Amazon poskytuje vítězům finanční prostředky na výzkum po dobu jednoho roku. Mezi 101 vědci oceněnými společností Amazon figurují kybernetik Jiří Matas z Katedry kybernetiky s projektem v oblasti počítačového vidění a kybernetik Jan Faigl z Katedry počítačů, který využívá AI k vytváření komunikačních map podzemních prostor.

Jiří Matas se zaměřuje na zkvalitňování úrovně počítačového vidění. V Amazon Research Award 2020 uspěl s projektem Training neural networks on non-differentiable losses. Řešení tohoto projektu může přispět ke zlepšení kvality mobilních aplikací. Například pomocí mobilního fotoaparátu se vyfotografují a následně přeloží cizojazyčné texty na cedulích nebo se prověří nutriční hodnoty uvedené na obalu výrobků v kamenných prodejnách.

„První výsledky ve výzkumu daného problému už máme, byly publikovány na jedné z nejprestižnějších konferencí v oboru, European Conference on Computer Vision,“ vysvětluje Matas.

Jan Faigl uspěl s projektem Communication Maps Building in Subterranean Environments, který zkoumá využití metod strojového učení v úloze charakterizace šíření signálu v podzemních prostorech. Výzkum je motivovaný online vytvářením komunikační infrastruktury v dopředu neznámém prostředí, ale s využitím modelů podobných prostředí a dat získaných v aktuálním prostředí.

Fajgl vysvětluje využití projektu v praxi: „Snažíme se navrhnout metody zajištění komunikační dostupnosti během průzkumných misí v neznámém prostředí. Tím přispějeme k efektivní koordinaci týmu robotů nebo lidských záchranářů v prostředí, která jsou jinak komunikačně nedostupná.“

Článek vyšel na portálu Vědavýzkum.cz.