AI model Anthropic Claude 3 porazil ve srovnávacích testech Chat GPT-4

Technologický startup Anthropic tvrdí, že jeho umělá inteligence Claude 3 dokáže porazit již zavedené modely OpenAI ChatGPT-4 i Google Gemini. To by znamenalo, že Claude 3 dovede rychleji zpracovávat složité matematické úkoly, provádět analýzy grafů či lépe překládat napříč jazyky.

AI model Anthropic Claude 3 porazil ve srovnávacích testech Chat GPT-4
Ilustrační foto | Shutterstock.com

Claude 3 je souhrnný název pro tři modely generativní umělé inteligence – Opus, Sonnet a Haiku, přičemž Opus má být podle svých tvůrců nejrozvinutější, respektive „nejinteligntnější“. A právě tento model porazil konkurenční, špičkové AI v poměrně rozsáhlých srovnávacích testech, určených k stanovení schopností umělé inteligence. V nich se porovnávají například odborné znalosti na úrovni studenta či absolventa vysoké školy. 

Podle výsledků testů má Opus na úrovni absolventů VŠ lepší uvažování než GPT-4 od OpenAI, v testu dosáhl 50,4 procenta oproti 35,7 procenta, které získal model OpenAI GPT-4. Opus také lépe odpovídal na matematické otázky, kódoval a chápal různé úvahy. A pikantní na tom všem je, že společnost Anthropic v roce 2021 založili právě bývalí zaměstnanci OpenAI.  

Výsledky srovnávacích testů mezi Anthropic Claude 3, OpenAI ChatGPT-4 a Google Gemini
Zdroj: Anthropic

Anthropic na svém blogu tvrdí, že tak Opus projevuje téměř lidskou úroveň porozumění a plynulosti při řešení složitých úkolů, což vede na hranici obecné inteligence. Kromě Opusu, který v mnoha ohledech předčil svou konkurenci, se ale činí i ostatní dva modely, i když tentokrát pouze ve srovnání s předchozí verzí Claude. „U naprosté většiny úloh je nejnovější Sonnet dvakrát rychlejší než Claude 2 a Claude 2.1. Vyniká v úkolech vyžadujících rychlé reakce, jako je získávání znalostí nebo automatizace prodeje.“  

Oproti předchozí verzi Claude 3 také lépe pracuje s odpověďmi a není v uvažování tak konzervativní až rigidní. Zároveň je celý model vyvinutý tak, aby si dokázal poradit s riziky a zneužitím AI například v politickém boji. V rámci zlepšení bezpečnosti v celé oblasti využívání AI Anthropic také uvádí, že v současnosti pracuje také na vývoji takzvané Ústavní AI. Mělo by jít o neškodného asistenta umělé inteligence, který bude pouze na základě sebezdokonalování (a bez jakýchkoli lidských komentářů k obsahu) schopen identifikovat škodlivé výstupy. 

Společnost Anthropic trénovala modely Claude 3 na kombinaci neveřejných interních datových sad a dat třetích stran a veřejně dostupných dat ze srpna 2023. Modely byly vycvičeny pomocí platformy AWS a Google Cloud. Obě společnosti do Anthropicu investovaly, přičemž Amazon do společnosti vložil čtyři miliardy dolarů. 

Opus a Sonnet jsou již k dispozici ve 159 zemích světa, Haiku bude k dispozici během krátké doby. Claude 3 bude k dispozici v modelové knihovně Bedrock společnosti AWS a také v systému Vertex AI společnosti Google.