AI model Anthropic Claude 3 porazil ve srovnávacích testech Chat GPT-4

Technologický startup Anthropic tvrdí, že jeho umělá inteligence Claude 3 dokáže porazit již zavedené modely OpenAI ChatGPT-4 i Google Gemini. To by znamenalo, že Claude 3 dovede rychleji zpracovávat složité matematické úkoly, provádět analýzy grafů či lépe překládat napříč jazyky.

Ilustrační foto | Shutterstock.com

Claude 3 je souhrnný název pro tři modely generativní umělé inteligence – Opus, Sonnet a Haiku, přičemž Opus má být podle svých tvůrců nejrozvinutější, respektive „nejinteligntnější“. A právě tento model porazil konkurenční, špičkové AI v poměrně rozsáhlých srovnávacích testech, určených k stanovení schopností umělé inteligence. V nich se porovnávají například odborné znalosti na úrovni studenta či absolventa vysoké školy.

Podle výsledků testů má Opus na úrovni absolventů VŠ lepší uvažování než GPT-4 od OpenAI, v testu dosáhl 50,4 procenta oproti 35,7 procenta, které získal model OpenAI GPT-4. Opus také lépe odpovídal na matematické otázky, kódoval a chápal různé úvahy. A pikantní na tom všem je, že společnost Anthropic v roce 2021 založili právě bývalí zaměstnanci OpenAI.

Výsledky srovnávacích testů mezi Anthropic Claude 3, OpenAI ChatGPT-4 a Google Gemini
Zdroj: Anthropic

Anthropic na svém blogu tvrdí, že tak Opus projevuje téměř lidskou úroveň porozumění a plynulosti při řešení složitých úkolů, což vede na hranici obecné inteligence. Kromě Opusu, který v mnoha ohledech předčil svou konkurenci, se ale činí i ostatní dva modely, i když tentokrát pouze ve srovnání s předchozí verzí Claude. „U naprosté většiny úloh je nejnovější Sonnet dvakrát rychlejší než Claude 2 a Claude 2.1. Vyniká v úkolech vyžadujících rychlé reakce, jako je získávání znalostí nebo automatizace prodeje.“

Kreativita, vůdčí schopnosti a inteligence. To budou klíčové dovednosti v éře AI

Trh práce se mění a reaguje na extrémně rychlý rozvoj umělé inteligence. Zatímco starší generace se s generativní AI pomalu učí zacházet, pro ty nejmladší bude naprostou samozřejmostí.

Oproti předchozí verzi Claude 3 také lépe pracuje s odpověďmi a není v uvažování tak konzervativní až rigidní. Zároveň je celý model vyvinutý tak, aby si dokázal poradit s riziky a zneužitím AI například v politickém boji. V rámci zlepšení bezpečnosti v celé oblasti využívání AI Anthropic také uvádí, že v současnosti pracuje také na vývoji takzvané Ústavní AI. Mělo by jít o neškodného asistenta umělé inteligence, který bude pouze na základě sebezdokonalování (a bez jakýchkoli lidských komentářů k obsahu) schopen identifikovat škodlivé výstupy.

Společnost Anthropic trénovala modely Claude 3 na kombinaci neveřejných interních datových sad a dat třetích stran a veřejně dostupných dat ze srpna 2023. Modely byly vycvičeny pomocí platformy AWS a Google Cloud. Obě společnosti do Anthropicu investovaly, přičemž Amazon do společnosti vložil čtyři miliardy dolarů.

Opus a Sonnet jsou již k dispozici ve 159 zemích světa, Haiku bude k dispozici během krátké doby. Claude 3 bude k dispozici v modelové knihovně Bedrock společnosti AWS a také v systému Vertex AI společnosti Google.

Haló, tady Joe Biden. Spojené státy zakázaly využití AI v telemarketingu

Telefonní hovory, v nichž umělá inteligence napodobuje hlas prezidenta, populárních zpěváků či babičky volaného, jsou v USA stále častější. Americký regulační úřad proto rozhodl, že se v telemarketingu nesmí AI používat.

Kristina Blümelová 6. března 2024
7:25

Magazín Hrot: nový stylový měsíčník pro ty, kteří nic nehrotí a chtějí žít naplno

Komentář: Výpověď bez udání důvodu? Jen bouře ve sklenici vody

Komentář: Apple svou reklamou pošlapal lidskou tvořivost. Místo kreativity mu zbyl jen cirkus

AI model Anthropic Claude 3 porazil ve srovnávacích testech Chat GPT-4

Kreativita, vůdčí schopnosti a inteligence. To budou klíčové dovednosti v éře AI

Haló, tady Joe Biden. Spojené státy zakázaly využití AI v telemarketingu

Provozovatel

Sídlo

Šéfredaktor

Redakce

Inzerce