昨天晚上,Anthropic 正式推出了 Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
這些模型在多個方面超越了GPT-4,包括推理、數學、編碼、多語言理解和視覺處理等。
以下是Claude 3系列模型與同行在多個能力評估基準上的對比:
可以看到,其中Claude 3 Opus模型性能完全碾壓GPT-4,以及Gemini 1.0 Ultra。
Claude 3 Sonnet在部分基準上,比如GSM8K、MATH等超越了GPT-4。Claude 3 Haiku可以與Gemini 1.0 Pro相抗衡。
GPT-4是否真的已經過時?Claude 3的橫空出世是否意味著我們即將進入一個全新的AI時代?
Claude 3 體驗地址:https://claude.ai/chats