寰球第一：阿里云发布通义千问 Qwen2.5-og真人官方游戏入口

公司动态

寰球第一：阿里云发布通义千问 Qwen2.5

IT之家 2 月 5 日新闻，1 月 29 日新年之际，阿里云颁布了其全新的通义千问 Qwen 2.5-Max 超年夜范围 MoE 模子，号称在多个基准测试中超出 DeepSeek V3 等竞争敌手。阿里云本日发布，Qwen2.5-Max 在 Chatbot Arena 年夜模子盲测中超出 DeepSeek-V3、Open AI o1-mini 跟 Claude-3.5-Sonnet 等模子，以 1332 分位列寰球第七名，也长短推理类的中国年夜模子冠军。同时，Qwen2.5-Max 在数学跟编程等单项才能上排名第一，在硬提醒（Hard prompts）方面排名第二。IT之家查问公然材料得悉，Chatbot Arena 是由 LMSYS Org 推出的年夜模子机能测试平台，现在集成了 190 多种模子。该榜单采取匿名方法将年夜模子两两组队，交给用户停止盲测，用户依据实在对话休会对模子才能停止投票。因而，Chatbot Arena LLM Leaderboard 成为业界公认的最公平、最威望榜单之一，也是寰球顶级年夜模子的最主要竞技场。阿里云表现，在 Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond 及 MMLU-Pro 等主流基准测试中，Qwen2.5-Max 比肩 Claude-3.5-Sonnet，并多少乎片面超出了 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B。

上一篇：美国经营商 Helium Mobile 推出收费套餐，含 3GB 数据下一篇：没有了

公司动态

寰球第一：阿里云发布通义千问 Qwen2.5

og真人官方

产品

联系我们

微信扫一扫