公司动态
寰球第一:阿里云发布通义千问 Qwen2.5
IT之家 2 月 5 日新闻,1 月 29 日新年之际,阿里云颁布了其全新的通义千问 Qwen 2.5-Max 超年夜范围 MoE 模子,号称在多个基准测试中超出 DeepSeek V3 等竞争敌手。阿里云本日发布,Qwen2.5-Max 在 Chatbot Arena 年夜模子盲测中超出 DeepSeek-V3、Open AI o1-mini 跟 Claude-3.5-Sonnet 等模子,以 1332 分位列寰球第七名,也长短推理类的中国年夜模子冠军。同时,Qwen2.5-Max 在数学跟编程等单项才能上排名第一,在硬提醒(Hard prompts)方面排名第二。IT之家查问公然材料得悉,Chatbot Arena 是由 LMSYS Org 推出的年夜模子机能测试平台,现在集成了 190 多种模子。该榜单采取匿名方法将年夜模子两两组队,交给用户停止盲测,用户依据实在对话休会对模子才能停止投票。因而,Chatbot Arena LLM Leaderboard 成为业界公认的最公平、最威望榜单之一,也是寰球顶级年夜模子的最主要竞技场。阿里云表现,在 Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond 及 MMLU-Pro 等主流基准测试中,Qwen2.5-Max 比肩 Claude-3.5-Sonnet,并多少乎片面超出了 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B。
上一篇:美国经营商 Helium Mobile 推出收费套餐,含 3GB 数据 下一篇:没有了