阿里通义千问登顶全球开源模型巅峰,7天惊艳表现引发瞩目
摘要:
上线仅7天的阿里通义千问3强势登顶全球开源模型领域的高峰,展现了其在人工智能领域的强大实力和创新能力,这一成就彰显了阿里巴巴在技术研究和开发方面的领先地位,也证明了通义千问系列模型在智能问答、自然语言处理等方面的优秀表现。
上线仅7天的阿里通义千问3强势登顶全球开源模型领域的高峰,展现了其在人工智能领域的强大实力和创新能力,这一成就彰显了阿里巴巴在技术研究和开发方面的领先地位,也证明了通义千问系列模型在智能问答、自然语言处理等方面的优秀表现。
电脑知识网报道,国际权威大模型测评榜LiveBench公布了最新排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称“千问3”)在众多竞争者中脱颖而出,荣登全球开源模型榜首。
在指令遵循这一关键能力上,千问3同样表现出色,超越了o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,勇夺全球第一,值得一提的是,千问3作为国内首个“混合推理模型”,成功将“快思考”与“慢思考”集成于同一模型内,对于简单需求,它可以低算力快速给出答案;对于复杂问题,则进行多步骤的“深度思考”,从而大大节省算力消耗。
LiveBench榜单由享有盛誉的图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推出,该榜单从数学、推理、编程、语言理解等多个复杂维度全面评估大模型性能,因其采用动态更新的题库,被誉为“全球首个无法作弊的模型基准测试”。
值得一提的是,千问3的发布仅七天便强势登顶全球开源模型榜首,此前,阿里巴巴在4月29日凌晨正式发布了新一代通义千问模型,相较于其他顶尖模型如DeepSeek-R1和OpenAI-o1,千问3在性能上实现了全面超越,而其参数量仅为DeepSeek-R1的1/3,部署成本也大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。
千问3在技术创新方面也不遗余力,作为国内首个“混合推理模型”,它成功融合了快速响应与深度思考的能力,为用户提供更加全面、高效的服务体验,这一突破性的技术成果展示了阿里巴巴在大模型领域的强大实力和创新能力,随着技术的不断进步和应用场景的不断拓展,相信千问3将会在未来的发展中继续展现出更多的潜力与价值。