搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
7 天
北大与阿里合作推出Omni-MATH:大语言模型迎接奥数挑战
在人工智能快速发展的今天,数学能力的提升显得尤为重要。最近,北京大学与阿里巴巴团队联合推出的Omni-MATH评测基准,为大语言模型在奥林匹克数学竞赛中的应用奠定了新的标准。随着o1系列模型的面世,传统数学评测的界限被不断打破,尤其是针对高难度的数学问题,这一技术的引入将可能引发广泛关注和讨论。
凤凰网
7 天
北大AI奥数评测,o1-mini比o1-preview分数还高
OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。 MATH-500,满血版o1模型直接拿下94.8分。 更难的奥数邀请赛AIME 2024,o1也获得83.3%的准确率。
腾讯网
2 天
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正 ...
【新智元导读】Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。
搜狐
9 天
mighty math for 6-8year olds book1-3 +advancding mathematcian
平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
来自MSN
10 天
Qwen2.5登上全球开源王座!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini
白小交 发自 凹非寺量子位 | 公众号 QbitAI 击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务表现也远超同类别的其他模型。
新智元 on MSN
2 天
自生成数据实现LLM自我纠正,DeepMind新突破:纠正性能提升15.9%
编辑:LRS 【新智元导读】Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和 ...
来自MSN
10 天
数学AI模型新霸主来了,据说卷过了GPT-4和Claude,来试试?
在人工智能领域,数学能力的突破一直是业界关注的焦点。近日,阿里云推出的新一代数学模型Qwen2-Math系列,以其卓越的数学推理和解题能力,在基准测试中超越了GPT-4、Claude等通用大型语言模型,成为数学AI模型的新霸主。 Qwen2-Math系列模型,包括1.5B、7B和72B三 ...
9 天
通义千问重磅开源Qwen2.5,性能超越Llama
自从2023年8月开源以来,通义在全球开源大模型领域后来居上,成为开发者尤其是中国开发者的首选模型。性能上,通义大模型日拱一卒,逐步赶超美国最强开源模型Llama,多次登顶Hugging ...
1 天
最受欢迎开源大模型,为什么是通义?
两个数据最能体现通义作为中国开源大模型的影响力,一是模型下载量,根据通义官方数据,截至 2024 年 9 ...
腾讯网
6 天
疯狂星期四Qwen2.5开源,通义成了最Open的AI?
对国外开发者们来说,今天是一个特殊的“疯狂星期四”!周四还没来,就有开发者在社交媒体平台上翘首以盼;已经要睡觉的日本网友,半夜爬起来测试竞技场;甚至有人直呼今天是“疯狂星期四”!没错,一切都是因为,Qwen2.5开源了,而且一口气开源了100多个模型 ...
壹线生活 on MSN
1 天
数学家用公式论证银河系中,除人类以外或许没有外星智慧生物
哥白尼原理,也被称为宇宙学原理,持有一个重要的推论,宇宙没有中心,或者宇宙中没有什么是特殊的,所有的位置都是平等的。哥白尼原理也可以用另一种方式来描述:宇宙中任何一个观察者都会观察到与我们观测到的相同的大尺度结构图像。宇宙学原理是以哥白尼的名字命名的 ...
腾讯网
5 天
代号002:谷歌发布两款Gemini 1.5升级生产级模型「一流数学能力,价格 ...
刚刚谷歌的 Gemini 模型又双叒叕升级了!谷歌发布了两款更新后的可投入生产的Gemini模型:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,以及以下更新内容:1.5 Pro的价格降低了50%以上(针对提示词 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈