搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按时间排序
按相关度排序
新智元 on MSN
2 天
自生成数据实现LLM自我纠正,DeepMind新突破:纠正性能提升15.9%
编辑:LRS 【新智元导读】Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和 ...
2 天
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正 ...
Google DeepMind的研究人员发布了一种多轮在线强化学习(RL)方法 SCoRe,在完全使用自生成数据(entirely self-generated data)的情况下,显着提高了LLM的自我纠正能力。 研究人员首先验证了有监督微调 ...
来自MSN
7 天
北大AI奥数评测,o1-mini比o1-preview分数还高
Omni-MATH团队 投稿量子位 | 公众号 QbitAI OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。 MATH-500,满血版o1模型直接拿下94.8分。 更难的奥数邀请赛AIME 2024,o1也获得83.3%的准确率。
来自MSN
10 天
Qwen2.5登上全球开源王座!72B模型击败LIama3 405B,轻松胜过GPT-4o-mini
白小交 发自 凹非寺量子位 | 公众号 QbitAI 击败LIama3!Qwen2.5登上全球开源王座。 而后者仅以五分之一的参数规模,就在多任务中超越LIama3 405B。 各种任务表现也远超同类别的其他模型。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈