最新论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

Phi-3 技术报告:在您的手机上本地运行的高度功能强大的语言模型
Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.
发布日期: 4/24/2025

Qwen2.5 技术报告
Qwen, An Yang, Baosong Yang, et al.
发布日期: 4/24/2025

DeepSeek-R1:通过强化学习激励LLM的推理能力
DeepSeek-AI, Daya Guo, Dejian Yang, et al.
发布日期: 4/24/2025

ReTool:LLM中战略工具使用的强化学习
Jiazhan Feng, Shijue Huang, Xingwei Qu, et al.
发布日期: 4/24/2025

强化学习是否真的在基础模型之上提升了大语言模型的推理能力?
Yang Yue, Zhiqi Chen, Rui Lu, et al.
发布日期: 4/24/2025

CLIMB:基于聚类的迭代数据混合引导语言模型预训练
Shizhe Diao, Yu Yang, Yonggan Fu, et al.
发布日期: 4/24/2025

在非策略指导下学习推理
Jianhao Yan, Yafu Li, Zican Hu, et al.
发布日期: 4/24/2025

BitNet b1.58 2B4T 技术报告
Shuming Ma, Hongyu Wang, Shaohan Huang, et al.
发布日期: 4/24/2025

反蒸馏抽样
Yash Savani, Asher Trockman, Zhili Feng, et al.
发布日期: 4/24/2025

将临床 MRI 档案重新用于多发性硬化症研究,从旧扫描中获得新见解
Philipp Goebl, Jed Wingrove, Omar Abdelmannan, et al.
发布日期: 4/23/2025