最新论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

LiveCC:大规模流式语音转录中的视频LLM学习
Joya Chen, Ziyun Zeng, Yiqi Lin, et al.
发布日期: 4/23/2025

SilVar-Med:一种用于医学影像中可解释异常检测的语音驱动视觉语言模型
Tan-Hanh Pham, Chris Ngo, Trong-Duong Bui, et al.
发布日期: 4/23/2025

PROMPTEVALS:用于定制生产大型语言模型管道的断言和护栏数据集
Reya Vir, Shreya Shankar, Harrison Chase, et al.
发布日期: 4/23/2025

书界:从小说到创意故事生成的互动代理社会
Yiting Ran, Xintao Wang, Tian Qiu, et al.
发布日期: 4/23/2025

Progent:LLM代理的可编程权限控制
Tianneng Shi, Jingxuan He, Zhun Wang, et al.
发布日期: 4/23/2025

WALL-E 2.0:神经符号学习促进全球对齐 提升世界模型基础的LLM代理性能
Siyu Zhou, Tianyi Zhou, Yijun Yang, et al.
发布日期: 4/23/2025

CoMotion:并发多人3D运动
Alejandro Newell, Peiyun Hu, Lahav Lipson, et al.
发布日期: 4/23/2025

RF-DETR目标检测与YOLOv12的比较:在标签模糊的复杂果园环境下,针对单类和多类青果检测的Transformer架构与CNN架构的研究
Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, et al.
发布日期: 4/23/2025

从反思到完美:通过反思调整对文本到图像扩散模型的推理时间优化进行扩展
Le Zhuo, Liangbing Zhao, Sayak Paul, et al.
发布日期: 4/23/2025

RainbowPlus:通过进化质量多样性搜索增强对抗性提示生成
Quy-Anh Dang, Chris Ngo, Truong-Son Hy
发布日期: 4/23/2025