第二支羽毛

大模型论文精选||多智能体微调：通过多样推理链实现自我提升

多智能体微调是一种实现自我提升的补充方法，它将微调应用于语言模型的多智能体群体。一组均基于相同基础模型的语言模型，通过模型间的多智能体交互生成的数据，分别对各个模型进行更新，实现独立的专业化。通过在不同的数据集上训练每个模型，这种方法能够让各个模型实现专业化，并使整个模型集合更加多样化。方法多智

基础模型 Agent

大模型论文精选|| 多 LLM 文本摘要：创新方法与卓越成果

多LLM文本摘要：创新方法与卓越成果论文 https://arxiv.org/abs/2412.15487 Multi-LLM Text Summarization 2412.15487 多LLM摘要框架在每一轮对话中有两个至关重要的步骤：生成和评估。根据使用的是多LLM去中心化摘要还是中心化摘要

LLM架构基础模型

ViT功能可视化：探索视觉Transformer学到了什么？

ViT功能可视化：探索视觉Transformer学到了什么

多模态

清华 ReST-MCTS*：基于过程奖励引导树搜索的 LLM 自训练深度剖析

基础模型

3月AI论文精选十篇

1. Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders 核心贡献：通过稀疏自编码器揭示AI生成文本的检测特征，提出基于特征分布的鉴别方法。研究发现，AI文本在稀疏编码空间中呈现独特的"高频低幅

论文速递

03.31-04.06 论文速递聚焦具身智能、复杂场景渲染、电影级对话生成等前沿领域

论文速递

🌟 论文速递 | 2025.03.31-04.06 📢 聚焦具身智能、复杂场景渲染、电影级对话生成等前沿领域 1️⃣ 具身智能体：从脑启发到安全协作系统论文标题： Advances and Challenges in Foundation Agents: From Brain-Inspired

大模型论文解读：VidTok：通过紧凑令牌化重新思考视频处理

论文： VidTok A Versatile and Open-Source Video Tokenizer 考虑观看一段繁忙街道的视频：建筑物、树木和道路在每一帧中几乎保持不变，而只有人和车辆在移动。传统的视频处理方法将每一帧作为独立的图像进行分析，这意味着它们最终会处理大量重复的信息，而没有利用

多模态

万字解析非结构化文档中的隐藏价值：多模态检索增强生成（RAG）的前景

本文将深入探讨两种创新的多模态文档检索方法 ——ColPali 和 ColFlor。它们在多模态 RAG 技术领域表现卓越，正重塑着文档处理的格局。我们不仅会剖析其系统结构、性能优势，还将通过实际案例展示它们在处理文档时的出色表现 |文末点击阅读原文查看网页版| 更多专栏文章点击查看：

LLM架构多模态

大模型论文解读：自然语言系统生成文本质量评估新框架： G-Eval

|文末点击阅读原文查看网页版| 更多专栏文章点击查看： LLM 架构专栏

大模型论文

ReSearch框架：通过强化学习推理搜索的LLM框架

基础模型

论文与代码论文：https://arxiv.org/abs/2503.19470 代码：https://github.com/Agent-RL/ReSearch 摘要将推理与外部搜索过程集成颇具挑战，尤其是针对复杂多跳问题。本文提出ReSearch框架，通过强化学习训练大语言模型（LLMs）进行