第二支羽毛|吹灭读书灯，一身都是月

向量相似性搜索与图数据库：数据处理的创新融合

向量相似性搜索与图数据库：数据处理的创新融合近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏

RAG

使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT，以实现更智能的 AI 传统的检索增强生成（RAG）系统在生成具备上下文感知的答案方面表现出色。然而，它们往往存在以下不足：精确性不足：单次推理可能会忽略复杂查询中的细微差别。理解不够深入：若没有迭代过程，输出结果可能无法全面解决

LLM架构 RAG

DeepSeek R1：了解GRPO和多阶段训练近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

LLM架构

近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

开源

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI，它不仅能精准理解图像，还能根据文本生成高质量的视觉图像。那些单一功能的模型可以退下了，Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下，为什么这次发布引起了广泛关注，以及你现在就能上手使用

开源

多智能体微调是一种实现自我提升的补充方法，它将微调应用于语言模型的多智能体群体。一组均基于相同基础模型的语言模型，通过模型间的多智能体交互生成的数据，分别对各个模型进行更新，实现独立的专业化。通过在不同的数据集上训练每个模型，这种方法能够让各个模型实现专业化，并使整个模型集合更加多样化。方法多智

Agent 基础模型

多LLM文本摘要：创新方法与卓越成果论文 https://arxiv.org/abs/2412.15487 Multi-LLM Text Summarization 2412.15487 多LLM摘要框架在每一轮对话中有两个至关重要的步骤：生成和评估。根据使用的是多LLM去中心化摘要还是中心化摘要

LLM架构基础模型