第二支羽毛|吹灭读书灯，一身都是月

DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建

DeepSeek R1重磅开源！一文读懂训练方法与RAG应用搭建 DeepSeek R1学习方法概述 DeepSeek R1的特点在于使用强化学习（RL）进行后期训练。一般来说，大规模语言模型的开发要经过以下几个步骤：预训练：利用大规模语料库创建一个 “预测下一个单词” 的模型。监督微调（SFT

RAG

DeepSeek-R1：通过强化学习激发大语言模型的推理潜能在本文中，我们将深入探索DeepSeek-R1背后的前沿进展与创新方法。这一成果作为提升大语言模型（LLMs）推理能力的卓越方案，融合了强化学习（RL）等前沿技术，不仅革新了模型训练范式，还为行业发展开辟了新方向。接下来，让我们一同揭开D

强化学习

📖阅读时长：20分钟 🕙发布时间：2025-02-02 近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏知乎

LLM架构

LLM架构

微调特定于域的搜索的文本嵌入：附Python代码详解 📖阅读时长：20分钟 🕙发布时间：2025-02-02 近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

一文读懂 GenPRM：用生成推理扩展过程奖励模型测试时间计算论文链接代码链接模型链接参考文献：GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning by Zhao et al.

基础模型

向量相似性搜索与图数据库：数据处理的创新融合近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏

RAG

使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT，以实现更智能的 AI 传统的检索增强生成（RAG）系统在生成具备上下文感知的答案方面表现出色。然而，它们往往存在以下不足：精确性不足：单次推理可能会忽略复杂查询中的细微差别。理解不够深入：若没有迭代过程，输出结果可能无法全面解决

LLM架构 RAG

DeepSeek R1：了解GRPO和多阶段训练近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

LLM架构

近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

开源

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI，它不仅能精准理解图像，还能根据文本生成高质量的视觉图像。那些单一功能的模型可以退下了，Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下，为什么这次发布引起了广泛关注，以及你现在就能上手使用

开源