DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建

DeepSeek R1重磅开源!一文读懂训练方法与RAG应用搭建 DeepSeek R1学习方法概述 DeepSeek R1的特点在于使用强化学习(RL)进行后期训练。一般来说,大规模语言模型的开发要经过以下几个步骤: 预训练:利用大规模语料库创建一个 “预测下一个单词” 的模型。 监督微调(SFT

RAG 

DeepSeek-R1:通过强化学习激发大语言模型的推理潜能

DeepSeek-R1:通过强化学习激发大语言模型的推理潜能 在本文中,我们将深入探索DeepSeek-R1背后的前沿进展与创新方法。这一成果作为提升大语言模型(LLMs)推理能力的卓越方案,融合了强化学习(RL)等前沿技术,不仅革新了模型训练范式,还为行业发展开辟了新方向。接下来,让我们一同揭开D

微调DeepSeek LLM:使用监督微调(SFT)与Hugging Face数据集的详细指南

📖阅读时长:20分钟 🕙发布时间:2025-02-02 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏 知乎LLM专栏 知乎

微调特定于域的搜索的文本嵌入:附Python代码详解


微调特定于域的搜索的文本嵌入:附Python代码详解 📖阅读时长:20分钟 🕙发布时间:2025-02-02 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏

一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算

一文读懂 GenPRM:用生成推理扩展过程奖励模型测试时间计算 论文链接 代码链接 模型链接 参考文献:GenPRM: Scaling Test-Time Compute of Process Reward Models via Generative Reasoning by Zhao et al.

向量相似性搜索与图数据库:数据处理的创新融合

向量相似性搜索与图数据库:数据处理的创新融合 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏 知乎LLM专栏

RAG 

使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI

使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI 传统的检索增强生成(RAG)系统在生成具备上下文感知的答案方面表现出色。然而,它们往往存在以下不足: 精确性不足:单次推理可能会忽略复杂查询中的细微差别。 理解不够深入:若没有迭代过程,输出结果可能无法全面解决

DeepSeek R1:了解 GRPO 和多阶段训练

DeepSeek R1:了解GRPO和多阶段训练 近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏

深度探索:DeepSeek-R1 如何从零开始训练,以及这项开源研究将如何以前所未有的速度推动 AI 进步

近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏

开源 

开源 AI 大升级!DeepSeek 发布 Janus Pro 7B 多模态模型,免费又强大!

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI,它不仅能精准理解图像,还能根据文本生成高质量的视觉图像。 那些单一功能的模型可以退下了,Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下,为什么这次发布引起了广泛关注,以及你现在就能上手使用

开源