宇宙
生活
随笔
大模型
RAG
强化学习
Agent
LLM架构
论文
论文速递
机器学习
多模态
基础模型
理论基础
开源
大模型
强化学习
Agent
LLM架构
论文
机器学习
多模态
基础模型
知识库
分类
标签
归档
上网导航
1
2W8000字读懂GPT全家桶:从GPT-1到O1的技术演进与突破
2
强化学习详解第三部分:蒙特卡洛与时间差分学习,从经验中学习
3
2W8000字深度剖析25种RAG变体
4
万字解析非结构化文档中的隐藏价值:多模态检索增强生成(RAG)的前景
5
2w字解析量化技术,全网最全的大模型量化技术解析
登录
柏企
吹灭读书灯,一身都是月
累计撰写
95
篇文章
累计创建
16
个分类
累计收获
160
个点赞
导航
宇宙
生活
随笔
大模型
RAG
强化学习
Agent
LLM架构
论文
论文速递
机器学习
多模态
基础模型
理论基础
开源
大模型
强化学习
Agent
LLM架构
论文
机器学习
多模态
基础模型
知识库
分类
标签
归档
上网导航
目录
分类
开源
ScholarCopilot:借助精准引用训练大语言模型助力学术写作
ScholarCopilot:借助精准引用训练大语言模型助力学术写作 在学术写作中,精准引用与优质文本生成至关重要,现有检索 - 增强生成系统却难以满足需求。今天为大家带来一篇研究成果介绍,文中提出的ScholarCopilot框架,能训练大语言模型助力学术写作。它表现如何?又有哪些创新?快来一探究
2025-04-13 19:29
6
0
3
30.6℃
开源
Qwen2.5-Max:对标DeepSeek V3
Qwen2.5-Max:对标DeepSeek V3 Qwen2.5-Max:阿里巴巴挑战DeepSeek V3的新AI巨头 大语言模型(LLMs)彻底改变了AI领域,实现了从聊天机器人到复杂推理系统等众多应用。这些模型依赖大量数据和计算能力,随着规模的扩大,它们的能力也在不断提升。这一进步背后的关键
2025-04-12 21:31
3
0
1
26.3℃
开源
深度探索:DeepSeek-R1 如何从零开始训练,以及这项开源研究将如何以前所未有的速度推动 AI 进步
近日热文:全网最全的神经网络数学原理(代码和公式)直观解释 欢迎关注知乎和公众号的专栏内容 LLM架构专栏
2025-04-10 21:06
8
0
2
28.8℃
开源
开源 AI 大升级!DeepSeek 发布 Janus Pro 7B 多模态模型,免费又强大!
DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI,它不仅能精准理解图像,还能根据文本生成高质量的视觉图像。 那些单一功能的模型可以退下了,Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下,为什么这次发布引起了广泛关注,以及你现在就能上手使用
2025-04-10 20:55
8
0
2
28.8℃
开源
Meta发布Llama 4:开源AI新巨头震撼登场!
在OpenAI与谷歌为争夺最佳生成式人工智能(GenAI)模型激战正酣之时,Meta终于苏醒,推出全新Llama 4系列模型,并且完全开源,这下AI圈可热闹啦! Llama 4究竟是什么“宝藏”? Llama 4可不是单枪匹马的一个大语言模型(LLM),而是一个“大家族”。Meta发布的这一系列包含
2025-04-06 11:40
15
1
2
32.5℃
开源
弹