第二支羽毛|吹灭读书灯，一身都是月

专家混合（MoE）大语言模型：免费的嵌入模型新宠

专家混合（MoE）大语言模型：免费的嵌入模型新宠今天，我们深入探讨一种备受瞩目的架构——专家混合（Mixture-of-Experts，MoE）大语言模型，它在嵌入模型领域展现出了独特的魅力。一、MoE 架构揭秘（一）MoE 是什么？ MoE 是一种包含多个被称为“专家”子网的架构，每个子网专

LLM架构

运行一个大模型需要多少GPU?

为大型语言模型（LLM）提供服务需要多少GPU内存？在人工智能领域，大型语言模型（LLM）已经成为推动自然语言处理和理解的关键技术。然而，随着模型规模的不断扩大，为这些模型提供服务所需的GPU内存也成为一个亟待解决的问题。本文将深入探讨如何估算为LLM提供服务的GPU内存需求，并提供实际应用的示例

理论基础

神经网络本质不过是初中生都会的复合函数？

理论基础

3月AI论文精选十篇

1. Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders 核心贡献：通过稀疏自编码器揭示AI生成文本的检测特征，提出基于特征分布的鉴别方法。研究发现，AI文本在稀疏编码空间中呈现独特的"高频低幅

论文速递

强化学习详解第四部分：函数逼近，让强化学习适用于复杂世界

我们在强化学习之旅中来到了关键节点到目前为止，我们探索的环境中，智能体可以明确表示每一个可能的状态 - 动作对。但一旦踏入现实世界的复杂环境，这种 “奢侈” 便不复存在。 |文末点击阅读原文查看网页版| 更多专栏文章点击查看：

强化学习

03.31-04.06 论文速递聚焦具身智能、复杂场景渲染、电影级对话生成等前沿领域

论文速递

🌟 论文速递 | 2025.03.31-04.06 📢 聚焦具身智能、复杂场景渲染、电影级对话生成等前沿领域 1️⃣ 具身智能体：从脑启发到安全协作系统论文标题： Advances and Challenges in Foundation Agents: From Brain-Inspired

Meta发布Llama 4：开源AI新巨头震撼登场！

在OpenAI与谷歌为争夺最佳生成式人工智能（GenAI）模型激战正酣之时，Meta终于苏醒，推出全新Llama 4系列模型，并且完全开源，这下AI圈可热闹啦！ Llama 4究竟是什么“宝藏”？ Llama 4可不是单枪匹马的一个大语言模型（LLM），而是一个“大家族”。Meta发布的这一系列包含

开源

大模型论文解读：VidTok：通过紧凑令牌化重新思考视频处理

论文： VidTok A Versatile and Open-Source Video Tokenizer 考虑观看一段繁忙街道的视频：建筑物、树木和道路在每一帧中几乎保持不变，而只有人和车辆在移动。传统的视频处理方法将每一帧作为独立的图像进行分析，这意味着它们最终会处理大量重复的信息，而没有利用

多模态

1W8000字从理论到实践： MCP 在 7 大 AI 框架中的具体应用

用Python和TypeScript框架，基于MCP服务器为LLM赋能，打造AI应用 MCP支持的AI框架 AI代理工具包为开发者开放了各种API，让AI解决方案具备执行任务的工具，确保能给出准确结果，提升用户满意度。然而，把这些工具集成到AI应用里并进行管理，过程往往很繁琐。本文将为你介绍一种行业

Agent

2W8000字深度剖析25种RAG变体

深度剖析25种RAG变体：全网最全~ 本文28000字符，阅读时长~~ 看速度每种框架均配有框架示意图。本文全面、深入探讨了 25 种 RAG 变体。从基本的标准 RAG 到 CRAT 和 Graph RAG 等高级框架 — 详细的架构、组件细分、流程和具体的代码级实现，以实现 LLM 的动态

LLM架构