第二支羽毛

开源 AI 大升级！DeepSeek 发布 Janus Pro 7B 多模态模型，免费又强大！

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI，它不仅能精准理解图像，还能根据文本生成高质量的视觉图像。那些单一功能的模型可以退下了，Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下，为什么这次发布引起了广泛关注，以及你现在就能上手使用

开源

多智能体微调是一种实现自我提升的补充方法，它将微调应用于语言模型的多智能体群体。一组均基于相同基础模型的语言模型，通过模型间的多智能体交互生成的数据，分别对各个模型进行更新，实现独立的专业化。通过在不同的数据集上训练每个模型，这种方法能够让各个模型实现专业化，并使整个模型集合更加多样化。方法多智

Agent 基础模型

多LLM文本摘要：创新方法与卓越成果论文 https://arxiv.org/abs/2412.15487 Multi-LLM Text Summarization 2412.15487 多LLM摘要框架在每一轮对话中有两个至关重要的步骤：生成和评估。根据使用的是多LLM去中心化摘要还是中心化摘要

基础模型 LLM架构

“如果模型可以识别图像而无需针对该特定任务进行训练怎么办？”欢迎来到视觉语言模型的世界。更多专栏文章点击查看： LLM 架构专栏

LLM架构

ViT功能可视化：探索视觉Transformer学到了什么

多模态

利用大模型解决表格数据处理难题近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏知乎LLM专栏

LLM架构

探索 Microsoft AutoGen 框架：AI 协作的新前沿在众多的工具中，Microsoft 的 AutoGen 框架格外引人注目。它是一款强大的工具，专门用于创建和管理多Agent对话。通过这个框架，构建 AI 系统变得更加简便，这些系统能够利用Agent之间的交互，实现协作、推理，并解

Agent

评估语言模型一直是一项具有挑战性的任务。我们如何衡量一个模型是否真正理解语言、生成连贯的文本，或者给出准确的回复呢？在为此目的而开发的各种指标中，困惑度指标作为自然语言处理和语言模型（LM）评估领域中最基础且应用最广泛的评估指标之一，备受关注。困惑度自统计语言建模的早期就开始被使用，即便在大语言模

LLM架构

知识图谱（KG）与大型语言模型（LLM）：企业数据赋能的强强联合数据如同企业的生命线，而如何高效地利用数据则成为了企业发展的关键。大型语言模型（LLM）和知识图谱（KG）作为两种强大的数据处理工具，正逐渐改变着企业的运营模式。今天，我们就来深入探讨一下它们在企业中的应用以及如何协同工作，为企业带来

LLM架构

基础模型