第二支羽毛

ScholarCopilot：借助精准引用训练大语言模型助力学术写作

ScholarCopilot：借助精准引用训练大语言模型助力学术写作在学术写作中，精准引用与优质文本生成至关重要，现有检索 - 增强生成系统却难以满足需求。今天为大家带来一篇研究成果介绍，文中提出的ScholarCopilot框架，能训练大语言模型助力学术写作。它表现如何？又有哪些创新？快来一探究

开源

Qwen2.5-Max：对标DeepSeek V3

Qwen2.5-Max：对标DeepSeek V3 Qwen2.5-Max：阿里巴巴挑战DeepSeek V3的新AI巨头大语言模型（LLMs）彻底改变了AI领域，实现了从聊天机器人到复杂推理系统等众多应用。这些模型依赖大量数据和计算能力，随着规模的扩大，它们的能力也在不断提升。这一进步背后的关键

开源

深度探索：DeepSeek-R1 如何从零开始训练，以及这项开源研究将如何以前所未有的速度推动 AI 进步

近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容 LLM架构专栏

开源

开源 AI 大升级！DeepSeek 发布 Janus Pro 7B 多模态模型，免费又强大！

DeepSeek发布了Janus Pro 7B。这是一款免费的多模态AI，它不仅能精准理解图像，还能根据文本生成高质量的视觉图像。那些单一功能的模型可以退下了，Janus Pro来统一AI的 “视觉” 与 “想象力” 了。接下来咱们详细分析一下，为什么这次发布引起了广泛关注，以及你现在就能上手使用

开源

Meta发布Llama 4：开源AI新巨头震撼登场！

在OpenAI与谷歌为争夺最佳生成式人工智能（GenAI）模型激战正酣之时，Meta终于苏醒，推出全新Llama 4系列模型，并且完全开源，这下AI圈可热闹啦！ Llama 4究竟是什么“宝藏”？ Llama 4可不是单枪匹马的一个大语言模型（LLM），而是一个“大家族”。Meta发布的这一系列包含

开源