DeepSeek模型

维护时间：2026-05-03

阅读：27692

网站简介

DeepSeek模型是北京深度求索公司研发的多模态通用大模型，于2024年4月正式上线并通过算法备案，凭借极致性价比、开源特性和全栈国产适配能力，成为国产大模型的核心代表，颠覆行业定价逻辑，推动AI技术向普惠化、自主化落地，与Qwen、GLM等开源模型共同构建国产AI生态。

其核心优势鲜明，基于Transformer架构，融入MoE混合专家设计与稀疏注意力技术，迭代至V4版本总参数量可观，推理时仅激活部分参数，兼顾高性能与低计算成本，推理成本仅为GPT-4的1/70，且全栈适配华为昇腾等国产芯片，打破英伟达生态垄断。同时支持百万Token超长上下文，可高效处理海量文本，多模态能力突出，代码、数学推理表现比肩国际顶尖模型。

DeepSeek系列迭代清晰，产品线丰富：从初代版本逐步升级至V4系列，涵盖基础通用、代码专用、视觉推理等分支，包括DeepSeek-Coder、DeepSeek-VL等衍生模型，多数版本开源，其中V4版本开源后引发行业震动，持续优化推理效率与多模态能力，适配不同部署场景。

目前，DeepSeek模型已广泛应用于政务、跨境电商、医疗、教育等多领域，赋能中小企业降本增效，服务全球开发者，通过开放API与开源生态，推动AI技术从“实验室奢侈品”下沉为普惠基础设施，成为推动通用人工智能自主化、产业化落地的重要力量。

收录

集合导航

网站简介

Mimo模型

MiniMax模型

百川模型

Kimi模型

GLM模型

盘古大模型

打赏支持

文章反馈

收录