DeepSeek-V3 的Q4_k_m 量化版本下载!

DeepSeek-V3 是由国人工智能公司DeepSeek开发的最新开源大型语言模型(LLM),于2024年12月发布。

该模型采用了混合专家(Mixture-of-Experts,MoE)架构,拥有总计6710亿参数,每个token激活其中的370亿参数。

在性能方面,DeepSeek-V3在多项基准测试中表现出色,超越了Llama 3.1和Qwen 2.5等模型,并与GPT-4o和Claude 3.5 Sonnet等先进的闭源模型相媲美。

以下是DeepSeek-V3与一些同类模型(如Llama 3.1、GPT-4、Claude 3.5 Sonnet、Qwen 2.5等)的参数对比表:

模型名称 总参数量 激活参数量 架构 推理速度 训练成本 发布时间
DeepSeek-V3 6710亿 370亿 混合专家(MoE) 60 tokens/s $5.58M 2024年12月
Llama 3.1 3200亿 3200亿 Transformer 25 tokens/s 未公开 2024年11月
GPT-4o 1万亿 1万亿 Transformer 15 tokens/s 超过$100M 2024年6月
Claude 3.5 8500亿 8500亿 Transformer 18 tokens/s 未公开 2024年10月
Qwen 2.5 4300亿 4300亿 基于Transformer改进 30 tokens/s 未公开 2024年11月

详细说明

  1. 总参数量:表示模型的总参数规模,通常决定了模型的容量。
  2. 激活参数量:对于MoE架构,表示每次推理激活的参数量;而标准Transformer架构通常等于总参数量。
  3. 架构:DeepSeek-V3采用混合专家架构,能够高效激活部分专家参数,从而提升推理速度和能效。
  4. 推理速度:DeepSeek-V3的推理速度领先,适合实时应用场景。
  5. 训练成本:DeepSeek-V3显示了开源模型在成本控制上的优势,与闭源模型(如GPT-4)形成鲜明对比。
  6. 发布时间:DeepSeek-V3是目前最新的开源模型之一,适应了最新的研究进展和需求。

图片[1]-DeepSeek-V3 的Q4_k_m 量化版本下载!-零度博客

此外,DeepSeek-V3在推理速度上也取得了显著突破,推理速度比之前的模型提高了3倍,达到每秒60个token。

值得注意的是,DeepSeek-V3的训练成本约为558万美元,耗时约55天,显示了在有限资源下的高效优化能力。

用户可以通过DeepSeek的官方网站免费体验DeepSeek-V3,或通过API进行集成。

此外,DeepSeek-V3的模型权重已在GitHub上开源,开发者可以下载并在本地进行部署。

总体而言,DeepSeek-V3作为开源模型,在性能和效率上均达到了当前的领先水平,为人工智能领域的研究和应用提供了强大的工具。

而且现在已经放出了 DeepSeek-V3 的Q4_k_m 量化版本了,大小比原本的小一半。

DeepSeek-V3 的Q4_k_m 量化版本:点击下载

图片[2]-DeepSeek-V3 的Q4_k_m 量化版本下载!-零度博客
THE END
喜欢就支持一下吧
点赞1628 分享
Notion 添加中文语言!实现全平台的汉化教程!支持客户端、网页版、手机端等 | 零度解说-零度博客
本地部署 Llama3 - 8B/70B 大模型!最简单的方法: 支持CPU /GPU运行 【3种方案】-零度博客

本地部署 Llama3 – 8B/70B 大模型!最简单的方法: 支持CPU /GPU运行 【3种方案】

目前在开源大模型领域,Llama3 无疑是最强的!这次Meta不仅免费公布了 8B和70B两个性能强悍的大模型,400B也即将发布,这是可以和GPT-4对打的存在!今天我们就来介绍3各本地部署方法,简单易懂...
admin的头像-零度博客admin
2.5W+2178
小心英特尔——AMD 可能会在 4 月发布大量新的 Ryzen CPU-零度博客

小心英特尔——AMD 可能会在 4 月发布大量新的 Ryzen CPU

下个月将推出 10 款新的 Ryzen 处理器? 据新传闻称,AMD 可能将在整个 4 月份推出 10 款新的Ryzen 处理器。 这来自Wccftech,其消息来源声称将推出大量 CPU,主要来自当前的Ryzen 5000系列,但...
admin的头像-零度博客admin
1.5W+2251
Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟-零度博客

Chrome 限制广告拦截扩展的“Manifest V3”计划被推迟

Manifest V3 转换再次延迟,让各地的 Chrome 用户松了一口气。 几年来,谷歌一直想取消 Chrome 当前的扩展系统,转而支持一个更有限的扩展系统,对过滤阻止广告和/或保护用户隐私的扩展程序设置...
admin的头像-零度博客admin
1.6W+1091
对印第一安纳波利斯房局的勒索软件攻击泄露了 200,000 名居民的敏感信息-零度博客

对印第一安纳波利斯房局的勒索软件攻击泄露了 200,000 名居民的敏感信息

印第安纳波利斯住房局通知超过 200,000 人,他们的信息(包括社会安全号码等)在 9 月份开始的勒索软件攻击中泄露。 由联邦的机构负责为印第安纳波利斯印第安纳波利斯低收入租户住房。。。。。...
admin的头像-零度博客admin
1.2W+6539
这9款软件,让你的电脑用起来更顺手!-零度博客

这9款软件,让你的电脑用起来更顺手!

  1.谷歌浏览器:https://www.google.com/intl/zh-CN/chrome 2.IDM官方版:https://www.internetdownloadmanager.com IDM 开心版:【点击前往】 3.小红伞杀毒软件:https://www.avira.com ...
admin的头像-零度博客admin
1.1W+3250
Wordpress安装教程-零度博客

WordPress安装教程

1、网站主机/VPS要求 要流畅运行 WordPress,我建议大家使用VPS, 内存1G , 硬盘20G足够 推荐大家使用Vultr的洛杉矶或西雅图的机房 : [点击进入] 环境 :Linux+Nginx ( Apache )+Mysql+Php php :...
Google 的 ChatGPT-killer 现已向所有人开放,包含新功能!-零度博客

Google 的 ChatGPT-killer 现已向所有人开放,包含新功能!

  Google Bard 官网 :https://bard.google.com 在周三的谷歌 I/O 大会上,谷歌宣布其类似 ChatGPT 的人工智能助手Bard在 180 多个国家/地区广泛可用,没有候补名单。它还宣布更新,例如对...
admin的头像-零度博客admin
1.3W+6539
Windows 11 中使用 Win10的文件资源管理器!速度立马起飞-零度博客

Windows 11 中使用 Win10的文件资源管理器!速度立马起飞

Windows 11的文件资源管理器功能丰富,但性能略逊于Windows 10版本。新版本增加了选项卡、现代UI和预览窗格等功能,但也导致运行速度变慢。因此,一些用户更偏好旧版本的简洁和快速,甚至怀念经典的...
admin的头像-零度博客admin
2.7W+2183