知道网络,值得您信赖的企业网络营销整合专家!
点击咨询

网站地图 | 在线留言 | 网站导航

24小时服务热线:400-999-0532

 当前位置:网站首页>>新闻中心
 企业理念
 成为中国有影响力的企业网络营销整合专家!
 
 时事新闻
DeepSeek知乎披露开源周数据
日期:[2025-3-3 13:38:57]   共阅[55]次

DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。

u=1355973419,256657308&fm=30&app=106&f=JPEG.jpg

文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

值得一提的是,文章还率先披露了DeepSeek的成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”

据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论和赞叹。

“话不多说,DeepSeek和OpenAI一样重要。”知乎大模型话题优秀答主、算法工程师“刘聪NPL”如此评价。业内人士甚至认为,“DeepSeek开源周”的重要性已经超过了不久前OpenAI的发布会。DeepSeek用“量大管饱”的开源有力回击了欧美关于DeepSeek故意说低训练成本的说法,并且证明了在训练链路上存在极大的优化空间。“刘聪NPL”在开源周最后一天就感叹:“真没想到,最后一天DeepSeek对存储下手啊!”而知乎编程话题优秀答主“平凡”在第三天就做出判断:“这些工作几乎不可能在国外的AI公司里面完成。”

 

来源:环球网科技频道

【字体:   【背景色 -               关闭
上一篇: 【知道网络】网站优化的选词技巧有哪些
下一篇: 【知道网络】网站建设是企业数字化转型的基石
   相关文章
【知道网络】网站建设是企业数字化转型的基石 [03/07]
【知道网络】网站优化的选词技巧有哪些 [02/27]
【知道网络】企业网站建设的意义何在 [02/24]
百度2024年财报:智能云Q4同比增长26% [02/19]
【知道网络】提升网站优化排名的方法有哪些 [02/18]
谷歌AI大佬:DeepSeek或是中国“最好的作品” [02/13]
 
网站首页 | 公司简介 | 产品服务 | 新闻中心 | 案例中心 | 服务支持 | 人才招聘 | 在线留言 | 联系我们
版权所有:青岛知道网络有限公司 鲁ICP备09082229号-5 员工信息查询 进入【知道网络(2015版)官网
青岛网络公司,知道网络值得您信赖!服务项目:网站建设、网络营销推广、网站优化、400电话、微信公众号及微信营销 | 网站地图