您好,欢迎访问这里是星空体育APP网站名称官网!
全国咨询热线+86 0000 88888
星空app·(中国)体育官方网站

星空体育新闻动态

NEWS CENTER XINGKONG
DeepSeek-V3发布继续关注AI产业推进星空体育全站app,
发布时间:2024-12-30 14:12浏览次数:

  民生证券近日发布传媒互联网行业周报:DeepSeek-V3发布,继续关注AI产业推进。

  本周观点:DeepSeek-V3发布,为低成本训练的高性能大模型,建议继续关注AI产业推进。

  12月26日,幻方量化宣布全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,接口配置无需改动。据官网公众号,该模型性能对齐海外领先闭源模型,且训练成本大幅降低。1)性能来看,该模型为自研MoE模型,拥有6710亿参数,在14.8万亿token上进行预训练。生成速度相比V2.5模型实现了3倍的提升,每秒吞吐量达60token。对比海外开源闭源模型来看,DeepSeek-V3多项评测成绩追平甚至超越Qwen2.5-72B、Llama-3.1-405B、GPT-4o、Claude-3.5-Sonnet等开闭源模型。2)官方同步调整API服务价格,为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。价格仅为Claude3.5Sonnet的1/53。3)训练成本来看,DeepSeek-V3训练总成本约557.6万美元,整体预训练仅用280万GPU小时,相比之下Llama3(450B版本)使用3080万GPU小时,后者几乎是前者的11倍。该成果得益于算法、框架和硬件的协同优化。

  该模型以较低的成本进行训练,性能较高,有助于开源生态的加速迭代,并极大降低外部使用者大模型使用成本。1)对于开发者而言DeepSeek-V3提供了一个兼顾高性能与可落地性的选项,降低了社区二次验证和复用的门槛,有助于开源生态加速迭代;2)MoE架构在推理阶段激活的参数仅占5%左右,实际部署兼顾了“速度”与“能力”,API价格相比其他模型有吸引力,可降低外部开发者大模型使用成本。建议关注已有AI产品发布星空体育全站app,,或者研发储备的各垂直应用公司,掌阅科技、值得买、中文在线、上海电影、博纳影业、华策影视、汤姆猫、果麦文化、天下秀、因赛集团、引力传媒、电广传媒、盛天网络等。

  2024年12月23日到12月27日,上证综指(0.95%),深证成指(0.13%),沪深300(1.36%),创业板指(-0.22%)。按照中信行业分类,在所有行业板块中,传媒(中信)(-7.61%)排名第31。

  国家新闻出版署:12月份共122款国产网络游戏获批;DeepSeek-V3正式发布;中文在线与国脉文化公司共建“AIGC+数字创意应用技术联合实验室”正式揭牌;抖音推出送礼物红包,大厂再次上演红包大战。

  【完美世界】关于出售资产的公告;【吉比特】关于股份回购实施结果暨股份变动的公告;【浙文互联】关于对外投资暨关联交易的公告

  建议持续把握AI+应用逐步落地,以及B端、C端用户真实反馈,关注商业模式的延展。同时建议重视具备优质资产的国有企业投资机遇,理解国有企业在新时期的业务拓展可能性和价值重估。目前传媒板块行业景气度仍在持续提升,建议继续沿新渠道+新内容方向布局。

  新电影上线表现不及预期、新技术发展不及预期、行业竞争加剧、新产品研发上线及表现不及预期。(民生证券 易永坚,李瑶,魏桢)

  免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  比特币将在2025年暴跌40%!?业内人士:特朗普或将在就职后几个月内推动比特币国家储备

  刷屏的DeepSeek-V3能力到底如何?国外评测报告:超越迄今为止所有开源模型!自称ChatGPT,真相或指向“AI污染”

  野村日本首席经济学家森田京平博士:日本有望在2025年成为一个“正常”经济体

  人民日报主管主办,专注能源行业报道的垂直媒体,是能源专业产经传媒平台。

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  vivo 内部 MR 团队已达 500 人,明年 9 月上线原型机体验星空体育APP,

在线客服
联系电话
全国免费咨询热线 +86 0000 88888
  • · 专业的设计咨询
  • · 精准的解决方案
  • · 灵活的价格调整
  • · 1对1贴心服务
在线留言
回到顶部