DeepSeek出圈
近日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一,其竞技场得分达到1357分,略超OpenAI o1的1352分。一夜间,DeepSeek在全世界科技界刷屏!
在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型。1月20日,DeepSeek在官微上发布了DeepSeek-R1,性能对标OpenAI o1正式版。DeepSeek-R1的发布震动了美国科技界,不仅因其性能上比肩OpenAI o1,且完全开源,还以极低的成本实现了这一突破。
据官方消息披露,DeepSeek-R1 API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。
AI科技初创公司ScaleAI创始人Alexandr Wang称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。DeepSeek的AI大模型性能大致与美国最好的模型相当。
DeepSeek让Meta的生成式AI团队陷入恐慌。Meta CEO扎克伯格宣布加速研发Llama4,计划投资650亿美元扩建数据中心,并部署130万枚GPU以“确保2025年Meta AI成为全球领先模型”。
在此背景下,华尔街的一些巨头股价也因对AI领域整体泡沫风险的认识而受到影响,NVIDIA的股价在上周五下跌3.12%,创下了CES展后最大单日跌幅。
国产之光 DeepSeek概念梳理
- 算力供应商:
- 浪潮信息:为DeepSeek提供AI服务器集群。
- 中科曙光:承建DeepSeek杭州训练中心液冷系统。
- 航锦科技:为DeepSeek提供光模块和交换机。
- 润泽科技:为DeepSeek提供机柜资源。
- 数据提供商:
- 每日互动:提供语料数据,双方高管有关联。
- 卓创资讯:与幻方在金融语料方面合作。
- 金证股份:为DeepSeek提供语料数据。
- 业务合作方:
- 拓尔思:联合开发金融舆情大模型。
- 科大讯飞:接入DeepSeek - Math模型。
- 金山办公:接入DeepSeek - WriterAPI。
- 南威软件:与DeepSeek技术方向契合。
- 竞业达:与DeepSeek大模型对接中。
- 股权关联方:
- 浙江东方:间接参投DeepSeek天使轮。
- 华金资本:间接参投DeepSeek Pre - A轮融资。
免责声明:本栏目所载文章和数据仅供投资者作参考之用,不保证其内容的准确性、完整性,不构成投资建议,据此操作产生的盈亏风险自负。市场有风险,投资须谨慎!