金炳万的丛林法则之握拳厨师:精品人伦一区二区三区潘金莲 -点赞收藏!DeepSeek在GitHub星标量已超OpenAI
国产大模型深度求索(DeepSeek)正在与大洋彼岸的人工智能巨头OpenAI“掰手腕”。
2月7日,据全球最大代码托管平台GitHub显示,在两个月内,DeepSeek的Star量(星标)已经超过了OpenAI。截至18时,DeepSeek旗下热度最高的项目DeepSeek-V3大模型Star量达到7.82万,超越同平台中OpenAI最热门项目(6.93万)。Meta旗下的llama星标量最高超过5.7万,阿里旗下的Qwen 2.5星标量超1.4万。
据官方介绍,“星标”意味着被用户收藏,许多项目的评级取决于拥有的星标数量,“标星操作便于以后再次找到仓库或主题。可以对存储库和主题标星以跟踪感兴趣的项目,并在消息馈送中发现相关内容。”Github如此解释了标星的意义。
不过,有业内人士向澎湃新闻记者分析,由于DeepSeek是开源大模型,OpenAI未开源,最热门的是API案例和使用指南,在一定程度上会影响星标数量。星标数量不能完全代表两个大模型在能力上的区别,但是代表了AI行业整体的认可程度。
![](https://imgpai.thepaper.cn/newpai/image/1738924182784_e6i3DB_1738924189481.png?x-oss-process=image/resize,w_1024)
据研究公司SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI,后者已经存在了近两年。DeepSeek.com上周二的访问量达到了创纪录的4900万次,比前一周增长了614%。
DeepSeek因其开源、低成本等优势,成为近期最火热的话题之一。数据显示,DeepSeek应用上线20天,日活就突破了2000万。
据公开资料显示,DeepSeek旗下开放式V3模型训练成本为550万美元,明显低于美国类似解决方案的成本。同时,它的能力与ChatGPT的功能相当,但有一个重要的区别:该模型可以免费下载并在本地服务器上运行,也因此广受企业和组织关注。
由于DeepSeek的强大能力,引发全球性震动,尤其是引发美国科技公司集体性焦虑。据美国全国广播公司(NBC)报道,美国总统特朗普当地时间1月27日在佛罗里达州迈阿密举行的共和党会议上表示,中国人工智能初创公司DeepSeek的AI技术给美国科技企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。
海外科技巨头正在加速追赶,密集加快上新速度。当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking实验版,作为对近期走红的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回应。
同样是在2月5日,在谷歌Gemini模型上新的几小时后,OpenAI宣布ChatGPT Search向所有人开放,无需注册。目前,就同谷歌搜索一样,来到OpenAI官网首页就可以直接使用搜索功能。这对于谷歌而言无疑是一次巨大的冲击,不少网友调侃道“谷歌再见”,也有网友表示“感恩DeepSeek”。
2月6日,外交部发言人郭嘉昆主持例行记者会。韩联社记者提问,据报道,韩国的一些政府部门屏蔽对DeepSeek的访问,意大利、澳大利亚、印度、美国、日本等国家也传出禁止或限制使用DeepSeek的消息,一些企业也屏蔽了访问。对此,中方如何看待?
“我注意到有关情况,”郭嘉昆强调,中国政府高度重视并依法保护数据隐私和安全,从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念,将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。
在2月初,华为云、腾讯云、阿里云、百度智能云等国内主流云平台纷纷宣布上线DeepSeek旗下的R1大模型。海外各大云厂商和芯片厂商在更早之前就已纷纷宣布上线DeepSeek-R1模型。北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。据介绍,在单个英伟达HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达每秒3872 Token。英伟达竞争对手AMD也宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,针对Al推理进行了优化。