DeepSeek,继续在全球刷屏!
2月1日,#DeepSeek在美商标被梁文锋校友抢注#的话题冲上微博热搜。据新华每日电讯援引TC报道,一家总部位于美国特拉华州的名称为Delson Group的公司申请了DeepSeek商标。报道称,Delson Group的首席执行官兼创始人名为Willie Lu,后者与DeepSeek创始人梁文锋毕业于同一所大学——浙江大学。
另外,据华为云官方公众号2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
值得关注的是,最近几天,DeepSeek的热度居高不下。日前,英伟达、微软、亚马逊等AI巨头纷纷宣布,已接入DeepSeek。此外,或许是迫于DeepSeek带来的压力,OpenAI紧急上线新一代推理模型o3-mini,并首次向ChatGPT免费用户开放推理模型。
国泰君安指出,DeepSeek-R1以MIT License完全开源模型权重,并允许商用模型蒸馏,为开发者提供了二次创新的自由空间。这一策略推动中国首次在通用大模型开源领域占据技术制高点,增强全球AI 话语权。同时,开源生态可能加速行业技术路线趋同,通用大模型因同质化加剧竞争,只有拥有真正领先技术的企业才能在这种趋势中留存。因此,此次国产开源模型的突破有望重塑全球AIGC技术路线及产业格局。
在美商标被梁文锋校友抢注
据新华每日电讯援引TC报道称,近日,中国人工智能公司 DeepSeek成为大规模网络攻击的目标。现在,该公司似乎又面临新的麻烦:美国商标纠纷。另一家公司申请了DeepSeek商标:一家总部位于特拉华州的公司,名称为Delson Group Inc.
Delson Group 声称,它自2020年初以来一直在销售DeepSeek品牌的 AI 产品。其首席执行官兼创始人名为 Willie Lu。Willie Lu与 DeepSeek 创始人梁文锋毕业于同一所大学——浙江大学。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
DeepSeek在2024年12月26日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20日发布R1(对标GPT-o1)后,进一步出圈。根据点点数据,从DeepSeek在美国下载排名从1月22日的201名,迅速在1月27日登顶第一名;根据七麦数据,截至1月30日,DeepSeek在168个国家位居下载榜第一名。
1月24日,著名投资公司A16z的创始人马克·安德森发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。最具煽动性的评价来自ScaleAI创始人亚历山大·王(AlexandrWang)。他说:过去十年来,美国可能一直在AI竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
AI巨头纷纷接入DeepSeek
1月31日,英伟达(NVIDIA)宣布,NVIDIA NIM已经可以使用DeepSeek-R1。英伟达官网当天发布文章指出,DeepSeek-R1是具备最先进推理能力的开放模型,比起直接提供响应,像DeepSeek-R1这样的推理模型,会对查询进行多次推理处理,使用连锁思维、共识和搜寻方法来生成最佳答案。
上述文章写道,为了帮助开发者安全地试验这些功能,并构建自己的专门代理,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版上线使用。
报道称,DeepSeek先前横空出世重创美国科技股,一度影响英伟达股价重挫17%,引发讨论。英伟达先前也发声,指DeepSeek的进步,代表了英伟达芯片对于内地市场的可用性,而未来,DeepSeek会需要更多英伟达芯片满足服务的需求。
另据参考消息援引台湾东森新闻网报道,近日,与OpenAI是密切合作伙伴的微软宣布,目前已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。
微软作为OpenAI的最大股东,长期资助OpenAI之余,还深度整合其AI技术,因此将DeepSeek-R1正式纳入的消息曝光后,外界十分关注微软为何在OpenAI对DeepSeek进行调查的同时,仍决定将R1模型纳入其AI服务。
微软强调,DeepSeek-R1模型已通过“严格的红队测试与安全评估”,并经历“模型行为自动化检测与广泛的安全审查,以降低潜在风险”。
微软也在声明中提到,后续微软仍会持续评估DeepSeek-R1模型,并可能进行一定程度的调整与优化,以提升其准确度及审查机制。
1月31日,亚马逊云科技也宣布,客户现已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客户还可以通过Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
OpenAI首次向免费用户开放推理模型
DeepSeek的爆火,使得全球在AI领域的竞争进一步白热化。当地时间1月31日,OpenAI正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。
OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。
据OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。开发者可根据场景需求,灵活选择低、中、高三级推理强度,使模型在应对复杂挑战时能“深度思考”,或在需要快速响应时优先保证速度。
ChatGPT Plus、Team及Pro用户即日(1月31日)可体验o3-mini,企业用户将在一周后获得访问权限。即日(1月31日)起,免费版用户也可通过消息编辑器选择“推理”模式或重新生成回复来试用o3-mini,这是ChatGPT首次向免费用户开放推理模型。
在OpenAI发布新模型o3-mini后,麻省理工知名AI研究科学家、著名科技播客主持人评价该模型称,OpenAI的o3-mini是个不错的模型,DeepSeek的R1性能和它差不多,但价格更便宜,且能展示推理过程。更好的模型会不断出现(很期待o3 Pro 面世),但 “DeepSeek 时刻” 意义非凡。5年后人们仍会铭记这一伟大时刻,是科技史上的关键节点,部分原因是其地缘政治影响,当然还有诸多其他缘由。
机构:DeepSeek重构大模型生态
DeepSeek日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于OpenAI开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响还波及了资本市场。
从定价看,DeepSeek-R1不仅开源,API(接口)价格还明显低于GPT-o1。DeepSeek-R1输入(缓存命中)、输出定价分别为每百万tokens 1元、6元,低于GPT-o1的55元、438元,具备性价比优势。
国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。
国泰君安指出,DeepSeek-R1以开源、高性能及低成本API对标OpenAI o1。其蒸馏模型的优异表现将支持消费电子、智能驾驶等终端AI的部署,开源策略将重整通用模型竞争格局,大模型的商业化落地将在DeepSeek 的低价API支持下加速,未来垂类应用也有望加速创新迭代。该券商表示,R1在后训练阶段通过大规模强化学习技术,在极少标注数据下提升推理能力,验证了算法优化的高效性。这一技术突破打破了海外企业在复杂任务上的技术垄断,为中国大模型技术参与全球竞争提供了实证支撑。
长江证券也表示,国产模型推理能力对齐业界领先水平,看好推理算力与应用侧受益。一方面,国产推理模型持续迭代,推理侧的scaling up将带来推理算力需求的显著提升;另一方面,通过利用DeepSeek-R1整理的80万个样本进行微调,小型模型推理能力显著提升,或加速垂类模型应用落地进程。
DeepSeek,继续在全球刷屏!
2月1日,#DeepSeek在美商标被梁文锋校友抢注#的话题冲上微博热搜。据新华每日电讯援引TC报道,一家总部位于美国特拉华州的名称为Delson Group的公司申请了DeepSeek商标。报道称,Delson Group的首席执行官兼创始人名为Willie Lu,后者与DeepSeek创始人梁文锋毕业于同一所大学——浙江大学。
另外,据华为云官方公众号2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
值得关注的是,最近几天,DeepSeek的热度居高不下。日前,英伟达、微软、亚马逊等AI巨头纷纷宣布,已接入DeepSeek。此外,或许是迫于DeepSeek带来的压力,OpenAI紧急上线新一代推理模型o3-mini,并首次向ChatGPT免费用户开放推理模型。
国泰君安指出,DeepSeek-R1以MIT License完全开源模型权重,并允许商用模型蒸馏,为开发者提供了二次创新的自由空间。这一策略推动中国首次在通用大模型开源领域占据技术制高点,增强全球AI 话语权。同时,开源生态可能加速行业技术路线趋同,通用大模型因同质化加剧竞争,只有拥有真正领先技术的企业才能在这种趋势中留存。因此,此次国产开源模型的突破有望重塑全球AIGC技术路线及产业格局。
据新华每日电讯援引TC报道称,近日,中国人工智能公司 DeepSeek成为大规模网络攻击的目标。现在,该公司似乎又面临新的麻烦:美国商标纠纷。另一家公司申请了DeepSeek商标:一家总部位于特拉华州的公司,名称为Delson Group Inc.
Delson Group 声称,它自2020年初以来一直在销售DeepSeek品牌的 AI 产品。其首席执行官兼创始人名为 Willie Lu。Willie Lu与 DeepSeek 创始人梁文锋毕业于同一所大学——浙江大学。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
DeepSeek在2024年12月26日推出V3(对标GPT4o),因其显著的性能,用户迅速开始增长,同时在1月20日发布R1(对标GPT-o1)后,进一步出圈。根据点点数据,从DeepSeek在美国下载排名从1月22日的201名,迅速在1月27日登顶第一名;根据七麦数据,截至1月30日,DeepSeek在168个国家位居下载榜第一名。
1月24日,著名投资公司A16z的创始人马克·安德森发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。最具煽动性的评价来自ScaleAI创始人亚历山大·王(AlexandrWang)。他说:过去十年来,美国可能一直在AI竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
1月31日,英伟达(NVIDIA)宣布,NVIDIA NIM已经可以使用DeepSeek-R1。英伟达官网当天发布文章指出,DeepSeek-R1是具备最先进推理能力的开放模型,比起直接提供响应,像DeepSeek-R1这样的推理模型,会对查询进行多次推理处理,使用连锁思维、共识和搜寻方法来生成最佳答案。
上述文章写道,为了帮助开发者安全地试验这些功能,并构建自己的专门代理,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版上线使用。
报道称,DeepSeek先前横空出世重创美国科技股,一度影响英伟达股价重挫17%,引发讨论。英伟达先前也发声,指DeepSeek的进步,代表了英伟达芯片对于内地市场的可用性,而未来,DeepSeek会需要更多英伟达芯片满足服务的需求。
另据参考消息援引台湾东森新闻网报道,近日,与OpenAI是密切合作伙伴的微软宣布,目前已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。
微软作为OpenAI的最大股东,长期资助OpenAI之余,还深度整合其AI技术,因此将DeepSeek-R1正式纳入的消息曝光后,外界十分关注微软为何在OpenAI对DeepSeek进行调查的同时,仍决定将R1模型纳入其AI服务。
微软强调,DeepSeek-R1模型已通过“严格的红队测试与安全评估”,并经历“模型行为自动化检测与广泛的安全审查,以降低潜在风险”。
微软也在声明中提到,后续微软仍会持续评估DeepSeek-R1模型,并可能进行一定程度的调整与优化,以提升其准确度及审查机制。
1月31日,亚马逊云科技也宣布,客户现已可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。此外,客户还可以通过Amazon EC2、Amazon SageMaker AI,使用Amazon Trainium和Amazon Inferentia部署DeepSeek-R1-Distill。
DeepSeek的爆火,使得全球在AI领域的竞争进一步白热化。当地时间1月31日,OpenAI正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。
OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。
据OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率分别为70.6%、76.8%和79.7%。开发者可根据场景需求,灵活选择低、中、高三级推理强度,使模型在应对复杂挑战时能“深度思考”,或在需要快速响应时优先保证速度。
ChatGPT Plus、Team及Pro用户即日(1月31日)可体验o3-mini,企业用户将在一周后获得访问权限。即日(1月31日)起,免费版用户也可通过消息编辑器选择“推理”模式或重新生成回复来试用o3-mini,这是ChatGPT首次向免费用户开放推理模型。
在OpenAI发布新模型o3-mini后,麻省理工知名AI研究科学家、著名科技播客主持人评价该模型称,OpenAI的o3-mini是个不错的模型,DeepSeek的R1性能和它差不多,但价格更便宜,且能展示推理过程。更好的模型会不断出现(很期待o3 Pro 面世),但 “DeepSeek 时刻” 意义非凡。5年后人们仍会铭记这一伟大时刻,是科技史上的关键节点,部分原因是其地缘政治影响,当然还有诸多其他缘由。
DeepSeek日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于OpenAI开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响还波及了资本市场。
从定价看,DeepSeek-R1不仅开源,API(接口)价格还明显低于GPT-o1。DeepSeek-R1输入(缓存命中)、输出定价分别为每百万tokens 1元、6元,低于GPT-o1的55元、438元,具备性价比优势。
国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。
国泰君安指出,DeepSeek-R1以开源、高性能及低成本API对标OpenAI o1。其蒸馏模型的优异表现将支持消费电子、智能驾驶等终端AI的部署,开源策略将重整通用模型竞争格局,大模型的商业化落地将在DeepSeek 的低价API支持下加速,未来垂类应用也有望加速创新迭代。该券商表示,R1在后训练阶段通过大规模强化学习技术,在极少标注数据下提升推理能力,验证了算法优化的高效性。这一技术突破打破了海外企业在复杂任务上的技术垄断,为中国大模型技术参与全球竞争提供了实证支撑。
长江证券也表示,国产模型推理能力对齐业界领先水平,看好推理算力与应用侧受益。一方面,国产推理模型持续迭代,推理侧的scaling up将带来推理算力需求的显著提升;另一方面,通过利用DeepSeek-R1整理的80万个样本进行微调,小型模型推理能力显著提升,或加速垂类模型应用落地进程。