DeepSeek:中国新兴AI聊天机器人挑战全球科技巨头
DeepSeek,这家由中国量化对冲基金高飞资本管理公司支持的人工智能实验室,在本周因其聊天机器人应用登上苹果App Store和谷歌Play商店排行榜榜首而迅速进入公众视野。DeepSeek在2015年由AI爱好者梁文锋创立,最初作为一家对冲基金公司运营,专注于开发和部署AI算法。2023年,高飞资本成立了DeepSeek实验室,专门研究与金融业务分开的AI工具,随后该实验室独立为公司。 从一开始,DeepSeek就建立了自己的数据中心集群进行模型训练。然而,由于美国对硬件的出口禁令,DeepSeek只能使用Nvidia的H800芯片,这是H100的低功耗版本。DeepSeek的技术团队以年轻著称,主要从中国顶级高校招募博士级别的AI研究人员,同时也雇佣没有计算机科学背景的人才,以帮助其技术理解更广泛的主题。 DeepSeek于2023年11月发布了首批三款模型——DeepSeek Coder、DeepSeek LLM和DeepSeek Chat。真正引起行业关注的是2024年春季发布的DeepSeek-V2系列模型,这是一款通用的文字和图像分析系统,在多种AI基准测试中表现出色,且运行成本低廉,甚至迫使国内竞争对手如字节跳动和阿里巴巴降低某些产品的价格或免费提供服务。 2024年12月,DeepSeek推出了最新的DeepSeek-V3模型,据内部测试,其性能超过了Meta的Llama和OpenAI的GPT-4。此外,2025年1月推出的R1“推理”模型也表现出色,能够在关键基准测试中与OpenAI的模型相媲美。R1的特点是能够自我事实核查,尽管速度较慢,但在物理、科学和数学等领域更为可靠。 尽管DeepSeek的模型广受开发者欢迎,但它们也面临着一些限制。作为中国开发的AI,这些模型需要通过中国互联网监管部门的审查,确保其响应符合“社会主义核心价值观”。DeepSeek的聊天机器人应用中,R1不会回答关于天安门广场或台湾自治的问题。 DeepSeek的商业模式尚不明确,该公司以远低于市场价的价格销售产品和服务,部分产品甚至免费提供。尽管如此,其效率创新使其保持了极高的成本竞争力,吸引了大量用户。截至2025年3月,DeepSeek的访问量超过1650万次,尽管比2月下降了25%,但仍排名第二,相比之下,ChatGPT在3月的周活跃用户数超过了5亿。 DeepSeek的成功对业界产生了深远影响。2025年1月,Nvidia的股价因DeepSeek的表现而下降了18%。OpenAI CEO Sam Altman对此发表了公开回应,而美国商务部则告知员工将在政府设备上禁止使用DeepSeek。韩国和纽约州政府也采取了类似的措施,禁止使用DeepSeek。微软副总裁兼总裁Brad Smith在参议院听证会上表示,微软员工被禁止使用DeepSeek,理由是数据安全和宣传风险。 业内人士对DeepSeek的评价不一。Hugging Face CEO Clem Delangue表示,Hugging Face平台上的开发者已经创建了500多个基于R1的衍生模型,累计下载量达250万次。Nvidia CEO Jensen Huang在公司的第四季度财报电话会议上强调了DeepSeek的“卓越创新”,认为这种“推理”模型需要更多的计算资源,对Nvidia是有利的。然而,一些公司和政府仍对其持谨慎态度,担心潜在的安全和政治风险。 DeepSeek背后的高飞资本管理公司成立于2019年,总部位于中国,专注于利用AI技术进行交易决策。随着AI技术的发展和国际竞争的加剧,DeepSeek未来仍将推出更先进的模型,但是否会继续获得国际市场的青睐,以及如何应对来自美国政府的压力,仍是个未知数。