

中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及资本市场。业界人士认为,DeepSeek模型有望激发一波创新浪潮,推动全球AI继续进步。“更大不再等于更聪明”
据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。英国《金融时报》发表的一篇评论文章指出,DeepSeek挑战了AI产业在过去一段时间的核心信念,即认为更强大的硬件才是推动AI发展的关键。
有望激发创新浪潮
摩根士丹利认为,DeepSeek的模型表明,前沿AI能力可能不需要大量计算资源就能实现。通过巧妙的工程设计和高效的训练方法,高效利用资源可能比纯粹的计算能力更重要。这可能会激发一波创新浪潮,各家企业会探索具有成本效益的AI开发和部署方法。DeepSeek的模型是开源共享的。近日,全球知名开源平台抱抱脸公司等多个团队已宣布复现了DeepSeek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上发文说,DeepSeek-R1的面世,意味着开源模型正在超越闭源模型。英国《金融时报》的评论文章说,开源模型DeepSeek-R1对全球用户产生极大吸引力,有利于推动人工智能技术的开发和应用。文章说,对于大多数商业用户来说,拥有一款足够可靠并且好用的模型比拥有绝对领先的模型更重要。“并不是每个司机都需要一辆法拉利。像R1这样模型的推理能力进步,可能会为与客户互动或处理工作任务的‘智能体’带来突破性变化。”如果能以更低的成本拥有这些模型,企业的盈利能力将提升。瑞士瑞银集团指出,如果AI训练和推理成本显著降低,预计更多终端用户将利用AI来改善他们的业务或开发新的用途。联盟简介
中关村融智特种机器人产业联盟是北京市科委、中关村管委会指导下的,在北京市民政局注册的独立法人单位。联盟是为适应我国机器人产业的发展现状及发展趋势而发起成立的,由热爱机器人产业,积极为中国机器人产业发展做贡献及相关装备研发、制造、服务的生产企业、科研机构、高等院校、用户单位和其他相关机构自愿组成的一个整合机器人产业资源,协同创新的新型组织。
秘书处联系方式:
盟小萌18600162481(微信同号)

添加群主,申请加入特种机器人行业交流群,添加群主时需备注“称呼+单位名称+职位”(无备注,不添加,仅限机器人产业链相关企业)