DeepSeek开源5代码库,百度文心大模型4.5免费使用,开源革命席卷全球大模型行业
行业风向突变
今年伊始,全球的大模型领域遭遇了风波,激发了“开源运动”的兴起。以往坚守封闭策略的科技巨头,诸如百度,也纷纷调整了策略,对开源社区展现出了更为亲和的态度。即便是马斯克最新推出的Grok-3,也宣布将免费开放。过去,大模型训练需要巨额资金投入,那么为何现在会有这样的转变?这背后是竞争压力的驱使,还是隐藏着其他原因?
百度立场转变
4月1日,百度宣布,文心一言将向所有用户免费提供。无论是电脑用户还是手机App用户,都可以不限量使用。同时,高级功能和深度搜索功能也将全部开放。在财报业绩的电话会议里,李彦宏对此进行了阐述。他提到,这一举措既受到了成功案例的启发,又因为公司对在大模型技术领域的领先地位充满信心。2024年世界人工智能会议上,他发表了一种引人关注的观点。他认为,开源模型可能只是对智商的浪费,而闭源模型不仅性能更优越,而且推理成本更低。这种观点的转变,让人感到颇为困惑。
OpenAI态度生变
OpenAI位于大洋彼岸,其CEO山姆·奥特曼难得地公开发表了意见,指出“闭源策略是不对的”。关于此事,外界热议不断,纷纷猜测OpenAI可能将解锁GPT-3 mini模型或手机端侧模型,此举或许旨在拓宽市场份额。需留意的是,OpenAI之前长期实行封闭式开发策略,但此次的突然转向,对业界来说,如同投下了一枚重磅炸弹。大家都在关注,它未来会如何加快开源的进程。
马斯克的开源模式
2月18日,马斯克推出了Grok-3,并选择了“部分开源”的模式。他提到,只有在Grok-3的稳定性得到充分验证后,才会对Grok2实行开源。马斯克还着重指出,在AI大型模型领域,并没有什么绝对的优势。成功的关键在于车库创业的激情和社区的创新能力。这项措施既确保了关键技术的安全,同时也推动了行业的进步,堪称科技领域的勇敢探索。
阿里云的开源成果
阿里云的通义大模型,经过持续的开源,已处于全球开源模型领域的尖端。其变体模型,在国内外开源社区中,种类已突破九万。这一数字超过了Meta公司旗下的Llama系列。在全球开源大模型的排名中,前十名均被通义Qwen的变体模型包揽。阿里云在开源方面取得了不小的成就,这主要归功于其充足的资金投入和优秀的技术支撑。
开源并非万能
开源虽成为趋势,但多数人认为它并非万能良药。北京智源人工智能研究院的倪贤豪指出,要想开源的大模型项目有所成就,要么需要大企业的支持,要么需要有充足的资金。阿里集团的吴泳铭透露,未来三年在云计算和AI基础设施方面的投资,将超过过去十年的总和。马斯克创办的xAI公司在开源策略上值得借鉴。公司通过提供免费服务吸引客户,同时采取保密措施确保技术不被泄露,还向开发者提供开源的旧版本模型,以此来搭建一个技术安全保障体系。
这场在大型模型领域引发的“开源革命”势头猛烈,然而开源与闭源之间的竞争与合作关系将如何演变?如果您对此有所见解,欢迎在评论区分享您的看法。如果您认为这篇文章对您有所帮助,请不要忘记点赞并推荐给您的朋友。
作者:小蓝
链接:https://www.lanmiyun.com/content/9074.html
本站部分内容和图片来源网络,不代表本站观点,如有侵权,可联系我方删除。