时间:2023-05-26 22:24:06 | 浏览:119
近日有消息传出,OpenAI 即将发布一款最新的开源语言大模型。这个距离其将 GPT-2开源,已经整整过去4年了。OpenAI 为什么选择在这个时间点?又为什么选择开源呢?草蛇灰线,伏脉千里。让我们一探究竟。
微软&OpenAI帝国的一道裂缝
虽然 ChatGPT 推出后仅用2个月,月活便突破了1亿,成为史上用户增长最快的应用。但同为 OpenAI 发布的AI作画产品:DALL-E,却一直相对默默无闻,被其开源对手 Stable Diffution 压着打。再后来 MidJourney 凭借出色的艺术效果异军突起,更是让 DALL-E 黯然失色。
也就是说,OpenAI 当前的主要优势还是在语言大模型。但其实这块根据地也已经隐隐有一道裂缝:由Meta推出的开源羊驼大模型,得益于开源模式的众人拾柴火焰高,已经在性能上接近 ChatGPT,并在成本上大幅领先。这让这位如日中天的AI新皇怎能不着急呢?
这里先简单介绍下羊驼大模型的背景
2023年2月24日,Meta(原Facebook)公司发布了语言大模型 LLaMA ,因 llama 在英文中被译作羊驼,故而被业界戏称为「羊驼」。羊驼仅在发布一周后,就被「非故意开源」了,这里的内情根据扎克伯格最新的电话会议可以看出一二,他说「如果行业在 Meta 使用的基础工具上做到标准化,那么 Meta 就能从其他开发者的改进中获益,这样会更好」。这显然是基本的开源理念了。
羊驼发布后,美国的各大顶级学术界、产业界第一时间进行了跟进研究,一时间百花争艳,基于羊驼的家族产品纷至沓来:斯坦福的 Alpaca、伯克利 Vicuna、Koala、ChatLLaMA、FreedomGPT等等。
以伯克利的 Vicuna 为例,在5月份的最新评测中,Vicuna对于许多任务来说,已经是「ChatGPT-3.5的可行替代品」。
而根据伯克利的计算机教授 Ion Stoica 的说法,「现在的免费AI模型,在性能上已经相当接近谷歌和 OpenAI 的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。」
这里的一个关键是,Vicuna的训练成本能做到几百元美金,而如果选择非开源的商业大模型,训练一次动辄几十万的token费用。
这就是开源的威力!汇集全世界的开发者的智慧与一家商业公司角力。在开源与非开源的竞争中,产品面向的市场越大,开源带来的空间和想象力就越大。典型的如传统的IT领域,开源的 Linux 操作系统,基本垄断了全球的服务器和云计算市场。
因此,在与开源的竞合生态中,做好卡位,已经成为 OpenAI 不得不抓紧布好的一枚棋子。
推演大模型的竞争终局
借着这个事,也推演下未来大模型的竞争终局。以下是三个主要论断:
1. 未来的大模型应用,C端可能属于大厂,但是B端必有开源的半壁江山。
可以预见的是,在未来几年,大模型一定会在C(Customer)端的生活中,以及在B(Business)端产业的各个场景下逐步落地。得益于大厂对消费者需求的深度理解,和海量的用户数据沉淀,其C端产品的用户体验能做到显著优于相对粗矿的开源产品。
但是在B端,每个企业都不希望自己的商业机密、数据被喂给其他商业公司。当然,这通过将大模型私有化部署,可以解决部分数据安全的问题。但是私有化部署,并不能解决供应商锁定的问题:
(1)当你用了这家的方案,后续再想换供应商往往难度巨大,成本高昂;
(2)容易失去谈判的议价权。
并且越大、越成熟的企业越有这方面的担忧。基于产业经验,开源产品会成为很多企业的选择。
2. 大模型的核心竞争点并不在于技术,而在于数据与生态。
技术是门槛,但往往靠堆人就能解决,对大厂之间的竞争来说,并不能成为壁垒。但训练大模型的数据,就要各凭本事了。而数据是大模型训练效果的关键要素。因此,对于通用大模型类的产品,基本主导权在拥有海量数据的大厂和政府。
生态无需多言,目前各个大模型紧锣密鼓的打造各类插件,就是抢占生态位的动作。逻辑和 iphone 的 app store 是一致的。
3. 未来真正的大模型巨头,可能并不在你的视线当中。
从目前看,全球范围内,会逐步走出几个通用大模型巨头,他们将占领生态位;
会有至少数百家垂直领域的大模型公司,立足于解决特定行业和场景的需求,赋能产业;
会有数以几十万计的应用类公司和开发者,丰满大模型的插件、应用和生态。
但是,这轮通用人工智能的浪潮,才刚刚开启。就像我们在门户网站时代,完全预见不到Web 2.0的人声鼎沸,在PC互联网时代完全预见不到移动互联网的满目繁华一样。
真正的巨头,还在至美希望的彼岸!
每经记者:杨煜 每经编辑:张海妮今日(4月8日),由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。CAAI元宇宙技术专委会主任、清华大学教授、国家杰青获得者陶建华出席并演讲。陶建华表示,ChatGPT和GPT-4
雷递网 雷建平 4月15日根据内华达州的一份文件,特斯拉CEO埃隆·马斯克 (Elon Musk) 已经成立了一家名为X.AI Corp的新人工智能公司。马斯克为X.AI Corp的唯一董事,而贾里德伯查尔,马斯克家族办公室的董事则是其秘书
近日有消息传出,OpenAI 即将发布一款最新的开源语言大模型。这个距离其将 GPT-2开源,已经整整过去4年了。OpenAI 为什么选择在这个时间点?又为什么选择开源呢?草蛇灰线,伏脉千里。让我们一探究竟。微软&OpenAI帝国的一道裂缝
编辑:编辑部【新智元导读】Meta的LLaMA模型开源,让文本大模型迎来了Stable Diffustion时刻。今天,斯坦福发布了一个由LLaMA 7B微调的模型Alpaca,训练3小时,性能比肩GPT-3.5。一觉醒来,斯坦福大模型Al
1. 中州壹号位于郑东新区黄河东路,毗邻CBD商业区,是郑州市中心地段最具高端商业价值的楼盘之一。小区拥有世界级豪华物业服务,高端私人会所,超高层公寓等多种精致的住宅产品,加之业主优越的社交背景和优质的物业服务,成为郑州最贵的楼盘之一。2.
如果中国大陆开始武力收复台湾,美国有哪些可能的军事行动?首先需要指出的是,美国在台海地区的军事行动将会涉及到一系列的复杂问题,包括国际法、地缘政治、军事策略等方面。因此,我只能提供一些大体上的可能性,但具体情况需要根据实际情况进行评估。在这
每经记者:李孟林 蔡鼎 谭玉涵 每经编辑:谭玉涵,兰素英因强大功能而爆红的ChatGPT正因数据隐私和安全风险在全球掀起一场监管风暴。一周之内,意大利、德国、法国、爱尔兰等8国相继“出手”。此外,它还可能面临全球首例AI诽谤诉讼。据悉,马斯
中疾控:新冠病毒由实验室引入是“极不可能”的4月8日,国新办举行我国新冠溯源研究情况新闻发布会。发布会上,中国疾控中心研究员周蕾表示,关于新冠病毒的起源,中疾控研究结果表明,通过实验室引入是“极不可能”的。对于新冠病毒的起源,周蕾表示,我国
每经记者:王帆 每经编辑:孙志成,张杨运,张喜威,盖源源NO.1 市场消息北京时间4月6日凌晨,美股三大指数收盘涨跌不一,纳指跌1.07%,标普500指数跌0.25%,道指涨0.24%。特斯拉跌3.75%,日线三连跌,累跌10.65%。大型
每经记者:王琳 每经编辑:孙志成,胡玲,王晓波,盖源源NO.1 国务院总理李强3月14日主持召开新一届国务院第一次常务会议,研究国务院机构设置有关工作,讨论《国务院工作规则(修订稿)》。新一届国务院开始全面履职。会议审议通过了国务院直属特设
每经记者:李孟林 蔡鼎 谭玉涵 每经编辑:谭玉涵,兰素英,卢祥勇,易启江因强大功能而爆红的ChatGPT正因数据隐私和安全风险在全球掀起一场监管风暴。一周之内,意大利、德国、法国、爱尔兰等8国相继“出手”。此外,它还可能面临全球首例AI诽谤
每经编辑:张杨运,张喜威NO.1 市场消息北京时间4月6日凌晨,美股三大指数收盘涨跌不一,纳指跌1.07%,标普500指数跌0.25%,道指涨0.24%。特斯拉跌3.75%,日线三连跌,累跌10.65%。大型科技股普遍下跌,亚马逊跌超2%,
每经记者:杨煜 每经编辑:张海妮今日(4月8日),由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。论坛上,清华大学长聘副教授、聆心智能创始人、国家杰青获得者黄民烈发表了演讲。黄民烈表示,ChatGPT存在不足和缺
今天问了ChatGPT世界十大名表,发现竟然没有劳力士。。。感觉不可思议啊!大家看看这个回答靠谱不?百达翡丽(Patek Philippe):创立于1839年,是全球最古老的高级腕表品牌之一,以卓越的技术和精湛的工艺著称。2.爱彼(Aud
十款最好的山地车1、巨鹰 AM1000优点:车架强度高、性能稳定、配置较高、适合多种地形骑行。缺点:价格相对较高。2、美利达 XC700优点:轻便、速度快、稳定性好、适合山地越野和公路骑行。缺点:悬架性能一般。3、捷安特 ATX 27.5优