欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

GPT是什么?

时间:2023-04-06 09:45:58 | 浏览:22

我们在上篇文章探讨了BERT与GPT的基础,下面来看看究竟GPT是什么。GPT发展史GPT是由OpenAI 团队研发创造, OpenAI是由创业家埃隆·马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal

我们在上篇文章探讨了BERT与GPT的基础,下面来看看究竟GPT是什么。

    GPT发展史

GPT是由OpenAI 团队研发创造, OpenAI是由创业家埃隆·马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等人于2015年在旧金山创立的一家非盈利的AI研究公司,拥有多位硅谷重量级人物的资金支持,启动资金高达10亿美金;OpenAI的创立目标是与其它机构合作进行AI的相关研究,并开放研究成果以促进AI技术的发展。不过2023年的情况是,马斯克已经非其股东,且公司转化为了盈利组织

OpenAI已经创建了全世界最强大的大语言模型之一。该模型名为GPT-3,由1,750亿个统计性联系组成,可以理解为这个模型有1750亿个参数,或者说类似于有1750亿个“神经元”。

该模型在约三分之二互联网、整个维基百科和两个大型图书数据集中进行训练。在训练过程中,OpenAI发现,早期GPT-3很难准确提供用户想要的结果,一个团队提议使用“强化学习”系统完善该模型,“强化学习”是从试错中学习以取得最大化回报的人工智能系统(后面会做介绍)。

该团队认为,一款聊天机器人或许是不错的候选方法之一,因为以人类对话的形式持续提供反馈,使人工智能软件很容易知道其做得好的地方和需要改进的情况。因此,2022年初,该团队开始开发这款聊天机器人,也就是后来的ChatGPT(PS:这个项目其实普遍不被内部看好,差点被取消掉)。

    GPT的训练

GPT1-3,皆使用的是Transformer架构,可以说模型结构没有创新型的设计,但是在微软的巨额资金支持下,GPT3模型由

(1)1750亿个参数(相当于大脑的神经元);

(2)31个分工明确的作者(皆是大神级别的人物);

(3)强大的超算平台(28.5万个CPU+1万个GPU(英伟达A100));

(4)45TB的训练数据(维基百科全部数据量相当于其0.6%)

等等要素进行支撑训练。

事实上,ChatGPT并没有直接发表论文,但是其前作InstructGPT有,所以大家只能根据这个推测GPT的训练。人工智能领域常说有多少智能,就有多少人工,其实非常适合描述其训练,这个公司聘用了40个外包公司(多少人不知道),在进行标注数据,让模型学习到的知识,使得模型输出的结果,可以更加符合人类的知识与常识,而初始训练只能靠人们标注。

ChatGPT的训练流程分成三个模块,首先来看一下第一个模块。

第一步,即第一个模块,人会标注一些数据,用人标注的数据,来训练一个模型,进而在GPT3上再一次强化。人会写一些知识给它,比如中国的首都是北京等等,通过人来调整最初版的GPT3,这个模型就初步具备了人类的知识,但是因为需要标注的东西其实非常多,因此也只是初步具备。

有了初步的模型后,我们可以问它一些问题,比如谁是最漂亮的女明星,然后GPT可能会回答,比如高圆圆>李宇春>范冰冰等等,此时进行第二步。

第二步中,外包公司(人)就会给所有排序人工打分,比如对李宇春、高圆圆、范冰冰哪个漂亮打分100分,然后看排序,用排序做对比,注意这里只关注排序,不再关注分数,得到的结果可能就是高圆圆>范冰冰>李宇春,这里用分数算排序,而不是直接用分数,就是因为分数更加主观。

在这个基础上,还会增加一个奖励排名,进行强化学习(非常重要),这个部分的目的是为了GPT3输出的结果进行排序,让排序符合人们的认知。这个时候可能结果就是高圆圆≈范冰冰>李宇春了。

其40个外包公司,主要就是对于GPT3输出的结果,进行排序,让模型学会人打的排序结果。

第三步,即第三个模块,通过不断的循环训练,我们会得到最终的ChatGPT模型,这个模型是一个循环训练的过程,需要让ChatGPT输出符合人类的认知,而人类的认知由RM决定,也就是第二步的步骤,同时还有一个模型来避免人类对ChatGPT结果产生过于严重的影响。

    GPT(Generrative Pre-Trained Transformer)究竟是什么

在GPT论文的引言中,作者说:

"We explore a semi-supervised approach for language understanding tasks using a combination of unsupervised pre-training and supervised fine-tuning. Our goal is to learn a universal representation that transfers with little adaptation to a wide range of tasks."

上面的两句话把GPT的手段和目的说再清晰不过了:手段是半监督训练(无监督的预训练+有监督的微调=半监督),目的是构建一个能够快速适配诸多NLP任务的通用语言表示。可以说前者讨论了GPT是怎么来的,而后者涉及拿到GPT后怎么用在其他NLP任务。

因此官方一点来讲:GPT模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。

简单来讲:GPT是一个超大语料基础上预训练出的大语言模型(LLM),采用类似写作文的方式,从左到右进行填字概率预测的自回归语言模型,并基于prompting(提示)来适应不同领域的任务。

从 GPT-1 到GPT-3 智能化程度不断提升, ChatGPT 的到来也是 GPT-4 正式推出之前的序章,目前GPT-3拥有1750亿个参数。虽然这种能力的表现还不算完美,但是他开启了一条一种通向“通用型人工智能”的道路,曾经科幻故事里的Jarvis,moss好像真的有了那么一点可能。

当前,ChatGPT所利用的数据集只截止到2021年。在对话中,ChatGPT会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的回复,因而ChatGPT也可实现连续对话,提升了交互模式下的用户体验。同时, ChatGPT也会屏蔽敏感信息,对于不能回答的内容也能给予相关建议。

下一篇文章中,我们将探索为什么GPT具有如此大的突破,以及目前其局限性,欢迎关注我们。


止于至善投资总经理、基金经理:何 理

2023年2月23日

END


只以合理价格 ,投资卓越公司。

——止于至善投资理念

欢迎关注公众号:止于至善投资,获取公司最新动态与观点。


风险提示及版权声明

本文全部内容,仅出于传播信息的需要,市场有风险,投资需谨慎。所述内容和意见仅供参考,并不构成对交易做出保证。投资者不应将以上观点作为投资决策的唯一参考因素,亦不应以本意见取代自己的判断。在任何情况下,不对任何人因阅读以上内容所引致的任何损失负任何责任。

本文内容是作者对公开信息数据的整理与分析,不保证文中观点或陈述不会发生任何变更,本文对这些信息的准确性及完整性不作任何保证。如需转载,请注明来源与作者,保证文章内容完整性,并自负相关责任。

相关资讯

chatGPT,AI时代到来?一文告诉你到底何为GPT!GPT能做什么!

近期chatGPT异常火爆,仅仅用了60 天用户就直接破亿,这是何等可怕的速度!于是乎国内外大厂纷纷追随 AIGC 步伐, ChatGPT 引领 AI 在科技圈一路“狂飙”!由于涉及到太多的专业词汇,开始之前,先通俗易懂的解释这些词汇(图1

免费可商用开源GPT模型问世,50G权重直接下载,性能不输GPT-3

萧箫 发自 凹非寺量子位 | 公众号 QbitAI真·开源GPT模型,终于来了。参数量级130亿,大小比肩最近Meta开放的LLaMA-13B,但从数据集、模型权重到计算优化训练,全部开源。最关键的是,可商用。没错,虽然就GPT-3而言,之

HuggingGPT:一个ChatGPT控制所有AI模型,自动帮人完成AI任务

丰色 发自 凹非寺量子位 | 公众号 QbitAI最强组合:HuggingFace+ChatGPT ——HuggingGPT,它来了!只要给定一个AI任务,例如“下面这张图片里有什么动物,每种有几只”。它就能帮你自动分析需要哪些AI模型,然

周鸿祎:中国大语言模型和GPT-4差距在两三年,GPT-6后可能会有意识

周鸿祎周鸿祎再次公开谈及自己对人工智能的未来判断。3月25日,2023中国发展高层论坛开幕,三六零(601360.SH,下称“360”)集团创始人周鸿祎以“人工智能与未来安全”为题发表主题演讲。演讲中,周鸿祎展示了AI绘图生成的自画像,以及

震撼!GPT-4来了,支持多模态,全面吊打ChatGPT,完虐标准化考试

智东西编译 | ZeR0编辑 | 漠影智东西3月15日消息,今日凌晨,万众瞩目的大型多模态模型GPT-4正式发布!OpenAI发文称,GPT-4能接受图像和文本输入,输出文本内容,虽然在许多现实场景中的能力不如人类,但在各种专业和学术基准测

华泰证券:从BloombergGPT看金融GPT机遇

2023年3月30日,金融信息提供商彭博社发布了专为金融领域打造的大语言模型(Large Language Model,LLM)Bloomberg GPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内

能赋诗写剧看漫画,但GPT-4“不认识”GPT-4

中新网3月16日电 (中新财经记者 吴涛)北京时间15日凌晨,OpenAI发布大型多模式模型GPT-4。OpenAI称,GPT-4在先进推理上超过了ChatGPT,是OpenAI努力扩展深度学习的最新里程碑。这个“里程碑”到底有哪些特点呢,

GPT-4重磅发布!ChatGPT炸裂大升级,能考上哈佛,体验后我慌了

今天 OpenAI 宣布推出 ChatGPT 4,ChatGPT Plus 用户在今天就能体验到。OpenAI 称它是「最先进的系统,能生产更安全和更有用的回复」。和上一代相比,GPT-4 拥有了更广的知识面和更强的解决问题能力,在创意、视

什么是GPT?为什么说GPT是第三次工业革命?

GPT可以说是2023最热门的话题,没有之一!到底什么是GPT? 为什么说GPT是第三次工业革命?什么是GPT?GPT 是 "Generative Pre-training Transformer" 的缩写,是一种基于Transformer

ChatGPT的“GPT”是什么意思?三个单词暴露你的英语水平!

当我们还活在睡梦中时,人工智能ChatGPT横空问世,从连续回答问题、生成摘要、翻译文档,到信息分类、写代码、编剧本、做作业和写论文,ChatGPT几乎都能应对自如。两个月时间内,ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者

谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快

谷歌吃了大亏之后,这次一声不吭,放了大招:对标ChatGPT的Bard测试版,刚刚正式对外发布。而且这次用户在申请候补名单之后,无需经历漫长的等待时间。没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)实测之后表示,Bard效

更强大恐怖的GPT-4来了,考试表现优于人类,性能远超ChatGPT

界面新闻记者|李京亚3月15日凌晨2点,OpenAI正式发布了升级后的GPT-4。GPT-4是一个多模态大模型,可以接受文本和图像形式的输入,能使用文本解析并回应这些查询。在ChatGPT Plus上,开发人员可以通过API构建应用程序和

ChatGPT:关于OpenAI的GPT-4工具你需要知道的一切

#头条创作挑战赛#OpenAI 已迅速成为科技界最知名的公司之一。这家人工智能 (AI) 公司制作了逼真的图像生成器、3D 模型创建器,以及现在最著名的 ChatGPT。ChatGPT 有能力通过法律考试、撰写整篇长篇文章,甚至编写完整的网

生命科学迎“ChatGPT时刻”!AIGP平台三大功能加速蛋白质生成,6月起向专业公众开放

智东西作者 | ZeR0编辑 | 漠影ChatGPT这把火,已经烧到了生命科学界。智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋

动动嘴就能做PPT、设计网页,图解GPT-4有多强大,哪些公司将受益?

ChatGPT的热度还没过去,它的进阶版就来了。3月15日,距离AI(人工智能)聊天机器人ChatGPT的亮相还不到4个月,它的开发商OpenAI又推出了新版多模态预训练大模型——GPT-4。与基于GPT-3.5的ChatGPT相比,GPT

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈娱乐圈网胡姓宝宝起名网天天基金行情网报喜鸟A股飞鹤奶粉评测网张裕A股张裕葡萄酒宏宇瓷砖资讯网江诗丹顿收藏网欢乐谷游玩攻略网奥斯陆旅游网短视频电商创业网路特斯纯电超跑古天乐影迷网今日驻马店鸿星尔克股票网
ChatGPT中文网-ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。国内文心一言免费最新版、华为盘古中国免费网页版、ChatGPT国内镜像网站、ChatGPT国内中文版网站、免费文心一言在线官网、华为盘古国内版入口体验网站。
ChatGPT中文网 gptpx.cn ©2022-2028版权所有