时间:2023-04-06 10:04:42 | 浏览:9
图虫创意
今天凌晨,ChatGPT的制作公司OpenAI发布了多模态预训练大模型GPT-4。
新模型除了在识图能力、文字输入限制、回答准确性和文字风格变化上有了质的飞跃,它的考试能力被着重强调了。
在GRE数学考试中,GPT-4可以考163分(170 分满分),超过80%的考生;在GRE语文(阅读与填空)考试中,GPT-4可以考169分(170分满分),超过99%的考生。
GPT-4在许多标准化考试中都获得了很好的分数。/网页截图
AI模仿人类的第一步,果然还是从学习如何考试开始的。
好像在人类眼里,机器人也是人,也得通过考试证明自己的能力。即便它已经超越了完成考试这个简单的用处,但我们仍在希望让它回答那些唯一的卷面答案。
就算已经工作了几年,看到对考试话题的讨论时,还总是会回忆起“被考试支配”的时刻。
在不用上考场的日子里,我们也常常会用“弯道超车”“赛道”等词语,把自己和他人都放在一个被“测试”的环境下,对生活的纪录和评分乐此不疲。
做乙方已经很辛苦了,但看到考试的时候还是毫不犹豫地点进去做题了。/豆瓣
或许我们真的都不喜欢考试,但我们也离不开一次次“考试”,以及随之而来的“考试思维”。
要想知道什么是考试思维,不妨来回顾一下参与一场考试所走过的“心路历程”。
学生时代,考前我们会按照参考资料和考纲背诵标准答案,配以大量的刷题练习。
考试过程中,我们会充分发挥刷题之后形成的答题习惯,在答题卡中填入唯一解。
又或者揣摩出题人的思维,按照他们的喜好来回答,甚至不一定要认同或理解这个答案,只要拿分就好。
学生时代一大难题:如何揣摩出题人的意图?/@败给现实的天真
考试结束对答案的时候,如果自己的答案与班上某个成绩好的同学答案不同,我们便会开始怀疑自己。
如果拿到了高分,就可以被“官方认可”成为“好学生”,而分数不高则代表仍需努力。
随分数高低而来的排名,表现着一场永不停歇的竞争:我这次是进步还是退步了?又超过了百分之几的人?
成绩是衡量学生能力的最方便的标准。/《教束》剧照
需要标准答案、渴望权威认证、永远保持竞争意识,这就是考试思维的三个特征。
考试思维不仅会被运用在考场上,也作为应试教育背景下的一种群体特征和底层逻辑,运用在生活的方方面面。
比如每隔一段时间就会在社交媒体上大火的测试游戏(如星座、MBTI),总会吸引大批用户的转发,向外界展现经过“权威认证”的自我。
如果再加上分数和排名的因素,又会激起一波相互比较、竞争的热潮。
当时多少人为了提高自己省份的排名通宵玩《羊了个羊》。/网页截图
又比如参与话题讨论时,许多人会选择把回答与某个“主义”或名人名句联系在一起,似乎把自己的回答套入一个有标准答案的框架中,就能在“发表观点”这道题中拿到满分。
而爱好者众多的武侠、仙侠小说中,也总有诸如“武林大会”“灵力测试”这种酷似高考的情节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。
生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”的心态去面对,未必一定奏效。
职场新人肉肉觉得自己就是一个被考试思维牢牢绑定的人。
从小到大她都很会考试,就读的每所学校都是名校。她特别擅长揣摩出题人的心思:“我会去看历年的真题里反复出现的知识点,只抓重点去背记。”
对肉肉来说,考试不是什么难事。/图虫创意
因为成绩好,肉肉经常作为班级代表、学生代表发言,她也习惯了被老师和校领导交口称赞。
但同时,只要她的成绩排名有一点点波动,就会受到老师的加倍关注,所以她也会时刻关注自己和他人的排名变化。
进入职场后,肉肉突然发现自己不再是那个“轻易拿高分”的人了,考试思维的弊端在职场新人身上体现得尤为明显。
习惯了以前有标准答案和考纲的答题方式,肉肉在开始一项工作前也总希望有人能对自己进行指导,为此没少被批评“缺乏主动性”。
只会考试,无法解决所有问题。/《天空之城》剧照
作为创意策划,肉肉发挥了学生时代“揣摩出题人思路”的方式来做策划案,尽可能推测领导喜欢的方向,但收效甚微。
对权威认证的关注也很难改变,组会头脑风暴的时候,她总因为自己是新人不敢说话。好不容易发了言,如果领导没有明确表示认可,肉肉就会万分失落。
执行过程中肉肉又本能地害怕拿不到领导认可的“高分”,因此奉行一贯的完美主义,方案改了又改就是不敢交,反而拖了很多项目时间。
习惯了学生时代以笔芯数量、卷子厚度作为努力的计量单位,到了没有标准测试目标的时候,肉肉还会给自己创造一些测试。
喜欢用考试解决问题的人,或许只是不想当差生。/豆瓣
她会将某个和自己情况相近的同事所达到的“成就”树立为自己的目标,然后去努力达成。达成一个之后再转向下一个,竞争和比较永不停止。
“有时也会觉得自己是个‘学人精’,但其实我也很难控制自己——我好像被困在一张看不见的考卷中,只是不想考得落后于人而已。”肉肉表示。
不难发现,考试思维其实是学生时代沿用而来的一种惯性思维。
在应试教育模式里得心应手、擅长考试的人,往往习惯了考试带来的“付出就会有回报”的模式,也习惯于这种可控制感带来的成就感。
若他们遇到“付出而又没有回报”的事情的时候,会产生很强的挫败感,特别希望通过考试这个自己熟悉且有自信的方式来解决问题。
读书时坚信着努力就会有回报,但现实情况要比这复杂得多。/上野千鹤子东京大学开学典礼致辞
与此同时,考试思维的背后隐藏着一种深深的不安,它的本质是不自信的。
在应试教育“千军万马过独木桥”的竞争之中,似乎只有得到了高分、受到了权威的认可才是对的,其余的尝试都不被鼓励。
为此“考生”们不得不奉行着考试思维,时刻想着如何竞争、如何提升自己的排名。
中国政法大学教授罗翔在谈到考试时曾说,任何的标准化考试,只要多做真题,基本都能通过。
与此相对的是非标准化考试,如赛跑,只要能赢就行。/网页截图
这是因为这类考试有相对统一的标准,因此也有“应试技巧”可循,只要学生掌握了答题技巧就能成功拿到好成绩、被认可。
诚然,熟练运用考试思维或许可以帮助自己在某些事情上获得“高分”,但实际上还是在他人的标准下“戴着镣铐跳舞”,始终受制于人。
而走出考场后的生活已经没有了标准化的答案,我们更需要放弃对考试带来的可控制性、可预测性的依赖,用更加灵活和创新的方式来面对新的考验。
毕竟生活不是标准化考试,不用每次都拿到高分,只要最终的结果令自己满意就好了。
《青春派》
当我们开始正视考试思维的时候,或许就是我们开始摆脱它的影响的时候。
GPT-4让我们看到,人类能向它提出什么问题,AI就能走多远。考试思维能将我们训练成一个好的答题人,但未来我们或许更需要做那个出题的人。
撰稿 牧羊
编辑 西西
校对 赖晓妮
排版 张颖娴
近期chatGPT异常火爆,仅仅用了60 天用户就直接破亿,这是何等可怕的速度!于是乎国内外大厂纷纷追随 AIGC 步伐, ChatGPT 引领 AI 在科技圈一路“狂飙”!由于涉及到太多的专业词汇,开始之前,先通俗易懂的解释这些词汇(图1
萧箫 发自 凹非寺量子位 | 公众号 QbitAI真·开源GPT模型,终于来了。参数量级130亿,大小比肩最近Meta开放的LLaMA-13B,但从数据集、模型权重到计算优化训练,全部开源。最关键的是,可商用。没错,虽然就GPT-3而言,之
丰色 发自 凹非寺量子位 | 公众号 QbitAI最强组合:HuggingFace+ChatGPT ——HuggingGPT,它来了!只要给定一个AI任务,例如“下面这张图片里有什么动物,每种有几只”。它就能帮你自动分析需要哪些AI模型,然
周鸿祎周鸿祎再次公开谈及自己对人工智能的未来判断。3月25日,2023中国发展高层论坛开幕,三六零(601360.SH,下称“360”)集团创始人周鸿祎以“人工智能与未来安全”为题发表主题演讲。演讲中,周鸿祎展示了AI绘图生成的自画像,以及
智东西编译 | ZeR0编辑 | 漠影智东西3月15日消息,今日凌晨,万众瞩目的大型多模态模型GPT-4正式发布!OpenAI发文称,GPT-4能接受图像和文本输入,输出文本内容,虽然在许多现实场景中的能力不如人类,但在各种专业和学术基准测
2023年3月30日,金融信息提供商彭博社发布了专为金融领域打造的大语言模型(Large Language Model,LLM)Bloomberg GPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内
中新网3月16日电 (中新财经记者 吴涛)北京时间15日凌晨,OpenAI发布大型多模式模型GPT-4。OpenAI称,GPT-4在先进推理上超过了ChatGPT,是OpenAI努力扩展深度学习的最新里程碑。这个“里程碑”到底有哪些特点呢,
今天 OpenAI 宣布推出 ChatGPT 4,ChatGPT Plus 用户在今天就能体验到。OpenAI 称它是「最先进的系统,能生产更安全和更有用的回复」。和上一代相比,GPT-4 拥有了更广的知识面和更强的解决问题能力,在创意、视
GPT可以说是2023最热门的话题,没有之一!到底什么是GPT? 为什么说GPT是第三次工业革命?什么是GPT?GPT 是 "Generative Pre-training Transformer" 的缩写,是一种基于Transformer
当我们还活在睡梦中时,人工智能ChatGPT横空问世,从连续回答问题、生成摘要、翻译文档,到信息分类、写代码、编剧本、做作业和写论文,ChatGPT几乎都能应对自如。两个月时间内,ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者
谷歌吃了大亏之后,这次一声不吭,放了大招:对标ChatGPT的Bard测试版,刚刚正式对外发布。而且这次用户在申请候补名单之后,无需经历漫长的等待时间。没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)实测之后表示,Bard效
界面新闻记者|李京亚3月15日凌晨2点,OpenAI正式发布了升级后的GPT-4。GPT-4是一个多模态大模型,可以接受文本和图像形式的输入,能使用文本解析并回应这些查询。在ChatGPT Plus上,开发人员可以通过API构建应用程序和
#头条创作挑战赛#OpenAI 已迅速成为科技界最知名的公司之一。这家人工智能 (AI) 公司制作了逼真的图像生成器、3D 模型创建器,以及现在最著名的 ChatGPT。ChatGPT 有能力通过法律考试、撰写整篇长篇文章,甚至编写完整的网
智东西作者 | ZeR0编辑 | 漠影ChatGPT这把火,已经烧到了生命科学界。智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋
ChatGPT的热度还没过去,它的进阶版就来了。3月15日,距离AI(人工智能)聊天机器人ChatGPT的亮相还不到4个月,它的开发商OpenAI又推出了新版多模态预训练大模型——GPT-4。与基于GPT-3.5的ChatGPT相比,GPT