欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

别考了,GPT-4分比你高

2023-04-06 10:04:42 19

摘要:图虫创意 今天凌晨,ChatGPT的制作公司OpenAI发布了多模态预训练大模型GPT-4。新模型除了在识图能力、文字输入限制、回答准确性和文字风格变化上有了质的飞跃,它的考试能力被着重强调了。在GRE数学考试中,GPT-4可以考163分(...

图虫创意

今天凌晨,ChatGPT的制作公司OpenAI发布了多模态预训练大模型GPT-4。

新模型除了在识图能力、文字输入限制、回答准确性和文字风格变化上有了质的飞跃,它的考试能力被着重强调了

在GRE数学考试中,GPT-4可以考163分(170 分满分),超过80%的考生;在GRE语文(阅读与填空)考试中,GPT-4可以考169分(170分满分),超过99%的考生。

GPT-4在许多标准化考试中都获得了很好的分数。/网页截图

AI模仿人类的第一步,果然还是从学习如何考试开始的。

好像在人类眼里,机器人也是人,也得通过考试证明自己的能力。即便它已经超越了完成考试这个简单的用处,但我们仍在希望让它回答那些唯一的卷面答案。

就算已经工作了几年,看到对考试话题的讨论时,还总是会回忆起“被考试支配”的时刻。

在不用上考场的日子里,我们也常常会用“弯道超车”“赛道”等词语,把自己和他人都放在一个被“测试”的环境下,对生活的纪录和评分乐此不疲。

做乙方已经很辛苦了,但看到考试的时候还是毫不犹豫地点进去做题了。/豆瓣

或许我们真的都不喜欢考试,但我们也离不开一次次“考试”,以及随之而来的“考试思维”。

要想知道什么是考试思维,不妨来回顾一下参与一场考试所走过的“心路历程”。

学生时代,考前我们会按照参考资料和考纲背诵标准答案,配以大量的刷题练习。

考试过程中,我们会充分发挥刷题之后形成的答题习惯,在答题卡中填入唯一解。

又或者揣摩出题人的思维,按照他们的喜好来回答,甚至不一定要认同或理解这个答案,只要拿分就好。

学生时代一大难题:如何揣摩出题人的意图?/@败给现实的天真

考试结束对答案的时候,如果自己的答案与班上某个成绩好的同学答案不同,我们便会开始怀疑自己。

如果拿到了高分,就可以被“官方认可”成为“好学生”,而分数不高则代表仍需努力。

随分数高低而来的排名,表现着一场永不停歇的竞争:我这次是进步还是退步了?又超过了百分之几的人?

成绩是衡量学生能力的最方便的标准。/《教束》剧照

需要标准答案、渴望权威认证、永远保持竞争意识,这就是考试思维的三个特征。

考试思维不仅会被运用在考场上,也作为应试教育背景下的一种群体特征和底层逻辑,运用在生活的方方面面。

比如每隔一段时间就会在社交媒体上大火的测试游戏(如星座、MBTI),总会吸引大批用户的转发,向外界展现经过“权威认证”的自我。

如果再加上分数和排名的因素,又会激起一波相互比较、竞争的热潮。

当时多少人为了提高自己省份的排名通宵玩《羊了个羊》。/网页截图

又比如参与话题讨论时,许多人会选择把回答与某个“主义”或名人名句联系在一起,似乎把自己的回答套入一个有标准答案的框架中,就能在“发表观点”这道题中拿到满分。

而爱好者众多的武侠、仙侠小说中,也总有诸如“武林大会”“灵力测试”这种酷似高考的情节,主角十年如一日的练功就是为了在一场决定性的测试中超过所有竞争者,获得第一名。

生活和考试中都想拿高分,无可厚非,但把生活中的种种任务当成一场场考试,每次都以答题和“拿满分”的心态去面对,未必一定奏效。

职场新人肉肉觉得自己就是一个被考试思维牢牢绑定的人。

从小到大她都很会考试,就读的每所学校都是名校。她特别擅长揣摩出题人的心思:“我会去看历年的真题里反复出现的知识点,只抓重点去背记。”

对肉肉来说,考试不是什么难事。/图虫创意

因为成绩好,肉肉经常作为班级代表、学生代表发言,她也习惯了被老师和校领导交口称赞。

但同时,只要她的成绩排名有一点点波动,就会受到老师的加倍关注,所以她也会时刻关注自己和他人的排名变化。

进入职场后,肉肉突然发现自己不再是那个“轻易拿高分”的人了,考试思维的弊端在职场新人身上体现得尤为明显。

习惯了以前有标准答案和考纲的答题方式,肉肉在开始一项工作前也总希望有人能对自己进行指导,为此没少被批评“缺乏主动性”。

只会考试,无法解决所有问题。/《天空之城》剧照

作为创意策划,肉肉发挥了学生时代“揣摩出题人思路”的方式来做策划案,尽可能推测领导喜欢的方向,但收效甚微。

对权威认证的关注也很难改变,组会头脑风暴的时候,她总因为自己是新人不敢说话。好不容易发了言,如果领导没有明确表示认可,肉肉就会万分失落。

执行过程中肉肉又本能地害怕拿不到领导认可的“高分”,因此奉行一贯的完美主义,方案改了又改就是不敢交,反而拖了很多项目时间。

习惯了学生时代以笔芯数量、卷子厚度作为努力的计量单位,到了没有标准测试目标的时候,肉肉还会给自己创造一些测试。

喜欢用考试解决问题的人,或许只是不想当差生。/豆瓣

她会将某个和自己情况相近的同事所达到的“成就”树立为自己的目标,然后去努力达成。达成一个之后再转向下一个,竞争和比较永不停止。

“有时也会觉得自己是个‘学人精’,但其实我也很难控制自己——我好像被困在一张看不见的考卷中,只是不想考得落后于人而已。”肉肉表示。

不难发现,考试思维其实是学生时代沿用而来的一种惯性思维

在应试教育模式里得心应手、擅长考试的人,往往习惯了考试带来的“付出就会有回报”的模式,也习惯于这种可控制感带来的成就感。

若他们遇到“付出而又没有回报”的事情的时候,会产生很强的挫败感,特别希望通过考试这个自己熟悉且有自信的方式来解决问题。

读书时坚信着努力就会有回报,但现实情况要比这复杂得多。/上野千鹤子东京大学开学典礼致辞

与此同时,考试思维的背后隐藏着一种深深的不安,它的本质是不自信的。

在应试教育“千军万马过独木桥”的竞争之中,似乎只有得到了高分、受到了权威的认可才是对的,其余的尝试都不被鼓励。

为此“考生”们不得不奉行着考试思维,时刻想着如何竞争、如何提升自己的排名。

中国政法大学教授罗翔在谈到考试时曾说,任何的标准化考试,只要多做真题,基本都能通过。

与此相对的是非标准化考试,如赛跑,只要能赢就行。/网页截图

这是因为这类考试有相对统一的标准,因此也有“应试技巧”可循,只要学生掌握了答题技巧就能成功拿到好成绩、被认可。

诚然,熟练运用考试思维或许可以帮助自己在某些事情上获得“高分”,但实际上还是在他人的标准下“戴着镣铐跳舞”,始终受制于人。

而走出考场后的生活已经没有了标准化的答案,我们更需要放弃对考试带来的可控制性、可预测性的依赖,用更加灵活和创新的方式来面对新的考验。

毕竟生活不是标准化考试,不用每次都拿到高分,只要最终的结果令自己满意就好了。

《青春派》

当我们开始正视考试思维的时候,或许就是我们开始摆脱它的影响的时候。

GPT-4让我们看到,人类能向它提出什么问题,AI就能走多远。考试思维能将我们训练成一个好的答题人,但未来我们或许更需要做那个出题的人。

撰稿 牧羊

编辑 西西

校对 赖晓妮

排版 张颖娴

版权声明:本站所有文章皆是来自互联网,如内容侵权可以联系我们( 微信:bisheco )删除!
友情链接
币圈社群欧易官网