时间:2023-04-06 10:00:37 | 浏览:732
2023年3月30日,金融信息提供商彭博社发布了专为金融领域打造的大语言模型(Large Language Model,LLM)Bloomberg GPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。
华泰证券分析师谢春生(执业:S0570519080006)认为,掌握金融数据的国内厂商也有望复制Bloomberg GPT的路径,实现大语言模型在金融场景的有效赋能。
尽管Bloomberg GPT的模型参数介于GPT-2与GPT-3之间。但BloombergGPT的金融垂直能力远超GPT系列。
分析师指出:
根据论文《Bloomberg GPT: A Large Language Model for Finance》的模型介绍显示,Bloomberg GPT同样基于典型的Transformer架构,Bloomberg GPT的模型参数介于GPT-2与GPT-3之间,GPT-2模型参数为1.5亿,GPT-3模型参数为1,750亿,Bloomberg GPT的模型参数为500亿。
官方论文《Bloomberg GPT: A Large Language Model for Finance》中的测试结果显示,Bloomberg GPT在执行金融任务上的表现超过现有的通用LLM模型,在通用场景上的表现与现有通用LLM模型能力基本持平。
尽管Bloomberg GPT的模型参数相较于GPT-3较小,但分析师表示,依托彭博社的大量金融数据源,Bloomberg GPT在预训练中获得了大量高质量金融数据,并对预训练数据进行了一系列的清洗、标注,Bloomberg GPT在通用能力与GPT-3基本持平的情况下,实现了金融垂直能力的大幅增强。
Bloomberg GPT在开发方式上有何独特之处?分析师认为,在模型构建上,Bloomberg GPT显示出了卓越的创新,为国内金融数据公司开发大模型提供了有意义的路径参考。
具体而言,主要体现在五个方面:
1)垂直领域语言模型:过去的大语言模型多为基于通用文本训练的通用模型,垂直领域模型多为仅基于垂直领域数据训练垂直模型,Bloomberg GPT开创了通用+垂直的混合训练方法,让模型兼具通用性与专业性;
2)训练数据:过去的大语言模型的预训练数据很大程度上依赖于网页抓取数据,如C4、ThePile、Wikipedia等,Bloomberg自建了高质量的大规模金融数据集;
3)模型评估:Bloomberg在对模型进行了公共、金融NLP基准测试之外,还对模型进行了一系列基于Bloomberg内部任务的性能测试;
4)Token化(Tokenizer):将训练文本Token化是模型训练的关键步骤,Bloomberg使用Unigram模型取代greedymerge-basedsub-word模型,实现更智能的token化转换;
5)模型构建方法:以GPT-3、GPT-4为代表的大语言模型均由大型的专业人工智能团队开发,并且模型训练需要大量算力;受益于开源模型BLOOM的项目实践与Bloomberg在垂直领域高质量数据的深厚积累,Bloomberg GPT成功证明了一个中等规模的团队可以在垂直领域的特定数据上生产同样具有竞争力的大语言模型。
分析师认为,Bloomberg GPT未来有望应用于以下三大场景:
1)Bloomberg查询语言的生成:Bloomberg GPT可以将用户自然语言查询转换为有效的Bloomberg查询语言,使与金融数据的交互更加自然;
2)新闻标题的建议:Bloomberg GPT可以为Bloomberg的新闻应用程序提供支持,协助新闻工作者完成新闻短标题的撰写;
3)金融问答:得益于金融垂直领域知识的输入,Bloomberg GPT可以更加准确地回答金融相关的问题,例如在识别公司CEO的问答上,Bloomberg GPT的回答相较通用模型更为准确。
分析师指出,作为并非聚焦人工智金融垂直领域厂商,Bloomberg为金融GPT发展提供了具有参考价值的有益示范。
掌握丰富的金融垂直知识与现有AI产品布局,基于高质量的金融数据与开源的大语言模型,同样有机会打造专属金融场景的大语言模型,实现大语言模型在金融场景的有效落地,让大语言模型成为底层的AI操作系统。
本文主要观点来自华泰证券分析师谢春生(执业:S0570519080006)撰写的报告《从BloombergGPT看金融GPT机遇》,有删节
本文来自华尔街见闻,欢迎下载APP查看更多
2023年3月30日,金融信息提供商彭博社发布了专为金融领域打造的大语言模型(Large Language Model,LLM)Bloomberg GPT。该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内
近期chatGPT异常火爆,仅仅用了60 天用户就直接破亿,这是何等可怕的速度!于是乎国内外大厂纷纷追随 AIGC 步伐, ChatGPT 引领 AI 在科技圈一路“狂飙”!由于涉及到太多的专业词汇,开始之前,先通俗易懂的解释这些词汇(图1
华泰证券(06886.HK)发布公告,该公司境外全资子公司华泰国际金融控股有限公司(华泰国际)的附属公司华泰国际财务有限公司(华泰国际财务)于2020年10月27日设立本金总额最高为30亿美元的境外中期票据计划(中票计划),此中票计划由华泰
华泰证券(06886.HK)发布公告,境外全资子公司华泰国际金融控股有限公司(华泰国际)的附属公司华泰国际财务有限公司(华泰国际财务)于2020年10月27日设立本金总额最高为30亿美元(或等值其他货币)的境外中期票据计划,此中票计划由华泰
智通财经APP讯,华泰证券(06886)发布公告,该公司境外全资子公司华泰国际金融控股有限公司(华泰国际)的附属公司华泰国际财务有限公司(华泰国际财务)于2020年10月27日设立本金总额最高为30亿美元的境外中期票据计划,此中票计划由华泰
记者 | 王鑫5月26日晚,华丽家族(600503.SH)公告称,向华泰证券(601688.SH)出售其持有的华泰期货40%股权,对价为15.9亿元。根据评估报告,华泰期货股东全部权益账面值33.42亿元,评估值39.76亿元,较账面值增值
布局16年,华泰证券终于即将拥有全资期货子公司。5月26日,成立31年的华泰证券在开业纪念日这天,收到了一份独特的生日礼物——其与上市公司华丽家族签署《股权转让协议》,拟以15.9亿元现金收购华泰期货40%股权。本次交易完成后,华泰期货将成
智通财经APP讯,华泰证券(06886)公布,华泰证券股份有限公司 2020 年面向专业投资者公开发行公司债券(第六期)(品种一)将于 2022 年 12 月 9 日开始支付自 2021 年 12 月 9 日至 2022 年 12 月 8
华泰证券(06886.HK)发布公告,2022年10月28日,公司作出决定,同意华泰资管公司(公司全资子公司)利润分配方案,向公司分配利润人民币30亿元。公司将于近期收到上述分红款。截至2022年10月28日收盘,华泰证券(06886.HK
徐翔家族概念股华丽家族,这回要华丽转身了吗?5月26日晚间,华丽家族一口气发了几十份公告,主要讲了其拟作价15.9亿元出售所持的华泰期货40%股权给华泰证券的事情。华丽家族表示,如果交易完成后公司2021年净利润将大幅下降,但这并非自身业务
e公司讯,华泰证券最新研报指出,展望2023年,轻工制造板块机遇与挑战并存,我们建议从三条主线把握行业投资机会。1)受益于行业分化:急剧变化的市场环境下龙头竞争优势愈加凸显,逆势加速份额提升,重点推荐内功强化、长期成长逻辑顺畅的家居龙头及消
萧箫 发自 凹非寺量子位 | 公众号 QbitAI真·开源GPT模型,终于来了。参数量级130亿,大小比肩最近Meta开放的LLaMA-13B,但从数据集、模型权重到计算优化训练,全部开源。最关键的是,可商用。没错,虽然就GPT-3而言,之
丰色 发自 凹非寺量子位 | 公众号 QbitAI最强组合:HuggingFace+ChatGPT ——HuggingGPT,它来了!只要给定一个AI任务,例如“下面这张图片里有什么动物,每种有几只”。它就能帮你自动分析需要哪些AI模型,然
周鸿祎周鸿祎再次公开谈及自己对人工智能的未来判断。3月25日,2023中国发展高层论坛开幕,三六零(601360.SH,下称“360”)集团创始人周鸿祎以“人工智能与未来安全”为题发表主题演讲。演讲中,周鸿祎展示了AI绘图生成的自画像,以及
智东西编译 | ZeR0编辑 | 漠影智东西3月15日消息,今日凌晨,万众瞩目的大型多模态模型GPT-4正式发布!OpenAI发文称,GPT-4能接受图像和文本输入,输出文本内容,虽然在许多现实场景中的能力不如人类,但在各种专业和学术基准测