度小满+金融大模型技术创新与应用探索.pdf
《度小满+金融大模型技术创新与应用探索.pdf》由会员分享,可在线阅读,更多相关《度小满+金融大模型技术创新与应用探索.pdf(46页珍藏版)》请在咨信网上搜索。
1、DataFunCon#2023金融大模型技术创新与应用探索2023.11.24目录2.金融大模型的训练技术创新3.金融大模型的评测方法创新4.金融大模型的应用实践创新1.从通用大模型到金融大模型从通用大模型到金融大模型重塑行业格局创造价值增量提升决策精度提高生产效率大模型有望为金融行业创造价值增量记忆理解生成知识大模型能力规划逻辑泛化性通用性实用性大模型涌现出超预期的能力大模型涌现超预期能力,有望为金融行业创造价值增量但通用模型难胜任金融任务,大模型落地金融面临挑战01金融知识挑战专业金融知识欠缺行业数据流通难知识更新时效长私域数据共享难02金融能力挑战能力不满足金融任务要求幻觉问题遗忘问题计
2、算准确性问题03应用成本挑战训练和运营成本高GPU算力成本推理成本能耗成本维护成本通过金融领域的定向优化,十亿参数模型在金融任务中的性能可与百亿参数模型媲美高质量的领域数据能够让模型领域任务表现媲美5倍大模型2小模型+金融增强=效果成本平衡经过金融强化的LLaMA2-13B,在多项金融考试任务上优于未经金融强化的LLaMA2-70B模型1Llama 2:Open Foundation and Fine-Tuned Chat Models,Meta2Textbooks Are All You Need II:phi-1.5 technical report,Microsoft Research大
3、参数通用模型训练和应用成本高70B13B7BGPU Hours11,720,320368,640184,32048台机器训练耗时187天40天20天LLaMA-2训练2T Tokens数据所需卡时(GPU Hours):优质通用模型训练和推理成本高昂较小参数模型是更经济选择GPU需求推理时间能耗成本维护成本70B13B7B推理显存129G26G14G需要显卡2*80G A1001*40G A100消费级显卡LLaMA-2推理所需资源:面对成本挑战,专项增强的领域模型更显高性价比定位最好的金融行业大模型,金融域任务表现超越领先通用模型为解决通用模型不胜任问题,度小满开源了轩辕金融大模型面向金融应
4、用场景,定向增强摘要、逻辑、计算等金融场景核心能力增量预训练和指令微调阶段,加入大量金融数据,提升金融理解能力使用百万级经人工构建和校验的高质量指令数据进行指令微调和对齐中文增强金融增强对话增强应用增强扩充中文词表,并使用大量高质量中英文语料进行二阶段增量预训练5月9月11月度小满开源了国内首个千亿级金融大模型轩辕-千亿度小满开源轩辕-70B大模型开源轩辕-70B-chat及8-bit和4-bit量化模型未来更多尺寸的轩辕大模型矩阵以轩辕70B为代表,轩辕大模型通用能力强大,金融能力领先在C-Eval和CMMLU两大权威榜单上,轩辕70B均名列所有开源模型第一轩辕70B已经通过注册会计师、银行
5、/证券/保险/基金/期货从业资格、理财规划师、经济师等金融领域权威考试,且考试得分领先于其他通用模型轩辕70B在度小满自有金融业务场景测试中表现领先,特别金融知识问答、NL2SQL等场景表现优异通用能力金融能力场景能力*榜单排名截止到Xuanyuan-70B开源发布日期2023年9月21日MODELMMLUCEVALCMMLUGSM8KMBPPBBHFinanceIQXuanYuan-70B70.971.971.1074.44371.467.56GPT483.9368.4070.9591.461.886.760.05ChatGPT69.152.553.978.260.270.144.2Llam
6、a268.952.1053.1163.539.664.936.02Baichun2-13B-base59.1758.1061.9752.630.84951.2Qwen-14B67.971.770.261.639.853.753.29各大主流评测集成绩通识基础 通识是领域认知的前提 在大规模通用文本数据上训练,掌握广泛的语言理解和信息处理能力,为后续学习奠定坚实基础行业赋能 从通识到专业深造 经过金融行业数据的训练,深入了解金融术语、行业案例、专家经验以及最佳实践,逐渐具备金融行业所需的专业能力场景反馈 从学习到实际应用的进阶 大模型在实际金融场景中得到反馈,是进一步提高性能和适应性的关键中学生
7、:接受通识教育大学生:接受专业教育职场人:以岗位产出为导向工程优化轩辕金融大模型:从通才中学生到专才职场人的进阶之路金融增强价值对齐应用增强金融大模型训练技术创新金融增强价值对齐应用增强工程优化增量预训练指令微调强化对齐为大模型注入专业金融知识,训练专业金融能力专业金融数据和标注满足行业偏好多样性指令激活问答能力海量金融语料提升金融知识储备动态调整中英比例与通用金融比例,避免灾难性遗忘信贷|理财|证券|投顾|客服金融场景打分合理,指导正确数据丰富配比合理场景细分类型细分数据专业标注专业RM鲁棒性强研报|财报|公告|资讯|百科|书籍金融百科|金融计算|资讯摘要|研报解读|角色扮演覆盖金融场景广全
8、面、反映金融行业偏好如何获得充分的金融知识,成为一个“金融专家”?金融知识 金融能力 金融场景设计一套通用的数据清洗流水线网页(Html)书籍(Epub)研报/公告(PDF)文本抽取多来源数据收集正文提取HTML标签移除PDF内容定制化解析格式规范化篇章级过滤行级别过滤数据清洗规则过滤模型过滤训练质量模型训练毒害模型单类别局部去重全局去重去重与校验MinHashLSH质量校验人工抽样校验小规模模型验证10TB通用语料高质量模型训练语料1TB金融语料数据准备:数据质量是模型效果的保障原始中文数据训练数据篇章级别过滤行级别过滤70%100%去重过滤60%质量模型35%32%中文大模型需首先考虑词表
9、构建问题,否则单字可能需要多个Unicode字符来构造解码速度变慢编码序列变长考虑到基座模型的训练稳定性,采取字粒度扩充方式加入7k的中文字符,新词表大小约39k,词表压缩率提升48%增量预训练:针对中文场景做词表构建词表优化字粒度扩充新增Token范围:5k-8k 模型破坏小压缩率低词粒度扩充新增Token范围:20k-100k扩充幅度大,模型破坏大压缩率高仅更新模型的词表特征及解码线性层使模型适应新加入词表纠正原始解码方式第一阶段数据分布与类型与原始模型保持一致中文50%英文50%训练约40B Tokens对模型进行全参数更新英文能力不下降中文能力大幅提升第二阶段提升通用中文和金融领域数据
10、占比英文25%中文60%金融15%训练约300B Tokens增量预训练:两阶段预训练使收敛更加稳定英文数据中文数据金融数据1:39:14:1CommonCrawl|BooksStackexchange|GithubWikiPedia|Arxiv中文百科|新闻资讯社交论坛|网页内容中文书籍|金融垂类金融资讯|研报公告金融百科|金融论坛金融书籍|.中文知识类优先:百科、书籍、论文等逐渐提升综合类中文语料:网页内容、新闻类等逐渐提升金融垂类语料英文数据持续训练英文:MMLU预期效果英文能力保持 中文知识增强 金融能力提升中文:CEVAL金融:FinanceIQ实际效果三项能力均随训练过程提升增量预
11、训练:数据配比直接影响基座模型的训练质量数据配比数据加入过程训练效果数据生成数据构造金融领域指令数据通用领域指令数据通用数据80%金融数据20%指令数据配比常识百科创意生成代码编程安全无害逻辑推理总结摘要数学计算信息提取金融百科8大类 50小类4大类 20小类金融计算研报解读客服话术标签类别体系构造人工撰写种子数据人工撰写自动生成Self-instructSelf-QA1Evol-instruct2校验评估人工改写1 Unsupervised Knowledge Guided Language Model Alignmen,Duxiaoman.2 Empowering large langua
12、ge models to follow complex instructions,Microsoft,Peking University.指令微调:SFT数据的丰富性和多样性直接影响对齐效果指令遵循泛化能力多轮对话通用能力保持金融能力增强训练数据格式 Human:你是谁Assistant:我是轩辕大模型.Human:你会干什么 Assistant:我可以.System MessageHumanAssistant训练目标函数Next Token Prediction,与预训练保持一致常规指令:使用Mask机制,Response处计算损失超长指令:计算全局损失,来提升长文本建模能力21 A lar
13、ge chinese financial chat model with hundreds of billions parameters,Duxiaoman.2 Effective long-context scaling of foundation model,GenAI,Meta.两阶段指令微调:保证通用能力同时,提升金融问答能力第一阶段:混合微调1第二阶段:指令微调海量开源指令数据+预训练数据(10M+)自研的高质量指令数据(200k)通用指令:金融指令=4:1金融大模型训练技术创新金融增强价值对齐应用增强工程优化未经对齐的模型在语言、安全、金融行业上表现和人类偏好不符语言部分表达方式非
14、中式思维部分常识性问题不合国情一些回答易夹杂外文单词安全部分观点不符合我国核心价值观部分敏感类问题缺乏口径对齐部分违法犯罪问题和我国实际不符金融语言表达不符合行业风格金融计算能力不足易出错观点提取及数据分析是短板价值对齐:通过强化学习对齐价值偏好语言prompt安全prompt金融promptLLMpromptres Ares Bpromptres Ares B promptres Ares BABAB A=BRMPairwise Data偏好标注Reward Model:学习人类在语言、安全、金融行业上的价值偏好对齐后对齐后对齐后大麻是一种什么样的植物?大麻是一种草本植物,属于大麻科。*。通
15、常被用于药用和工业用途。金融领域的ETF指的是什么基金?ETF全称为“交换贸易基金”,是一种在交换市场上市的、基金份额可变的资金。*碰到有人在打架怎么办?*,你可以拨打911联系当地执法部门,*语言对齐安全对齐金融对齐*,您可以拨打电话110报警,*大麻是一种直立草本植物,属于大麻科。*。需要注意的是,在我国大麻属于毒品,私种大麻是一种严重的违法行为。我建议您遵守道德和法律,禁止种植相关作物。*ETF,即Exchang traded fund,被称之为“交易所交易基金”,是一种在交易所上市的、基金份额可变的开放式基金,属于开放式基金的一种特殊类型。*价值对齐:通过强化学习对齐价值偏好金融大模型
16、训练技术创新金融增强价值对齐应用增强工程优化输出结果可靠性增强弥补大模型短板,提升模型输出下限系统工程输出质量稳定性提升输入对话中控NLU意图识别任务规划Query改写NLGPrompt工程Ranking答案生成答案组装Prompt工程记忆模块用户交互界面安全防护插件库LLM应用增强:升级系统工程,弥补大模型本身能力欠缺检索增强拓展工具用户信息业务知识库金融大模型训练技术创新金融增强价值对齐应用增强工程优化训练吞吐设备内存增长 模型规模增长模型规模和批次大小受限批次大小序列长度计算开销通信开销=*/(+)内存墙计算墙带宽墙算力提升 数据累积速度计算效率受限链路带宽 算力提升分布式规模效率受限内
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 小满 金融 模型 技术创新 应用 探索
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。