分销赏收藏举报申诉 / 10

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于语义理解的精简智能搜索优化模型浅析及实践.pdf

基于语义理解的精简智能搜索优化模型浅析及实践.pdf

上传人：自信****多点

文档编号：641735

上传时间：2024-01-22

格式：PDF

页数：10

大小：2.04MB

《基于语义理解的精简智能搜索优化模型浅析及实践.pdf》由会员分享，可在线阅读，更多相关《基于语义理解的精简智能搜索优化模型浅析及实践.pdf（10页珍藏版）》请在咨信网上搜索。

1、 61 基于语义理解的精简智能搜索优化模型浅析及实践文/罗钦雨1，王宇1*，王慧1，汪思哲2（1.河海大学，南京 210098；2 南京信息工程大学，南京 210044）摘要：本文针对个人或小型机构难以构建自己的搜索系统，使用互联网或特定大企业的平台导致的结果不全面、精度低等现状。基于语义理解和大模型在这方面的训练和应用。通过微量参数微调、主要开源模型生成式本地优化、引导性设计，构建了可边缘处理基准数据集的最精简部署，仅需不到20G的显存开销。通过理解信息源关系、引用位置准确性和回答特定任务的测试，测试结果表明此模型能在极短时间内给出高效、精确的回答。关键词：智能搜索；大模型；生成式 AI；边

2、缘部署；特定任务中图分类号：TP391 文献标志码：A 文章编号：2096-5036(2023)04-0061-10DOI：10.16453/j.2096-5036.2023.04.007基于语义理解的精简智能搜索优化模型浅析及实践0 引言传统的搜索引擎主要通过关键词匹配的方式获取结果，返回与用户输入关键词有关的内容，这种结果的准确性受到关键词的限制，无法满足用户的实际需求的同时，也无法处理语义相似的查询，而产生漏洞或误导用户。通常使用基于语义理解的智能搜索模型。它通过深度学习和自然语言处理以更好地理解用户的查询意图和实际需求。这就是大模型在问答理解和生成上高效且实用的原因。近年来，拥有强大语

3、义理解能力和准确预测能力的大模型相继被推出，它们参数量巨大，并获得通过预先处理的大量文本语料库数据，以及无监督的方式，学习了广泛的人类语言知识和语义信息。采用符合人类学习和问答习惯的技术路线，以构建的智能搜索和问答系统成为当前热点。如何在准确性、无害性和高效性等方面提升，具有极其重要的研究意义和实用价值。本研究通过对GPT-3、BERT等模型的内核进行解析，结合LangChain框架做部署，再使用语义理解的文本相似度检索方式构建测试集，揭示了在生成的结果中给相关段落带上准确的引用标记，提高搜索的效率的原理，并为企业或者个人研究者提供离线的高效、智能的内外部搜索系统部署做了规划和尝试。62 专题

4、：AIGCAI-VIEW2023 年第 4 期从 AlexNet 在 ImageNet 图像分类挑战赛利用了深度神经网络中的卷积层、池化层和大量的参数进行训练1开始，Word2Vec 利用大量的语料库训练出了高质量的词向量作为大模型的重要基础之一2,3。随后，Transformer 模型利用自注意力机制和位置编码的思想，既解决了 RNN 速度缓慢的问题，又同步获得了文本的上下文信息，还能理解长文本并快速响应3,4。虽然 GPT-1 利用了大量的参数和预训练技术5，与BERT6利用了掩码语言模型和下游任务微调相结合的方式不同，但其目的都是可以有效地解决自然语言处理任务中的上下文理解和语义表达问题

5、。因此形成两种方向，一方面通过 BERT 在当前需要的下游任务上取得优秀效果的方式，另一方面 GPT 自回归语言模型更希望从长远时间上挑战通用人工智能的可能性。为了推进 GPT 类型研究范式的进展，OpenAI 于 2019 年提出了利用了更多的参数和更高级的预训练技术 GPT-2，还使用特殊的控制代码实现特定的生成任务，大大提高了模型的表现7。2020 年,Google 提出了利用文本到文本的预训练技术 T5，实现了任务特定的输入格式，使得模型能够在多个自然语言处理任务中实现零样本学习8。在自然语言处理领域，OpenAI 在 GPT-3 系列上利用了更多的参数和更高级的预训练技术，使得模型能

6、够在多个自然语言处理任务中实现零样本学习，并具有超常的文本生成能力9-11。目前，大模型的研究与应用面临诸多挑战。首先是大量的软硬件资源需求，因此近期国内外也将研究热点聚焦在轻量化部署和层参量微调技术。其次是多参数的训练对数据的质量和数量都提出了更高的要求。但是，与国外先进技术相比，国内的开源数据平台和数据质量都相对欠缺，并且互联网语言资源和环境更封闭，获取优质数据相对困难。最后，大型语言模型的可解释性和安全性也是一个重要的问题，在很多领域（如金融、医疗、司法等），模型的决策会对人们的生活和利益产生直接影响。因此，理解模型的决策过程和背后的原因是非常重要的。综上所述，本文旨在通过大模型相关技术

7、建立一个离线的、私有化的本地大模型搜索和问答系统。该离线、高效的系统只需要相对较少的显存资源，不受任务数量的限制和影响，并且该模型响应速度快，返回结果准确，节省大量时间，可以很好地辅助小型企业或个人研究者充分利用大规模语言模型的能力定制任务，提高办公效率，并在使用场景上发挥创新。1 智能搜索优化模型系统架构1.1 智能问答模块智能问答模块的主要逻辑结构如下。1)输入处理：模型首先接收用户输入的问题 Query,然后结合特定任务预设的Instruction 以及 Prompt 生成完整的 Completion，也就是模型读入的真正内容。模型需要理解这个 Completion 的含义，确定它需要完

8、成的任务类型。2)任务理解和转换：一旦模型理解了任务类型，它会将 Completion 转换为一个 63 基于语义理解的精简智能搜索优化模型浅析及实践内部表示，即一个高维度的向量。对于所有任务类型，模型会将其转变成一个生成任务来处理。这需要模型提取出问题的关键部分，确定需要寻找的信息类型，以及识别任何需要引用的上下文信息，最后给出生成的内容。3)信息搜索和处理：对于问答任务，模型会在其训练数据构建的向量表示中“搜索”可能的答案。也包括在模型对应加载的知识库中查找相关信息，以及使用模型的推理能力从用户输入的上下文信息中推导出新的信息。4)答案生成：一旦模型生成了对应的 tokens，它会将这些内

9、容的文本嵌入表示转换为自然语言形式，并选择从概率最高的 N 个可能的回答中确定一个或者多个，这取决于任务的具体要求。1.2 智能搜索模块在近年的信息检索领域，自然语言处理（NLP）技术的发展为实现高效的本地知识库搜索应用提供了有力支持。尽管我们可以通过大模型进行有效的问答对话并且输入长度为 4096 个 tokens 的 Prompt，甚至在 GPT-4 中是 8000 个 tokens12，但这种方式依然有非常多限制。如果我们想基于一本书进行问答，那么这种方式将完全无法胜任13。本节将介绍并实现一种基于向量索引的文本相似度计算方法，以便在本地知识库中快速找到与查询文本相关联的信息片段。这种方

10、法针对企业内部搜索业务场景，脱云私有化部署，提高搜索效率、降低搜索成本，并且准确、快速响应来适应激增的需求，实现原理如图1 所示。基于本地文档搜索的智能问答系统具有以下要素。1)文本识别：智能问答系统的基础，采用 OCR 等技术或 pypdf 等库识别文本，提取文本内容。2)段落划分：在智能问答系统中，文档被分成不同的段落，以有逻辑地组织和检索信息。段落划分可以基于段落的长度进行，如将文本按照字符数或词数进行划分。在 CharacterTextSplitter 中，可以设置 separator=n 根据换行符等特定标记进行划分，也可以指定 chunk_size 限定每一个划分出来的文本的长度。

11、为了使不同的文本之间有逻辑关联性，同时也为了防止答案句被划分到了两个不同的段落中，chunk_overlap 通常被加入到参数中，这表明分割前后的两段文本块有多少内容是重叠的。这种方法有利于将文本分成逻辑上相关的部分。3)文本嵌入模型：采用将文本表示为向量的技术。文本嵌入模型有很多，通常使用图 1基于大模型的智能搜索及问答系统架构图 64 的包括 ERNIE-Tiny、ERNIE-Base、text2vec-base、text2vec 等，这些模型可以将文本的语义信息转化为连续的向量空间，而不是根据关键字匹配。4)Vector_Store：一个文本向量索引的存储工具，相当于一个数据库，接受上一

12、步向量化后的文本段落信息并长期保存在存储空间中。这样，当一个新的 query 进来后，模型不需要再次将本地所有相关的文档进行一次划分和向量化，而是直接可以根据余弦相似度计算返回最相关的几个段落。这种方式保证了本地搜索问答的高效及快速响应的需求。2 基于语义理解的智能搜索优化模型2.1 Prompt Engineering许多研究表明，大模型在预训练之后可以获得解决各种任务的能力14。然而，大模型的能力实际上可以根据特定目标进一步调整。而解锁大模型能力的最重要一步就是Prompt Engineering（提示工程）。Prompt engineering 关注于设计和优化用于训练 AI 模型的 P

13、rompt 提问。构建一个好的 Prompt 不仅对模型的推理结果有很大的改进效果，更重要的是能通过 Self-Instruct 方式构建质量良好的数据集。2.1.1 Prompt 组成通常而言，一个精心设计的 Prompt 由以下几部分按照顺序组成。1)Instruct：Instruct 通常明示了一个模型的角色、功能、任务类型等。一个简单、明确的 Instruct 至关重要。2)Description：Description 是对任务的具体描述。从结构角度看，它是对Instruct 的扩展和补充。在编写 Description 的时候，应尽可能详细地给出任务细节，并告知模型相应的生成要求和

14、约束。3)Question：Question 通常是用户输入的问题或是要求。由于用户输入的灵活性很高，这部分的内容没有特定格式要求，在最终会被拼接在 Instruct 和 Description之后。4)Context：在某些任务中（如文本问答、信息抽取和实体识别），用户除了输入 Question 之外，还需要提供一系列信息供模型做推理。这部分的信息通常就是Context。在生成过程中，Context 非常重要，因为这给定了模型一个目标范围，而不是从模型自身参数中提取信息来作答。这种方式能大大提升模型回答的准确性和无毒害性。Context 可以是任何形式，甚至是表格，它的位置可以放在 Ques

15、tion 模块的下部，通过换行符、反引号或是其他特殊符号做分割。2.2 微量参数微调方式随着大模型参数量激增，传统的全局 Finetune 变得不再可行。对于上百亿甚至上千亿的模型而言，全局参数微调的成本高得令人望而却步15。LoRa 和 P-Tuning v2都是微调机器学习模型的方法，但它们的具体实现方式有所不同。LoRa 是一种基于层专题：AIGCAI-VIEW2023 年第 4 期 65 基于语义理解的精简智能搜索优化模型浅析及实践级相关性传递的微调方法，而 P-Tuning v2 是将文本生成的 prefix-tuning 技术适配到NLU 任务中的微调方法15,16。2.2.1 L

16、oRaLoRa 利用固定的预训练模型权重，向 Transformer 架构的各个层注入可训练的分解等级矩阵，以减少下游任务的训练参数数量，从而增强了通过微调后的模型在多个独立实例上的存储和部署的可行性。x0 x0AWWWBxxh+=+=在式(1)中，h表示 LoRa 模型的输出，此输出是通过将预训练模型的输出x0W和等级分解矩阵的输出xW相加得到的。其中，等级分解矩阵又可以表示成xAB，它们是注入到 Transformer 架构的每一层的可训练的参数。此外，xW是预训练模型和 LoRa模型的输出的差异，它衡量了 LoRa 方法减少训练参数量的有效性。在 LoRa 中，Rank 是一个超参数表示

17、注入 Transformer 架构层的等级，会影响训练速度、参数数量和内存需求等。2.2.2 P-Tuning v2在传统大模型任务中（以 GPT-3 为例），模型会加入一些短语句子作为输入，这就是我们说的 Prompt。然而，这些 Prompt 只是作为输入文本的一部分输入给模型做推理，不会增加任何参数。Prompt Tuning 的主要思路是把传统的 Prompt 变成了可学习的向量，并固定了整个预训练模型的参数，只训练 Prompt 向量来适配下游任务15。Prompt Tuning 的原理如图 2 所示。P-Tuning v2 与全局微调的性能相当，但只需要微调0.1%3%的参数16。

18、跟Prefix-Tuning在每一层都加大量的Embedding相比，Prompt Tuning 只在输入层加 Embedding 的方法更加简单有效16-17。3 实验结果与分析3.1 数据集概述对于现在的大模型而言，数据是影响模型能力最重要的因素之一。构建一个高质量的数据集对于模型在特定任务上的表现有很大帮助。本文除了研究基于语义理解的大模型问答系统，还做出了以下测试。1)在 T2Ranking 数据集的基础上构建了 PsQscore 数据集，此数据集由一个问题和多个段落组成，通过人工标注的方式给出了每个段落和这个问题的相关性分数。2)在Chinese Scientific Literat

19、ure Dataset、CNN-DailyMail News Text Summarization(1)图 2PromptTuning 原理图 66 和arXiv Dataset的基础上生成并构建了Anki_Card数据集。3)融合 Dureader 和 Stanford 的 BeerQA 数据集构建了一个中英文双语段落问答数据集ParaGem。此数据集由问题和多个带标号的段落组成。答案从段落总结出来，带引用回答。本文在构建自体数据之外，首先，选用了 CSL-大规模中文科学文献数据集、Math23K 数据集、CCKS2021 金融领域篇章级事件元素抽取数据集、

20、WikiTableQuestions、cMedQA、Finance-alpaca-csv 这些优质的公开数据集作为指令微调的训练数据。其次，使用正则化循环匹配的方式处理了中英文及所有标点格式的问题，统一化为标准格式，再针对一些常出现的“脏数据”进行匹配筛查等操作对数据进行清洗。最后，使用 BLEU 指标评估机器翻译等任务的性能，ROUGE 指标用于评估自动摘要的性能。对于分类任务，文中使用准确率、召回率、F1 分数进行评价。对于使用 T2Ranking 数据集构建基准数据集18。它由超过 30 万的真实查询和200 万的互联网段落构成，包含了由专业标注人员人工标注的 4 级细粒度标签，分别为

21、0、1、2、3，分数越高表示段落与问题越相关，分数为 0 表示段落与问题毫不相关。在此数据集的基础上，文中采用随机段落抽取和标号对应的方式构建了一个数据集PsQScore，用于评估模型生成结果的准确率、召回率和 F1 分数。3.2 实验结果3.2.1 Prompt Engineering 实验分析为了对比使用精细设计的 Prompt 和不使用格式化的 Prompt 的区别，本文设计了消融实验，分别训练了两个模型，结合预训练模型做多种代表性任务，并根据任务类别分别在 100 条测试数据上做推理，评估三者生成表现。两种 Prompt 方式针对不同任务在不同指标上的得分情况如表 1 所示。3.2.2

22、微量参数微调实验分析由于 Prompt Tuning 的方法是将 Prompt 变成 Embedding 的形式进行反向传播做梯度下降，因此一个任务需要训练一个 Prompt 的参数，只适用于单任务微调。尽管 IBM 在文献 19 中给出了多任务 P-Tuning 调参的方法，其本质依然是针对每一个任务训练一个 Prompt 的 Embedding 参数，然后在一起训练。这意味着如果有 n 个任务，将要训练 n 倍的参数。对于私有化部署的大模型来说，从训练成本和时间上都是专题：AIGCAI-VIEW2023 年第 4 期表 1两种 Prompt 方式针对不同任务在不同指标上的得分情况评估指标

23、文本问答（中文）文本问答（英文）数学推理标题生成BLEU预训练模型32.3541.392.926.77使用设计的 Prompt47.5748.198.9812.07不使用格式化的 Prompt44.5837.616.0212.58ROUGE预训练模型41.1746.254.339.69使用设计的 Prompt56.9666.346.1213.82不使用格式化的 Prompt50.2348.668.2610.74 67 基于语义理解的精简智能搜索优化模型浅析及实践不可接受的。因此，为了比较 LoRa 和 P-Tuning v2的性能，使用 BeerQA 数据集做带引用回答的单任务训练进行评估。单

24、任务背景下两种模型微调方式在不同指标上的得分情况，如表 2 所示。从表 2 可以看出，P-Tuning v2 除了在Rouge-1(f)和 Rouge-L(r)指标上略低于LoRa，在其他指标上均比 LoRa 微调具有更好的性能。然而，P-Tuning v2 在指标上没有展现出压倒性的巨大优势，并且在实际生成效果中，从人类主观判断，二者也难分上下。考虑到LoRa在多任务微调上的显著性优势，最终选择 LoRa 作为模型训练的方法。3.2.3 单任务精调大模型的训练成本高昂，需要大量的计算资源和数据，因此在实际应用中，往往需要对大模型进行单任务 fine-tune,即只对模型的部分参数进行调整，而

25、保留模型的整体结构。这种方法可以在不增加计算成本的情况下，提高模型在特定任务上的性能。以适应专门领域的任务需求20。单任务 fine-tune的发展可以追溯到早期的深度学习研究。随着深度学习技术的不断进步，也逐渐成为了一种常用的模型优化方法，已经被广泛应用于各种自然语言处理、计算机视觉等领域的任务中，如文本分类、情感分析、图像分类、目标检测等20,21。对于本任务而言，单任务精调的目的是作为基准和多任务精调做对比，以评估多任务精调后模型是否会损失性能。使用 LoRa 方法微调 ChatGLM-6B，针对带引用的摘要回答任务得到的训练曲线，如图 3 所示。使用 Prompt Tuning 方

26、法微调ChatGLM-6B，针对带引用的摘要回答任务得到的训练曲线，如图 4所示。表 2单任务背景下两种模型微调方式在不同指标上的得分情况指标LoRaP-Tuning v2Average BLEU 42.4445.55Rouge-1(r)63.5165.00Rouge-1(p)66.5868.62Rouge-1(f)62.7262.03Rouge-2(r)45.0046.98Rouge-2(p)46.2547.68Rouge-2(f)43.4445.69Rouge-L(r)52.4851.23Rouge-L(p)55.2757.35Rouge-L(f)50.9752.74图 3使用 Lo

27、Ra 方式微调 6B 模型的 TrainingLoss图 4使用 P-Tunigv2 方式微调 6B 模型的 TrainingLoss 68 专题：AIGCAI-VIEW2023 年第 4 期硬件资源使用率如图 5 所示。3.2.4 多任务精调多任务精调是指在一个模型中同时学习多个相关任务的技术。它的思想是利用一个共享的特征提取器（通常指预训练模型的前几层）处理多个任务。每个任务都有一个特定的输出层，用于预测该任务的目标22。与单任务学习相比，在多任务精调中，模型通常会共享一部分参数，这些参数会被训练成一个共享的语言表示空间。也就是说，多任务精调可以利用不同任务之间的相关性来提高模型的泛化能力

28、和性能表现23。此外，多任务精调还可以通过调整损失函数权重的方式平衡不同任务之间的重要性，从而提高模型在多个任务上的表现。由于下游任务种类繁多且评价指标大相径庭。本文选择四种典型任务的微调效果判断多任务微调和单任务微调的效果差异，实验结果如表 3 所示。从实验结果看，多任务精调后模型和单任务精调相比不会损失性能。相反，多任务图 5模型训练过程中的硬件资源相关占用情况BLEUROUGEPRECISIONRECALLF1-SCORE文本问答单任务微调21.6155.8767.5081.0870.87多任务微调12.4958.8969.3782.2373.15ROUGE-PROUGE-RROUGE-

29、F标题生成单任务微调22.61-49.2044.4146.68多任务微调21.51-42.1146.9342.76同义改写单任务微调5.63-35.7026.8428.46多任务微调6.53-44.6529.8533.59数学推理单任务微调39.51-74.4770.4172.00多任务微调42.15-81.3977.9679.48表 3对比多任务微调和单任务微调后的模型在特定任务上的表现 69 基于语义理解的精简智能搜索优化模型浅析及实践学习具有很好的泛化性能。正如文献 19 所述，对于有些任务的数据不足问题，也能借助其他任务得到训练。另外，它还能起到正则的作用，即很难使某个任务过拟合以保证

30、整个模型的泛化性能。因此，多任务精调后的模型可能会比单任务精调的模型更具有泛化性能。4 结束语本文基于 ChatGLM-6B 模型和 LangChain 框架实现了一个基于大模型的智能问答系统。使用基于 LoRa 方法的指令微调模式，训练模型执行 9 个不同的任务。实现结果证明，此模式响应速度快，返回结果准确，生成文本对齐人类意图和价值观。同时，此系统占用资源较少，在单卡 A100 上部署只需 20GB 显存且不受任务数量的限制和影响。尽管我们的系统在多个方面表现出了优秀的性能，但仍存在一些不足。第一，在对比 LoRa、Prompt Tuning 微量参数微调方法和单任务、多任务训练效果之后，

31、通过 LoRa 的训练方式精调了 ChatGLM-6B 模型，做到了 ChatGPT 等大模型无法达到的精确、规范地带引用摘要的回答任务。第二，基于训练好的模型，通过 Gradio 和 LangChain 构建了一个生成式 AI 为内核的智能搜索及问答的私有化部署系统。第三，本研究在大模型带引用回答任务上针对性地改进了准确率、召回率等评价方法，构建了基准评估数据集。结论表明，本系统背后的模型在理解信息源关系、引用位置准确性和回答特定任务等方面展现出了优秀的能力。此外，测试结果表明，此模型的部署仅需不到 20G 的显存开销，并能在极短时间内给出高效、精确的回答。由于我们系统的基座模型是基于 Ch

32、atGLM-6B 构建的，而 6B 模型的 62 亿参数相对较小，可能存在一定的局限性，如产生有毒信息或无法理解复杂指令。虽然这个问题可以通过更换更大的基座模型（如 MOSS）得以解决，但训练更大体量的参数会同步带来更高的硬件要求和资源消耗。参考文献1 KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Imagenet classification with deep convolutional neural networksJ.Communications of the ACM,2017,60(6):84-90.2 MIKOLOV T,CHEN K,CORRADO G,

33、et al.Efficient estimation of word representations in vector spaceJ.arXiv preprint arXiv:1301.3781,2013.3 MIKOLOV T,SUTSKEVER I,CHEN K,et al.Distributed representations of words and phrases and their compositionalityJ.Advances in neural information processing systems,2013,26.4 VASWANI A,SHAZEER N,PA

34、RMAR N,et al.Attention is all you needJ.Advances in neural information processing systems,2017,30.5 RADFORD A,NARASIMHAN K,SALIMANS T,et al.Improving language understanding by generative pre-trainingEB/OL.(2018)2023-07-25.https:/ DEVLIN J,CHANG M W,LEE K,et al.BERT:Pre-training of deep bidirectional

35、 transformers for language understandingJ.arXiv preprint arXiv:1810.04805,2018.7 LIU X,ZHENG Y,DU Z,et al.GPT understands,tooJ.arXiv preprint arXiv:2103.10385,2021.8 RAFFEL C,SHAZEER N,ROBERTS A,et al.Exploring the limits of transfer learning with a unified text-to-text transformerJ.The Journal of M

36、achine Learning Research,2020,21(1):5485-5551.70 专题：AIGCAI-VIEW2023 年第 4 期9 DALE R.GPT-3:whats it good for?J.Natural Language Engineering,2021,27(1):113-118.10 FLORIDI L,CHIRIATTI M.GPT-3:its nature,scope,limits,and consequencesJ.Minds and Machines,2020,30:681-694.11 ZHAO W X,ZHOU K,LI J,et al.A sur

37、vey of large language modelsJ.arXiv preprint arXiv:2303.18223,2023.12 PEREIRA J,FIDALGO R,LOTUFO R,et al.Visconde:multi-document QA with GPT-3 and neural rerankingC/Advances in Information Retrieval:45th European Conference on Information Retrieval(ECIR 2023),April 26,2023,Dublin,Ireland.Cham:Spring

38、er Nature Switzerland,2023:534-543.13 COLTON S,SMITH A,BERNS S,et al.Generative search engines:initial experimentsC/Proceedings of the International Conference on Computational Creativity.ICCC,2021.14 QIU X,SUN T,XU Y,et al.Pre-trained models for natural language processing:a surveyJ.Science China T

39、echnological Sciences,2020,63(10):1872-1897.15 HU E J,SHEN Y,WALLIS P,et al.LoRa:low-rank adaptation of large language modelsJ.arXiv preprint arXiv:2106.09685,2021.16 LIU X,JI K,FU Y,et al.P-Tuning v2:prompt tuning can be comparable to fine-tuning universally across scales and tasksJ.arXiv preprint

40、arXiv:2110.07602,2021.17 LESTER B,AL-RFOU R,CONSTANT N.The power of scale for parameter-efficient prompt tuningJ.arXiv preprint arXiv:2104.08691,2021.18 XIE X,DONG Q,WANG B,et al.T2Ranking:a large-scale chinese benchmark for passage rankingJ.arXiv preprint arXiv:2304.03679,2023.19 WANG Z,PANDA R,KAR

41、LINSKY L,et al.Multitask prompt tuning enables parameter-efficient transfer learningJ.arXiv preprint arXiv:2303.02861,2023.20 SUN C,QIU X,XU Y,et al.How to fine-tune BERT for text classification?C/Chinese Computational Linguistics:18th China National Conference(CCL 2019),October 1820,2019,Kunming,Ch

42、ina.Springer International Publishing,2019:194-206.21 RIETZLER A,STABINGER S,OPITZ P,et al.Adapt or get left behind:domain adaptation through BERT language model finetuning for aspect-target sentiment classificationJ.arXiv preprint arXiv:1908.11860,2019.22 LIU F,LI G,ZHAO Y,et al.Multi-task learning

43、 based pre-trained language model for code completionC/Proceedings of the 35th IEEE/ACM International Conference on Automated Software Engineering.2020:473-485.23 SANH V,WEBSON A,RAFFEL C,et al.Multitask prompted training enables zero-shot task generalizationJ.arXiv preprint arXiv:2110.08207,2021.河海大学计算机与信息学院本科毕业。主要研究方向为金融领域大模型。罗钦雨河海大学计算机与信息学院硕士研究生在读。主要研究方向为大规模数据处理、智慧交通流预测。王慧河海大学计算机与信息学院副研究员，硕士生导师，博士。主要研究方向为超级计算、志愿计算、边缘计算，以及海量数据处理。*通信作者 email：王宇南京信息工程大学软件工程本科生在读。主要研究方向为大模型的测试和应用。汪思哲

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于语义理解精简智能搜索优化模型浅析实践

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。