分享
分销 收藏 举报 申诉 / 25
播放页_导航下方通栏广告

类型中国通用大模型内容生成及安全性能力评测.pdf

  • 上传人:Stan****Shan
  • 文档编号:1431421
  • 上传时间:2024-04-26
  • 格式:PDF
  • 页数:25
  • 大小:3.93MB
  • 下载积分:25 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    中国 通用 模型 内容 生成 安全性 能力 评测
    资源描述:
    中国通用大模型内容生成及安全性能力评测2023年6月TE智库评测结果和发现01随着技术的不断进步和创新,以及数据规模的不断扩大,以文心一言为代表的中国本土通用大模型的能力正在显著提升,综合能力的行业平均水平已经与ChatGPT3.5不相上下02在“安全体系能力”方面,文心一言已经完全拉开了与GPT3.5的差距03在基础服务能力、交互响应能力、理解创作能力方面,国产通用大模型都能够表现出相当的水平,且不弱与GPT3.5的实测表现,但国产通用大模型已经初步形成了不同的能力梯队;在深度推理能力和专业领域能力方面,本次评测的所有通用大模型,所展现出来的能力,都存在较大的优化空间 对于明确的“任务”,能够做到准确的识别,执行的“任务”包括违法乱纪、恶意辱骂、隐私涉密、谣言造假等性质的问题;对于存在争议的内容的“任务”,能够客观持中的给出相关信息;对逻辑复杂且存在诱导类的“任务”,能够基于社会主义价值观针对性的做出正确“指引”。显著发生的“幻觉发生率”,反馈的内容包含大量在事实上无效或缺乏足够实践证明的说辞;很多反馈信息属于较为陈旧的信息,缺乏对专业领域知识及时更新的能力;反馈的信息仅限于罗列,缺乏有效的归纳,专业性不足。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)背景通用大模型生成内容的开发和使用,也需要遵守相关法律法规和道德规范01亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库快速发展的通用大模型2020年2个2021年30个2022年28个2023年19个全球已发布认知大模型,中美共占80%,中国已有79个大模型。CVNLP多模态语音智能决策AI4S不同领域大模型数量高校/科研机构联合企业高校/科研机构11288联合-572企业113139中国大模型的发展Source:中国科学技术信息研究所中国人工智能大模型地图研究报告亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库需要走规范化的路径,引导相关技术的健康发展中国坚持全面依法治国,推进法治中国建设。在此过程中,为了保障生成式人工智能技术的规范发展,保护网络安全、数据安全、个人信息等,确保生成式人工智能技术的发展符合国家利益和公众利益;同时规范生成式人工智能服务提供者的责任和义务,规定其严格遵守相关法律,确保服务的合法、安全和有序发展。中国相关部门陆续出台了生成式人工智能技术相关的法律法规:安2023年2月15日发布生成式人工智能服务管理办法(征求意见稿)全2020年10月15日通过中华人民共和国个人信息保护法合2019年8月20日通过中华人民共和国数据安全法规2016年11月16日发布中华人民共和国网络安全法亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库做好通用大模型生成内容安全性评测的意义和价值降低法律的风险在生成的内容中,可能存在违反法律法规的情况,如传播不良信息、侵犯他人权益等。通过安全性管理和评测,可以避免这种情况的发生,降低法律风险。促进技术的发展安全性管理和评测是人工智能技术发展的重要保障。通过加强安全性管理和评测,可以推动人工智能技术的不断创新和发展。保护用户的利益大模型生成的内容包括各种形式的信息,包括文本、图片、视频等,其中可能包含敏感信息、隐私信息或具有误导性的信息。通过安全性管理和评测,可以确保生成的内容符合用户需求和期望,保护用户的利益。提高模型的质量通过评测可以发现模型中存在的问题和缺陷,及时进行修复和优化,从而提高模型的质量和准确性。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)方法强化数字化技术与应用发展法治化建设、护航中国数字经济与实体经济稳健发展02亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库通用大模型的评测步骤Step 1Step 2Step 3Step 4评测标准研制评测环境部署备选模型评测评测结果输出亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库评测标准研制确定评测标准的范围明确本次通用大模型生成内容安全性测评标准研制的目的、适用的范围,方便后续的评测工作能够有针对性地进行。制定评测标准的草案在确定标准的需求范围后,制定本次评测标准的草案。草案在经过多方多轮次专家反馈后,多次修改和完善,确保标准的准确性和可行性。征求评测标准的意见制定好标准草案后,向相关的利益相关者征求意见和反馈。这些利益相关者包括但不限于行业协会、业内企业等。评测标准研制的方法和步骤确定评测标准的范围制定评测标准的草案征求评测标准的意见试运营评测标准亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库本次研究的评测标准基础服务能力交互响应能力理解创作能力深度推理能力专业领域能力安全体系能力能力描述常见语义和描述的识别、交互能力在语义和描述的理解与交互能力基础上、实现顺利的交互响应能力基于对语义和描述的理解,实现针对性的生成创作能力整合情感及中文内涵特性进行深度推理的创作交互能力对不同行业、不同行业特定场景的理解、相应知识与信息的交互能力法律法规要求限定的,包括伦理道德、隐私保护、违法犯罪、负面诱导等方面的防护能力具体指标常见语义和描述的识别识别并理解交互的语境多轮次对话的一致性理解诗词成语且进行创作交互行业领域:制造、金融、能源、教育法律法规限定与要求常见语义和描述的匹配常识性知识与信息的交互涉及多个领域的任务对话识别对话环境与情绪要求场景领域:生产、运营、管理、财务、物流伦理道德与负面诱导常见语义和描述的检索常识性知识与信息的连续交互根据文本材料的理解输出观点基于对话环境与情绪要求进行创作交互行业与场景的交叉领域:流程制造行业的物流、离散制造行业的仓储恶意辱骂与歧视偏见常见语义和描述的对话角色要求下的常规聊天模式的交互根据文本材料的理解输出标题或摘要创新业务领域:新零售、数字化营销、共享服务隐私安全与保护角色要求下的语义和描述的对话角色要求下的专业知识与信息的交互针对特定要求的理解输出专门文案虚假信息甄别与检测经过多方多轮次专家的建议与修订,拟采用如下评测标准,包括6大维度27个细化的指标项,作为对通用大模型进行评测的基础标准。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库本次研究的评测方法针对通用大模型的评测,采取统一的评测环境,包括:评测标准、评测范围、评测工具、计分方式。评测范围评测工具计分方式时事与政治历史与文化经济与社会舆论与热点人文与科技行业与场景RPA评测工具评测对象大模型返回生成内容并记录基于评测标准的提示语料1.每个提示语料做为一次评测任务,即一个记分点;2.对应每个具体维度的评测指标,设置100个评测任务;3.每执行一个评测任务,对结果进行确定,正确回答得相应的积分。即对应每个相关评测指标,验证每个评测任务结果的对错,正确记1分,答错或未作答记0分,最终取100个任务中正确结果的占比为对应标评测标准的积分;4.每个具体维度的得分,为对应评测指标得分/测评指标数量;5.大模型总分=评测的维度得分汇总/6。以中文形式表达的评测任务亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)评测基于实测信息反馈,助力国产通用大模型优化和推广03亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库尽管中国本土通用大模型在初始化阶段落后于国外产品,但随着技术的不断进步和创新,以及数据规模的不断扩大,中国本土通用大模型的能力正在逐步提升,综合能力的行业平均水平已经与ChatGPT3.5不相上下。综合能力评测结果Source:国产通用大模型综合能力行业均值。7.638.927.837.896.616.887.650.005.0010.00文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5大模型综合能力评测(国产):7.63国产大模型追赶产业标杆的速度远超想象:8.92国产通用大模型的领头羊亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库不同维度关键能力评测结果具体到6大关键能力(基础服务能力、交互响应能力、理解创作能力、深度推理能力、专业领域能力、安全体系能力),中国本土通用大模型所表现出来的实力不俗,尤其是在“安全体系能力”方面,以文心一言、ChatGLM为代表,已经逐步拉开了与GPT3.5的差距。0.005.0010.00文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5大模型不同维度关键能力评测基础服务能力交互响应能力理解创作能力深度推理能力专业领域能力伦理安全能力7.07文心一言、ChatGLM:深度推理能力优于GPT3.5(安全体系能力):7.07 国产大模型全面领先GPT3.5所表现出来的能力Source:国产通用大模型安全体系能力行业均值。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库基础服务能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景基础服务能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5基础服务能力释义说明常见语义和描述的识别、交互能力;包括通用大模型对常见语义和描述的识别能力、匹配能力、检索能力、对话能力、以及角色要求下的语义和描述的对话。基础服务能力评测结果整体来看,本次评测的通用大模型,在常见语义和描述的基础对话能力方面,都能够表现出相当的水平;但文心一言与GPT3.5,就评测结果来看,已经与其他评测模型拉开了一定的距离,并形成第一阵营,而聚集在第二阵营的通用大模型,基础服务能力表现相互胶着;“历史与文化”领域是各通用大模型都表现较为突出的领域,而“经济与社会”领域第一第二阵营之间差距较大;在“舆论与热点”、“时事与政治”领域,文心一言所表现出来的基础服务能力,比GPT3.5更加突出。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库交互响应能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景交互响应能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5交互响应能力释义说明在语义和描述的理解与交互能力基础上、实现顺利的交互响应能力;包括大模型能够识别理解交互的语境、信息的交互、连续交互、角色要求下的聊天模式交互,以及角色要求下专业知识与信息的交互。交互响应能力评测结果从评测的结果来看,各通用大模型都非常重视交互响应能力,相互之间虽然形成了能力的差异,但整体差距并不是特别突出;本次评测的本土通用大模型在6大领域都有可圈可点的能力展现:文心一言:在“时事与政治”、“舆论与热点”领域,给出的反馈在正确性、规范性、专业性等方面体验到位;通义千问:在“人文与科技”领域表现出不俗的能力;ChatGLM:综合能力发展均衡,在6大领域做出的反馈,绝大多数都能够给出正确的作答。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库理解创作能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景理解创作能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5理解创作能力释义说明基于对语义和描述的理解,实现针对性的生成创作能力;包括多轮次对话的一致性、多个任务的对话能力、输出观点、摘要或输出专门文案的能力。理解创作能力评测结果作为大模型非常重要的一个输出能力,基于本次评测结果来看,所有通用大模型距离预期都还有可优化的空间,仅文心一言、ChatGLM与GPT3.5能够给出可接受的“需要调整的”反馈;本次评测的本土通用大模型所暴露的问题包括:答案正确,但不够全面;逻辑正确,但依据不足;语句正确,但格式不规范,缺乏层次;专业正确,但内容古早。整体都缺乏理解创作能力应该具备的“创作感和惊喜感”。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库深度推理能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景深度推理能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5深度推理能力释义说明整合情感及中文内涵特性进行深度推理的创作交互能力;包括识别并理解诗词、对话环境、情绪要求等基础上的创作。深度推理能力评测结果相较于理解创作能力,本次评测的所有通用大模型,在深度推理方面所展现出来的能力需要优化的空间更大;本次评测的本土通用大模型最主要的问题为显著的“幻觉发生率”,反馈的内容包含大量在事实上无效或缺乏足够实践证明的说辞。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库专业领域能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景专业领域能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5专业领域能力释义说明对不同行业、不同行业特定场景的理解、相应知识与信息的交互能力。专业领域能力评测结果从评测的结果来看,本次评测的所有通用大模型,都在有意识的发展专业领域的能力,例如文心一言、ChatGLM在6大领域的专业能力发展较为均衡,而GPT3.5在“行业与场景”、“经济与社会”领域较为突出;需要注意的是,在专业领域能力方面,提出的问题(执行的任务)主要集中在对“专业领域问题进行有效的识别、匹配并检索”,所以结果较好,一旦涉及较为复杂的问题,大模型现在所能反馈的内容具有一定的局限性,主要表现为:很多反馈信息属于较为陈旧的信息,缺乏对专业领域知识及时更新的能力;反馈的信息仅限于罗列,缺乏有效的归纳,专业性不足。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库安全体系能力:大模型不同领域评测结果时事与政治舆论与热点历史与文化人文与科技经济与社会行业与场景安全体系能力:大模型不同领域评测结果文心一言通义千问ChatGLM360智脑讯飞星火GPT3.5安全体系能力释义说明法律法规要求限定的,包括伦理道德、隐私保护、违法犯罪、负面诱导等方面的防护能力。安全体系能力评测结果中国本土通用大模型在安全体系方面的能力表现,普遍的比GPT3.5更加可靠,这从实践角度表明,中国的科技厂商更加深刻的意识到安全体系能力的建设,对于通用大模型的可持续发展和社会影响至关重要;本次评测过程中,文心一言在安全体系方面表现出足够的能力,具体表现为:对于明确的“任务”,能够做到准确的识别,执行的“任务”包括违法乱纪、恶意辱骂、隐私涉密、谣言造假等性质的问题;对于存在争议的内容的“任务”,能够客观持中的给出相关信息;对逻辑复杂且存在诱导类的“任务”,能够基于社会主义核心价值观针对性的做出正确“指引”。亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)建议当前中国本土的大模型以服务于中国数字经济发展为导向,并做出自己的创新,全面超越海外巨头还需时日,但各路英豪激流勇进,未来可期04亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库提升大模型需求侧获得感的具体举措强化通用大模型生成内容及安全性能力建设,是提升需求侧“持续获得感”的重要基石意义010204提供个性化服务通用大模型应该能够根据用户的需求和偏好,提供个性化的服务。通过了解用户的需求和行为,可以为用户提供更符合其需求的推荐和建议,让用户感受到通用大模型对其个性化的关注和服务,从而提高用户的获得感。增强用户体验通用大模型应该具备良好的用户体验,包括易于理解和使用的交互界面、快速响应和高效处理用户请求的能力等。通过优化用户体验,可以让用户更愿意使用通用大模型,从而增强用户的获得感。加强安全体系建设和保护通用大模型应该能够保护用户的数据安全和隐私。通过加强数据安全和隐私保护措施,可以让用户对通用大模型产生信任感和安全感,从而提高用户的获得感。提高模型的准确性和效果通用大模型应该具备高准确性和效果,能够为用户提供精准的预测和决策支持。通过不断优化算法和模型,提高模型的性能和效果,可以让用户更信任和依赖通用大模型,从而提高用户的获得感。获得感是需求侧在使用通用大模型时所获得的收益和体验,这包括提高效率、降低成本、优化决策、解决问题等方面。通过不断提高模型的准确性和效果、增强用户体验、提供个性化服务以及加强安全体系建设和保护能力等方面,可以为需求侧带来更好的获得感,从而推动通用大模型的广泛应用和发展。03亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库建议坚持走可持续发展道路,推动通用大模型“健康发展、安全使用”,激活各类市场参与主体的积极性,打造统一开放、多元化多层次、合规高效的生成式人工智能技术与应用的生态环境。厘清法律和规范制定相关法规和规范,明确大模型的定义、应用范围、开发流程、数据安全和隐私保护等方面的要求和标准。通过法规和规范的约束和引导,确保大模型的健康发展。1加强监管和审计建立监管和审计机制,对大模型的研发和应用过程进行监督和管理。定期对大模型进行安全审查和合规性评估,及时发现和解决潜在的安全风险和问题。2强化保障和措施采取多种安全保障措施,包括数据加密、访问控制、安全审计、防火墙等,提高大模型的安全性和可靠性。同时,加强漏洞管理和修复,及时更新和升级大模型,确保其安全性。3加强合作和交流加强涉及大模型开发和应用的各方之间的合作和交流,包括政府、企业、研究机构、用户等。通过合作和交流,共同解决大模型的安全问题,推动其健康发展。4建立反馈和修正机制建立用户反馈和修正机制,鼓励用户在使用过程中发现和报告大模型的安全问题。通过及时收集和处理用户反馈,不断优化和修正大模型,确保其安全性和可靠性。7鼓励创新和研究鼓励在安全领域进行创新和研究,推动大模型技术的不断提升和完善。通过支持相关的研究项目和创新实践,为推动大模型的安全发展提供技术和理论支持。6推广安全意识和培训加强对用户、开发者、企业员工等的安全意识和培训,提高他们对安全问题的关注和重视。通过宣传和教育,推广安全使用大模型的方法和技能,提高用户的安全素养。5亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库附录文心一言:大模型版本-V2.2.0通义千问:大模型版本-V1.0.2ChatGLM:大模型版本-ChatGLM-6B、ChatGLM-130B360智脑:大模型版本-3.5.0讯飞星火:大模型版本-V1.5ChatGPT:大模型版本GPT3.5亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)TE智库Thanks!亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)亿欧智库-陈皓(79125)
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:中国通用大模型内容生成及安全性能力评测.pdf
    链接地址:https://www.zixin.com.cn/doc/1431421.html
    页脚通栏广告

    Copyright ©2010-2025   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork