数字经济背景下语言产业发展新模式:语言数据产业_毛现桩.pdf
《数字经济背景下语言产业发展新模式:语言数据产业_毛现桩.pdf》由会员分享,可在线阅读,更多相关《数字经济背景下语言产业发展新模式:语言数据产业_毛现桩.pdf(7页珍藏版)》请在咨信网上搜索。
1、数字经济背景下语言产业发展新模式:语言数据产业毛现桩(河南财经政法大学外语学院,河南郑州)摘 要:语言作为一种“资源”,具有重要的经济属性,能够促成语言产业的形成与发展。在数字经济时代,语言还是数据生产要素的主要体现形式与重要组成部分,具有泛生产要素性质,语言数据的产业化趋势催生了语言产业发展的新模式 语言数据产业。处于初创发展期的语言数据产业存在诸多问题,对此,可以从学术上加强研究、管理上加大扶持与引导、监管上强化产权立法、发展上突显链式思维、学习上借鉴国际经验等措施加以化解突破。关键词:数字经济;生产要素;语言产业;语言数据产业中图分类号:.文献标识码:文章编号:()收稿日期:年 月 日作
2、者简介:毛现桩(),男,河南平顶山人,副教授,博士,主要研究方向:语言产业、语言经济。基金项目:年河南省教育科学规划项目“新文科背景下省属普通本科高校外语专业产教融合协同育人机制研 究”();年 河 南 省 本 科 高 校 研 究 性 教 学 改 革 研 究 与 实 践 项 目();河南财经政法大学 年教改项目“智慧教学模式下大学英语跨文化类课程线上线下混合式金课建设研究与实践”。引言数字经济是以信息技术的革命与发展为驱动,以数据作为核心生产要素的新兴经济形态。党的十九大报告提出加快建设数字中国,指明了我国经济社会发展的方向。年 月 日,中国正式提出申请加入,标志着我国数字经济发展进入了新时期
3、,具有里程碑式的重要意义。在信息通信技术与传统产业融合的影响下,我国的数字经济近年来一直呈现飞速发展的态势。年 月,中国信息通信研究院发布中国数字经济发展白皮书,年我国数字经济规模占 总量的.,对经济增长的贡献为.,年较 年又提升了.,占 总量的.,数字经济已成为拉动我国经济增长的新动力。数字经济最核心的生产要素是数据,而在人类观察世界所形成的可供计算机处理的数据中,都是语言数据,故语言数据是数字经济时代最为重要的数据。数字经济的高质量发展有赖于语言数据的高质量收集、挖掘、存储、管理、加工及应用,这为语言产业的新发展 语言数据产业,带来了机遇,也提出了挑战。一、语言的经济学属性与语言产业(一一
4、)语语言言的的经经济济学学属属性性语言的经济学属性来源于语言的“资源”本质,语言具有一般经济资源的稀缺性与成本收益性。从个体层面而言,语言资源不是与生俱来,而是通过后天的成本(时间或金钱)投入逐渐习得,而且因个体与投入差异,对该资.(.)北京城市学院学报 年第 期(总第 期)DOI:10.16132/11-5388/z.2023.02.005源的获取程度因人而异。研究发现,个体通过“成本投入”所获得的语言能力提升程度或掌握的多语种数量与其工资收入水平和社会经济地位具有较强的关联性,存在着显著的正相关关系,语言资本投资是一种重要的人力资本投资形式。此外,作为人类认知与思维的工具,个人的语言能力很
5、大程度上决定着其个体获得其他人力资本(如知识、科技、技能等)的程度,从这个角度上讲,语言是个体提升自身其他人力资本的一种重要的中介资本。另一方面,从国家或社会维度而言,语言的“资源”本质体现在语言的文化负载性上。语言是文化的重要载体,不同语言之间或同一语言不同方言之间存在比较明显的文化差异,文化差异会造成人与人之间的误会、偏见乃至歧视等负面效果,从而造成交流障碍,降低交流意愿,影响地区间的经济互动。国家之间的“语言距离”不仅会阻碍科学技术的全球传播,不利于技术落后国“后发优势”的发挥,而且还增加了贸易往来的交易成本,影响了外商投资的进入模式。综上,语言不仅是一种能给个体带来经济利益的特殊人力资
6、本形式,而且也是一种能够影响整个国家或民族发展的重要经济资源。(二二)语语言言产产业业及及其其业业态态发发展展语言一旦有了经济价值,便会进入市场,开始发生经济行为。个体通过自学或是参加语言培训提升了自身语言技能,在劳动力市场获得了求职的竞争优势、在职场提升了工资水平,从而在语言资本中获利;不同语言文化中的企业开展经贸往来需要有语言翻译服务来消除语言障碍、拉近语言距离、处理贸易摩擦等事务,从而有了语言消费需求。随之,市场上便出现了语言培训、语言翻译、语言出版等一些专门提供语言产品或服务的企业,当语言消费与语言供给达到一定的成熟度和规模后便形成了语言产业。关于语言产业的内涵,不同学者给出了不同的界
7、定,比较具有代表性的几个意见如下。李宇明()认为“语言产业是以生产和提供语言产品,利用语言赚取红利的产业。”陈鹏()认为“语言产业是以语言为内容、材料,或是以语言为加工、处理对象,生产出各种语言产品以满足各种语言需求的产业形态。”黄少安等()认为“语言产业是一种采取市场化的经营方式生产语言类产品或者语言服务,从而满足国家或者个人对各种语言产品或语言服务需求的产业。”贺宏志()认为“语言产业是以语言文字作为原料和内容(语言本体),或是以语言文字作为加工处理的对象(语言作为工具),生产各种语言产品或提供各种语言服务的产业。”以上对语言产业的界定虽各有侧重,但语言产品的生产或语言服务的提供是其核心内
8、容。因此,根据语言产品或服务的形态或方式,我们可以将语言产业下分为三大类别:语言能力产业、语言内容产业与语言处理产业,又可具体化为语言培训、语言康复、语言测评、语言出版、语言翻译、语言创意、语言会展、语言文字信息处理、语言艺术等九大业态类型。但是,随着互联网信息技术的发展与普及,尤其是近两年受疫情影响,网络空间的语言产业各业态所占比例越来越高,如在线语言教育与测评、在线会议翻译、在线语言展览、在线智能写作、在线语音识别、合成、输入等在线语言处理业态。网络空间的语言产业与传统语言产业相比最大区别在于,在网络空间,计算机是以数据的形式运行处理语言内容,从而形成新的语言产品或语言服务,语言数据在网络
9、空间语言产业中起着至关重要的作用。二、数字经济中的语言数据生产要素数字经济以信息技术发展为必要条件,以数据为关键的生产要素,用数字呈现信息内容。在数字经济中,语言作为信息技术创新和互联网应用创新的基础要素,在很大程度上已超越语音、词汇与语法系统的传统范畴和语言文化差异,已超越语言思维和数据思维的传统框架和战略认知,成为了数字经济中具有战略意义的数据系统。数字经济中的语言数据分为三个数字经济背景下语言产业发展新模式:语言数据产业层级:自然语言、人工语言与数字语言。(一一)自自然然语语言言自然语言,即语言的应然状态。自然语言体现着人类交流的丰富性与多样性。语言虽是信息的载体,但是,每一种自然语言都
10、有其独特的语音、词汇、语法、文字等表意系统。所以,相同的信息在不同的语言系统中有着迥然不同的表达形式。这使得不同语言之间的信息传递存在障碍,亦即“语言效率”存在差异。信息交流是语言的第一属性,但当交流的信息彼此间呈现标准不一致时,人们就需要通过语言学习或语言翻译以达到交流的彼岸。自然语言虽属语言数据的较低形态,但是语言数据的重要组成部分,并且是计算机处理语言数据中最难的一种。计算机对自然语言的处理程度,如汉字识别、语音检索、语言(声音、文字)翻译、机器客服语言训练等都决定着人工智能的发展进程。(二二)人人工工语语言言自然语言在为人类创造了一个多彩语言世界的同时,也为世界范围内的信息交流与沟通带
11、来了天然的认知障碍。随着交通工具与信息技术的进步与发展,这种障碍愈加明显,因此,人们开始设想创造一种具有通用效果的“人工语言”,以扫除语言差异在认知中的障碍。在知识传播史上,数学语言便是成功的一例。数学运算符号以及数学公式的统一,极大化解了自然科学知识传播过程中的语言障碍,使得伽利略用数学语言撰写的关于天体、宇宙的著作成为后来物理学、化学、工程设计等学科发展的重要基础知识。有了对已有知识系统化和标准化的语言处理,后人可直接对接前人成果,实现一次又一次的技术创新。除了数学语言,我们还有乐谱语言、盲文、聋哑人的手语、旗语、灯语、电话号码、银行卡号码等形式的人工语言。人工语言可以是自然语言的符号化,
12、体现自然语言规则,也可以自成体系,拥有内部运行规则;对人工语言的理解有时需要自然语言辅助,有时需用自然语言阐释。总之,人工语言与自然语言具有天然的密切关系。当今社会,经济发展是人类的主题,而语言是能够影响从知识生产到技术创新再到经济绩效的最微观的因子,随着计算机信息技术与互联网渗入所有的经济行为,我们急需一种通用语言,以极高的效率进行信息流动和知识获取,从而促进经济更快更好发展,这便是数字语言。(三三)数数字字语语言言当人类大脑面对实践对象的复杂性与丰富性时,传统语言文字难以出色完成对其全面认知与深度分析加工,表现出了认知效率不佳。此时,一种高效的媒介技术即机器语言出现了,它由形式语言所形成的
13、虚拟计算机大脑来开展我们人类大脑在某些领域所完不成的工作。机器语言的发展推动了数字技术的进一步发展,数字技术可以将社会运行进行数据化重构,形成海量数据。海量数据被各种软件、数字平台捕获后,传输给由计算机机器语言构成的虚拟人类大脑进行机器学习。所以,海量数据越大越丰富,机器学习的效果越好,算法越精准,产出结果的适用性与指导性就越强。在机器语言阶段,计算机分析的对象均是经过数字技术处理过后的数字信息,此时的语言数据是被数字化了的语言,即数字语言。数字语言是语言数据的高级形态,具有普适性与统一性,可以用来描述所有的人类活动。这里需要说明的是,语言数据的三个层级,是按照计算机对语言处理的方便程度以及“
14、语言效率”的高低程度对语言的划分,并不是语言进化的三个阶段。在数字信息时代的今天,三种语言数据是并存的,都是数字经济的重要生产要素。三、语言的泛生产要素性语言的独特生产要素性不仅来源于语言的本质属性,语言是人类最重要的交际和思维工具,也是人类文化和信息的最重要负载者,同数字经济背景下语言产业发展新模式:语言数据产业时还是人类文化最重要的建构者和阐释者。同时,语言与其他几种生产要素有着非常的特殊关系,在其中发挥着重要作用,语言具有泛生产要素性(如图)。图 语言的泛生产要素性首先,语言经济学的逻辑起点是视语言为人力资本。语言是人的重要劳动力,对于服务行业或是智力型岗位,情况尤为如此,一个人的语言能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 经济 背景 语言 产业 发展 新模式 数据 毛现桩
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。