文献检索的基本方法与步骤.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 基本 方法 步骤
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,9,输出,一次,信息,信息,特征,检,索,语,言,信息特征,标识,检,索,结,果,信息,需求,检索,提问,检索提问,标识,分析,标引,提取,输入,检索,数据库信息检索系统,存储,过程,检索,过程,分析,2 文献的组织方法与检索语言,2.1 文献组织的基本方法,语法信息组织法,字顺组织法,代码法,地序组织法,时序组织法,语义信息组织法,分类组织法,主题组织法,2.2 分类组织法,分类组织方法,又称,分类语言,,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检索语言,包括,体系分类法,和组配分类法。,中国图书馆分类法,中图法,将所有图书分为,5大基本部类(马列毛思想、哲学、社会科学、自然科学、综合性图书),22个大类。,杜威十进分类法(DDC),杜威十进分类法:,1873年美国图书馆学家杜威所创,目前已被翻译成30多种语言,在全球超过135个国家的 20多万个图书馆使用。国外,许多分类法均是借鉴于杜威分类法产生的,如分类法、国际十进分类法,。,中图法简表,A马、列、毛、邓理论,B哲学、宗教,C社会科学总论,D政治、法律,E军事,F经济,G文化、科学、教育、体育,H语言、文字,I文学,J艺术,K历史、地理,N自然科学总论,O数理科学和化学,P天文学、地球科学,Q生物科学,R医药、卫生,S农业科学,T工业技术,U交通运输,V航空、航天,X环境科学、安全科学,Z综合性图书,T 工业技术,TP 自动化技术、计算机技术,TP1自动化基础理论,TP2 自动化技术及设备,TP3计算技术、计算机技术,TP30一般性问题,TP31计算机软件,TP311程序设计、软件工程,TP311.1程序设计,TP311.11程序设计方法,TP311.12数据结构,TP311.13数据库理论与系统,TP311.131数据库理论,TP311.132数据库系统:按类型分,TP311.132.1层次数据库,TP311.132.2网络数据库,TP311.132.3关系数据库,TP311.132.4面向对象的数据库,.,TP6射流技术,TP7遥感技术,TP8远动技术,杜威十进分类法(DDC),310 普通统计学,000 总类 320 政治学 371 学校管理、,100 哲学类 330 经济学 特殊教育,200 宗教类 340 法律 372 初等教育,300 社会科学类,350 公共行政管理 373 中等教育,400 语言类 360 社会机构社会团体 374 成人教育,500 纯科学类,370 教育,375 课程,600 应用科学类 380 商务、通讯、运输 376 妇女教育,700 艺术类 390 习俗、礼仪、民俗 377 学校与宗教,800 文学类 378 高等教育,900 地理历史类 379 政府法规,管理与资助,2.3 主题组织法,也称,主题语言,,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、,关键词语言,和,叙词语言,。,2.3.1,关键词语言,关键词语言,是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。,2.3.2 叙词语言,叙词语言,是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。,叙词,又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。,叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。,叙词语言示例:,汉语主题词表,、英国科学文摘使用的,INSPEC Thesaurus,、美国工程索引93年后使用的Ei Thesaurus等。,INSPEC Thesaurus,按叙词的英文字顺排列,每个叙词下都列出该词的使用范围说明、使用时间、上位词、下位词等相关信息,检索者根据从叙词表中获得的主题词信息,可以相应,扩大或缩小检索用词范围,,达到最佳检索效果。,INSPEC Thesaurus,叙词主表,Laser beam machining,激光发热切割器,UF Laser drilling,激光钻孔器,Laser machining,激光切割器,Laser trimming,激光整修,BT Laser beam applications,激光发热应用,Machining,制造,TT,Laster,bean applications,激光发热应用,Manufacturing processes,加工过程,RT Laser beam etching,激光发热雕刻,Laser materials processing,激光材料制作,Micromachining,微切削加工,CC B0170G;B2575F;B4360B;B8620;C3355C,分类号,DT July 1973,使用年,PT Laser beam applications,激光的发热应用,Machining,制造,INSPEC Thesaurus,词族表:,此表反映所有叙词之间的从属关系,以主表中的族首词字顺排列,,前面小圆点越多,代表该词级别越低,,任何一级带圆点的叙词是离它最近的、少一个圆点的上一级叙词的下位词。,INSPEC Thesaurus词族表,laser beam applications 激光发热应用,Laser applications in medicine,Laser beam machining,Laser beam welding,Laser materials processing,Laser ablation,(激光烧蚀),pulsed laser deposition,(脉冲激光沉积),Laser beam annealing,Plasma heating by laser,Plasma production by laser,Laser fusion,Remote sensing by laser beam,3 常用的计算机文献检索方法,布尔检索方法,1,字段限定检索方法,3,截词检索方法,3.1 布尔检索,布尔检索,(Boolean Retrieval)是用,布尔逻辑算符,将检索词、短语或代码进行,逻辑组配,的一种技术,也是目前最常用的一种数据库检索技术。,逻辑“与”,具有概念交叉或概念限定关系的组配,用“*”,或者“AND”,或者“与”算符表示。,检索式,为:,A,AND,B,或者 A,*,B,或者A,与,B(仅中文),它表示检出,同时含有A、B两个检索词,的记录。,逻辑“或”,逻辑“或”是一种具有概念并列关系的组配,用“+”,或者“OR”,或者“或”算符表示。,检索式,为:,A,OR,B,或者 A,B,或者A,或,B(仅中文),它表示检出,所有含有A词或者B词,的记录。,逻辑“非”,逻辑“非”是一种具有概念排除关系的组配,用“”,或者“NOT”,或者“非”算符表示。,检索式,为:,A,Not,B,或者 A,-,B(Google为A-B),或者A,非,B(仅中文),它表示检出,含有A词,但同时不含B词,的记录。,3.2 截词检索,截词检索,(Truncation Retrieval)是指在检索词的,适当位置截断,,用,截断的词的一个局部,进行的检索。检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。,由于西文的构词特性:单复数形式不一致、英美拼写不一致、词干前缀、词干后缀。,截词符多采用通配符“?”、“$”、“*”等,因此,截词检索有时也称为通配符(Wildcard)检索。,按截断的位置来分,;,按截断的字符数量来分,。,后截断,中截断,前截断,无限截断,如:economic,?,有限截断,截词检索与截词检索算符,economic,economic,s,economic,st,economic,alism,economic,economic,s,economic,st,如:economic,*,如:wo,m,?,n,woman,women,一般仅允许有限截断,如:,?,lish,sul*ur,sul,f,ur,sul,ph,ur,无限截断,有限截断,前后截断,如:,?computer,?,可检出:computer、computer,s,、computer,ize,、computer,ized,、,mini,computer、,mini,computer,s,、,micro,computer、,micro,computer,s,3.3 字段限定检索,字段限定检索,(Field Limiting Retrieval)是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。,例如,:,(microcomputer/,DE,TI,OR personal computer/,ID,TI)AND,PY,=2008 AND,LA,=English,这个检索式所表达的检索要求是:查找,2008年,出版的关于微电脑或者个人电脑的,英文,文献,并要求“微电脑”一词在命中文献的,叙词字段,、,标题字段,出现,“个人电脑”一词在命中文献的,自由词字段,出现。,中文实例:,(Remark_C=天然气)*(Keyword_C=(水合物)+Title_C=(水合物)*(Years=2007+Years=2008+Years=2009),在,Google,等搜索引擎中,限定字段也是常用的语法。例如,“filetype:”表示在某种文件类型(如doc、pdf)中查找资料。详细的介绍请参见搜索引擎部分。,4 信息检索的基本步骤,分析检索课题,1.主题概念,2.信息类型,3.时间范围,4.检索目的,构造检索式,(试验性检索),1.,简单提问式,2.上下文提问式,3.复合提问式,4.结构性提问式,调整检索策略(正式检索),1,信息量过多时,2.信息量太少时,输出检索结果,1.文摘,2.全文,选择检索系统,1.学科范围,2.系统类型,3.系统功能,确定检索词,1.切分,2.删除,3.替补,4.组合,5.增加,用户评价,4.1 分析检索课题,例如:,查找有关消防的文献。,1.,主题分析和检索目的。,所有的“消防”文献?还是只需有关“消防事业”、“消防队伍”、“消防设施”、“消防材料”、“消防器材”、“消防方案”等中某一方面的文献?,需要新颖的信息?或者是与别人的研究进行先进性比较?,(时间范围),需要系统地掌握某学科的知识,可以选择图书;需要撰写研究项目的开题报告、论文,开展技术攻关,可以选择研究报告、期刊论文、学位论文、会议文献等,(文献类型),;,需要进行发明创造、工艺改革、新产品设计、引进设备、签订合同,可以选择专利说明书、标准文献、产品资料等,(特种文献),。,4.2 选择检索系统,1.学科范围,。对于交叉学科、新兴学科、应用研究、综合研究,不应局限于某一学科范围,可根据情况适当扩大检索系统的学科范围。例如,石油和矿业工程的力学计算方面的课题,也可以考虑数学、物理学、计算机信息科学、机械工程方面的数据库。,扩大检索系统的学科范围有时会带来意外的收获,。,2.系统类型,。首先,在不同的文献类型系统中选择。其次,要在文摘、索引系统和全文数据库系统之间选择。第三,在专业性数据库中去查找。,3.系统功能,。一般说来,使用分类语言、主题语言的检索系统,要优于使用自然语言的检索系统,专业检索系统要优于搜索引擎。检索途径、检索方式(如分类浏览、简单检索、高级检索、专家检索、自然语言检索)多,收录时间跨度长,来源语种、国别多,文本(数据)质量高,附加个性化服务,检索系统就更值得选择。,4.3 确定检索词,1切分,切分是对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。自由词切分仅适用于自然语言检索。,例1,:检索“妇女吸烟与肺癌的关系研究”相关文献。,直接切分:妇女|吸烟|与|肺癌|的|关系|研究),注意,当词切分后将失去原来的意思时,不应再切分,即必须注意保持意义的完整。如“,中国科学院,”、“,致密岩气,”不可再切分。,确定检索词,2删除,删除是对自然语言中不具有实质性检索意义的,虚词,(如介词、连词、副词等),或者,使用频率较低的词,,或者,专指性太高、过分宽泛的词,,或者,过分具体的限定词、禁用词,,或者,不能表达课题实质的高频词,,或者存在蕴含关系,可以合并的词,,一律予以删除,使自然语言转换成为关键词和主题词的集合。如上例中的,“与”、“的”、“关系”、“研究”,。,例2,:检索“中国非常规天然气工业的发展前景研究”方面的相关文献。进行拆分以后,,工业、发展、前景、研究,这四个自由词具有一定的检索意义,但是由于或者是意义过于宽泛、或者是不能表达课题实质、或者是存在蕴含关系的原因,没有必要全部作为检索词,根据需要可以保留1-2个作为检索词。,确定检索词,3替补,替补就是在进行切分、删除后,对检索词进行替换和补充。,“公交”应考虑替换:公共交通;,“绿色包装”中的“绿色”,应替换:环保、无污染、可降解;,“煤气中毒”应考虑替换:一氧化碳中毒;,“非典”应考虑补充:SARS、非典型肺炎、传染性非典型肺炎、严重急性呼吸综合征(severe acute respiratory syndrome);,“非常规天然气”(nonconventional natural gas)应考虑补充:(天然气)水合物、页岩气、深层气、致密岩气、水溶气、煤层气、合成气(合成天然气)、沼气(生物气),同时考虑将“气”应替换为:天然气(natural gas)、甲烷(methane)、CH,4,、CH4;,含硫气田的“硫”应考虑补充:sulfur、,sulf*、sulfur*,、,sulphur、sulphur*,、H,2,S、H2S,同时考虑将“硫”替换:硫化氢(sulfured hydrogen)、含硫化合物(sulfur compound)。,确定检索词,4组合,概念相交组合,。这个新概念是原来用以组合的两个概念的下位概念,如曲柄连杆机构*发动机=汽车发动机。,概念限定组合,。这个新概念可用来表示这一事物的某一属性或某一个方面。如电视机*数字化=数字电视机。,以上两种组配方式,所得到的新概念,都是原组和概念的下位概念,缩小了检索范围,提高了概念的专指度,达到提高检准率的目的。,概念并列组合,。具有概念并列关系的自由词间的组配,其结果使概念检索的范围扩大,如环境污染+环境保护=环境污染和环境保护。,概念删除组合,。是指两个具有上下位关系的自由词间的组合,其结果使概念检索的范围缩小,如信息处理-模拟信息处理=数字信息处理。,确定检索词,5增加,增加“限义词”。有两种方法:直接增加限义词、挖掘隐含词、提取潜在的检索词;把限义词以逻辑的方式加入,可采用逻辑“与”或逻辑“非”的方法增加限义词。,分析隐含概念。挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例1:“妇女吸烟与肺癌的关系研究”,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索词:,烟、癌症、恶性肿瘤,。,例3,:检索“一种新的天线阵方向图综合方法”课题。,切分:一种|新|的|天线阵|方向图|综合|方法;,删除后得:天线阵、方向图;,根据主题词表分析,增加上位词可得主题词:,互耦、偶极子、输入阻抗,等。,确定检索词,从上述四个实例可以看出,提取检索词首先是,切分、删除,,其次是进行,替补、组合和增加,。在提取检索词时,若所选的数据库具有规范化词表时,应,优先选用该数据库词表中,与检索课题相关的,规范化主题词,(检索词)。,4.4 构造检索式(试验性检索),所谓的,检索提问式,(query,search formulation),是信息检索中用来表达用户检索提问的逻辑表达式,主要是使用各种,布尔逻辑算符、位置算符、截词符、限制算符,以及系统规定的其他组配连接符号将检索词进行,组配,,确定检索词之间的概念关系或位置关系。,构造检索式(试验性检索),简单提问式,含一个检索词的提问式;,上下文提问式,精确短语或近似精确短语的提问式,也可称为短语提问式;,复合提问式,含有布尔算符和至少2个检索词的提问式;,结构性提问式,含有2个以上布尔算符和至少4个检索词的多层结构组合的提问式。,例4,:地震序列分析的工具和方法研究,要完成本项检索课题,必须使用结构性提问式:,(sequence analysis)WN TI)AND(method*OR tool*OR instrument*)WN All fields)AND(seismic)WN All fields),。检索式“WN TI”意为限在TI(标题)字段中检索,可提高检索的准确性和相关度。,4.5 调整检索策略(正式检索),所谓,检索策略,(search strategy)就是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。检索策略的制定过程就是检索提问式的不断完善的过程,,使用最初的检索提问式是,试验性检索,,,使用调整后的完善检索策略提问式是,正式检索,。,调整检索策略(正式检索),1当检索结果信息量过多时,原因,:选用了多义性的检索词;截词截得过短;输入的检索词太少;应该使用“与(AND)”的使用了“或(OR)”;优先运算符“()”使用错误。考虑,缩小检索范围,,方法如下:,(1)采用专指性强的主题词(主题词表),减少同义词、同族相关词等相关性不强的检索词;,(2)增加限制概念,采用“AND”算符连接检索词或进行二次检索;,(3)使用字段限定,把检索词限定在题目、主题词等主要字段;,(4)缩短检索年限,限制检索结果的文献类型、语种及出版国;,(5)使用“NOT”算符,排除无关概念;,(6)调整位置算符,由松变严;,(7)改模糊检索为精确检索。,调整检索策略(正式检索),例5,:检索建筑物的windows(窗口、窗户)部分设计方面的文献。,检索策略调整为以下检索式:(construction OR building OR architectur*)WN All fields)AND(window*)WN TI),NOT,(microsoft)WN All fields)。,例4,的检索式在检索英文时是没有问题的,但如果检索中文时仍使用以下检索式:(序列分析)WN TI)AND(方法*OR 工具*OR仪器)WN All fields)AND(,地震,)WN All fields),就会将许多不相关的内容检索出来。因为中文检索词“,地震,”有两种完全不同的含义:一是,与灾害有关的,(英文用“earthquake”),二是,与地质、地球科学有关的,(英文用“seismic”)。因此,正式检索中文资料时,应该调整检索策略,像,例5,那样使用,“NOT”算符,,如输入:灾害、损失、伤亡等进行限制。,2当检索结果信息量太少时,原因,:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;没有使用截词算符;位置算符和字段算符使用的过多;使用过多的“AND”算符。考虑,扩大检索范围,,方法如下:,(1)根据词表的分类结构体系扩展关键的检索词,用“扩展”按钮增加同义词和相关词并用“OR”算符连接这些词;,(2)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;,(3)减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限;,(4)取消某些限制过严的字段限制、位置算符限制(或者改用限制程度较小的位置算符),(5)在词干相同的单词后使用截词符(?或*);,(6)改精确检索为模糊检索;,(7)同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。,调整检索策略(正式检索),例6,:在数据库中检索同时含有草莓、香草和巧克力三种口味的冰淇淋。,英文检索式:(ice cream)AND strawberry AND vanilla AND chocolate)WN All fields)。,中文检索式:(冰淇淋)AND 草莓 AND 香草 AND巧克力)WN All fields),进行试验性检索后发现,由于中文“冰淇淋”存在多种普遍的错别字,如:“冰激凌”、“冰激淋”、“冰淇凌”等,检索结果极不完整,需要将几种普遍错别字的词作为检索词,并用“OR”算符连接这些词,进一步调整检索策略。,此外,,例3(,检索“一种新的天线阵方向图综合方法”课题,),也是扩大检索范围提高检索结果查全率的一个典型实例。,1,、字体安装与设置,如果您对PPT模板中的字体风格不满意,可进行批量替换,一次性更改各页面字体。,在,“,开始”,选,项卡,中,,点击“,替,换”按,钮右,侧箭,头,,,选,择“,替,换,字,体,”。(如下,图),在图“替换”下拉列表中选择要更改字体。(如下图),在“替换为”下拉列表中选择替换字体。,点击“替换”按钮,完成。,39,2,、替换模板中的图片,模板中的图片展示页面,您可以根据需要替换这些图片,下面介绍两种替换方法。,方法一:更改图片,选中模版中的图,片,(,有些图片与其他,对象,进行了组合,,选,择,时,一定要选中图,片 本身,而不是组合)。,单击鼠标右键,选择“更改图片”,选择要替换的图片。(如下图),注意:,为防止替换图片发生变形,请使用与原图长宽比例相同的图片。,39,赠送精美图标,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




文献检索的基本方法与步骤.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12770651.html