“殷契文淵”甲骨文字形庫的建設與思考.pdf
《“殷契文淵”甲骨文字形庫的建設與思考.pdf》由会员分享,可在线阅读,更多相关《“殷契文淵”甲骨文字形庫的建設與思考.pdf(17页珍藏版)》请在咨信网上搜索。
1、“殷契文淵”甲骨文字形庫的建設與思考*喬雁群(安陽師範學院計算機與信息工程學院甲骨文信息處理教育部重點實驗室)摘要作當今最大型、全免費的甲骨文大數據網絡平臺“殷契文淵”,主要包含字形庫、著録庫、文獻庫,其中的甲骨文字形庫是具有學術獨立性與字體原創性的基礎與核心組成部分。该字形庫注重“學術性、藝術性和技術性”,具體體現在字形的準確性、字體的規範性與字庫整體構建的集成性幾方面。關鍵詞甲骨文甲骨文字庫大數據平臺殷契文淵“殷契文淵”(h :w )是在宋鎮豪先生指導下,安陽師範學院甲骨文信息處理教育部重點實驗室與中國社會科學院甲骨學殷商史研究中心合作建設的甲骨文大數據網絡平臺,這是當今最大型、全免費的甲
2、骨文資源共享平臺。自 年 月發布以來,已逐漸成爲古文字學、歷史學、考古學、文化藝術等诸多領域學者常用的網絡資源。在“殷契文淵”“三庫一平臺”(字形庫、著録庫、文獻庫與知識共享平臺)中,甲骨文字形庫是具有學術獨立性與字體原創性的基礎與核心組成部分。筆者負責字形庫的建設,包括甲骨文字形的全面整理與勘定,甲骨文字體書寫與製作,甲骨文字形庫功能設計與信息整理標注等。甲骨文發現 多年來共發現甲骨文單字數量約在 ,公認的可釋字還不到*本文爲“古文字與中華文明傳承發展工程”資助項目“新出甲骨文著録刻辭類纂”(項目號 )、“殷契文渊 甲骨文數據化平臺”(項目號 )的階段性研究成果。,更多的是未識字。甲骨文字形
3、特點之一是字無定形,異體紛繁;甲骨文的釋字,則有相當一批字無定釋,歧説紛呈,有的字無法用現代漢字方式去隸定,有的字可以隸定,但各家隸定五花八門,極不統一。這些都造成了甲骨文字庫研發的困難。近年來,香港漢達文庫、華東師範大學、北京師範大學、浙江師範大學、方正公司等均有嘗試研發甲骨文字形庫,但是由於各種原因,或者收字不全,或者未能完全對外開放,很難實現大規模的共享和推廣應用。其中應用較廣一些的是 年香港中文大學中國文化研究所中國古籍研究中心建立的“漢達文庫”,其所研發的一套甲骨文字形庫用於甲骨文資料庫所收録的部甲骨著録書的檢索,由於該庫的甲骨文著録釋文幾經校勘,糾正了以往同類資料中的不少錯誤,自開
4、發以來爲不少學者所使用。“殷契文淵”甲骨文字形庫,通過全面采集整理、研究勘定甲骨文字形,形成獨立的甲骨文字形表,再用毛筆書寫,製作爲標準、規範且具有契刻韻味的甲骨文字體,設計、構建了三級字形構成的甲骨文字形庫,並爲字形庫量身定做多種甲骨文字形檢索法,實現了甲骨文的多渠道檢索。以字形編碼爲核心,通過多維度的信息標注,實現字形與字形、字形與相關工具書、著録、文獻等多功能關聯,解決由於甲骨文輸入困難與信息標注繁瑣而導致甲骨文著録、文獻資源難以大規模共享與推廣的難題。二期工程完成後字形庫收録的 多個甲骨文字形(單字爲主,包含少量異形字),已與多種甲骨文工具書建立鏈接,實現“一鍵式”查閲,爲甲骨文學習、
5、應用與研究帶來方便。“殷契文淵”大數據平臺中,字形庫既是獨立的字形研究成果,也是著録庫與文獻庫的重要檢索入口。嚴謹規範的字形,爲甲骨文的學術研究、社會普及、編輯出版與活化利用等提供了基礎資源,也爲人工智能輔助甲骨文研究提供了數據基礎。甲骨文大數據平臺“殷契文淵”(h t t p:/j g w a y n u e d u c n)首頁 甲骨文與殷商史(新十二輯)一、“殷契文淵”甲骨文字形庫的特色“殷契文淵”字形庫注重“學術性、藝術性和技術性”三者的統一,這是該庫的基本特質與主要特色。學術性對甲骨文字形進行全面整理、勘定的學術研究,包括對現存各類甲骨文字工具書進行必要的勘誤與字形的增補和删減,並依
6、據研究成果製作甲骨文字形表,這是保證字庫字形準確性、可靠性或者説學術性的基礎和前提。這也是“殷契文淵”字形庫首要的重頭工作。由於殷墟甲骨文字及其材質的特殊性,任何甲骨文工具書都無法做到圓滿。目前各類甲骨文工具書中所收字形都存在一定數量的誤摹、誤識、誤釋、誤收或重收的字,甚至因誤而致衍生的字形。盡可能將失誤降至最低,給用户提供最準確的字形,這是筆者自始至終對“殷契文淵”字形庫抱持的目標與宗旨。筆者在 年底开始字庫工作時,便發現原定字庫字形的簡單整理與書寫任務遠遠不能滿足高品質學術研究的需要。原字表舛錯較多,爲保證每一期發布字形的準確性,避免以訛傳訛,只得放棄事先預定臨寫實驗室舊版甲骨文字體的方案
7、,先改定字表,逐字依據原拓片釐定字形,再進行書寫。事實上即便目前各類甲骨文工具書也都存在不少失誤。尤其是筆者 年開始全面負責甲骨文字庫工作後,不得不調整進度,重新設定工作目標,在原定書寫工作之外,另行確定勘誤、增補、删減的標準和實施流程,並以大部分精力進行字形的整理研究;根據整理研究結果形成新的字形表,對甲骨文字體的書寫製作也制定了更高標準。字形整理研究的過程中,在全面掌握和梳理現有甲骨文材料基礎上,對殷墟甲骨刻辭類纂甲骨文字編新甲骨文編甲骨文字形表等多種權威工具書中的計 多甲骨文單字及若干異形字逐一核對原片,選擇最佳拓本或照片,結合辭例、相關考釋文章,參考各種著録釋文,對字形詳加核訂,改定和
8、去除誤摹、誤收、重收及衍生字頭與字形,確立每個甲骨文單字與異形的代表字形,確保字形的準確無誤;“殷契文淵”甲骨文字形庫的建設與思考姚孝遂主編:殷墟甲骨刻辭類纂,北京:中華書局 年版。李宗焜:甲骨文字編,北京:中華書局 年版。劉釗主編:新甲骨文編(增訂本),福州:福建人民出版社 年版。沈建華、曹錦炎:甲骨文字形表(增訂版),上海:上海辭書出版社 年版。並參考各書合理設置部首表,調整字形分合與字形歸部,最終形成綜合各家之長又有所修正補訂的獨立的甲骨文字形表。勘誤、增補字形和删除各工具書中的衍生字舉例如下(表表):表“殷契文淵”甲骨文字庫勘誤字形舉例原字類纂字編新編字形表 殷契文淵備注花東 真 目前
9、各工具書該字形均誤,殷契文淵字庫已勘正。合 甲 頁 目前各工具書該字形均誤,殷契文淵字庫已勘正。合 甲 頁 目前各工具書該字形均誤,且單收爲未識字,字實當爲“”,殷契文淵字庫已勘正字形及歸屬。合 頁 此字實爲何組、無名組、歷組、黄組等均出現的田獵地名“”,即等形之異寫,目前各工具書多單立此字爲未識字,字形表釋“獸”,均誤。殷契文淵已關聯爲以上字形之異形。甲骨文與殷商史(新十二輯)此字勘誤情況已收入喬雁群:甲骨文字編校訂 例,甲骨文與殷商史新 輯,上海:上海古籍出版社 年版,頁 。同上注,頁 。同上注,頁 。此字例收入筆者未刊稿甲骨文“未識字”辨正舉例中。表“殷契文淵”甲骨文字庫增補字形舉例字形
10、出處備注甲 合 此爲“專”字之異形,新編頁 收入,但字形處理模糊,其他工具書均未收,殷契文淵字庫已補入。醉古集 組乙 乙補 乙補 “魯”字異體,目前各工具書均未收,殷契文淵字庫據綴合材料補收此形。合 此“萅(春)”字之異體,目前各字書均未收,殷契文淵字庫據蔣玉斌摹本及吉林大學藏甲骨集補入。乙 合 此爲 之異寫,字編 號、新編第 頁均作,誤。殷契文淵字庫已據乙編 勘正後收入。表“殷契文淵”校訂各工具書當删除的衍生字舉例原字類纂字編新編字形表備注英 頁 下部貫穿口形之豎綫粗鈍無力,並非筆畫,且參考合集 ,實係字。爲衍生字,應删除。合 後下 頁 合集字形左側有骨花導致誤摹衍生字,據後下 當如,即字,
11、當删除。合 乙 頁 合集拓片不清導致誤摹衍生字頭,據乙編拓片可知實是()字,該字頭應删除。“殷契文淵”甲骨文字形庫的建設與思考林宏明:甲骨新綴第 例,發表於先秦史研究室網站,年月 日。蔣玉斌:釋甲骨文金文的“蠢”兼論相關問題,復旦學報(社會科學版),年第期,頁 。吴振武主編:吉林大學藏甲骨集第 號,上海:上海古籍出版社 年。喬雁群:甲骨文字編校訂 例,甲骨文與殷商史新 輯,頁 。表原字類纂字編新編字形表備注合 反北圖 反 頁 合集拓片不清,據北圖照片與拓片,應是字之異寫,各工具書中衍生字頭當删除。限於篇幅,以上只是簡單列舉“殷契文淵”字形整理研究中針對現存一些工具書進行勘誤、增補、删除衍生字形
12、的字例。甲骨文字形的通盤整理是一項系統工程,涉及目前所發現的全部甲骨文圖像材料,以及考釋、綴合等研究資料,需要大量精力投入。目前已對各類工具書勘誤 餘處,並擇取 多個字例撰成文章發表,所訂正字形有些已體現在“殷契文淵”字庫中;其餘勘誤情況,將陸續整理成文,其中未在“殷契文淵”上發布的也將逐步在網站上更新。同時對字庫中已發布的字形也一直在不斷進行核查、修訂。部首的設立,是爲了將複雜繁多的字形歸類處理。作爲大數據平臺的甲骨文部首表,更重要的功能則是爲了方便、快捷地找到字形,是統轄全部甲骨字形的一個“綱領”。“殷契文淵”采用自然分類法,綜合吸取各家優長,補其不足,制定了包含 個部首的部首表。部首設置
13、遵循以下原則:第一,盡可能統領所有甲骨字形;第二,“字理”爲主,兼顧“形似”;第三,按類排列,形近相鄰。甲骨文與殷商史(新十二輯)袁倫强碩士論文中已指出新甲骨文編該字形當處理作,見袁倫强:新甲骨文編(增訂本)校補,西南大學碩士論文(指導教師:李發),年,頁 。見喬雁群:甲骨文字編校讀札記 則,甲骨文與殷商史新輯,上海:上海古籍出版社 年版,頁 ;合集釋文校補兩則,甲骨文與殷商史新 輯,上海:上海古籍出版社 年版,頁 ;甲骨文字編校訂 例,甲骨文與殷商史新 輯,頁 。表 “殷契文淵”甲骨文字形庫的建設與思考表 難檢字 數字 干支 祖先 爲“殷契文淵”製定的部首表藝術性從現有少數的甲骨文字庫來看,
14、以電腦字爲特徵的甲骨文字形缺少甲骨文韻味,以拓片原字反轉處理字形的方式,雖然字形大體接近原始字形面貌,但由於出土的甲骨文字形大小、外觀比例、組類風格等差異較大,整體上難以統一。“殷契文淵”甲骨文字庫的字形爲筆者結合多年書法篆刻的理論研究與實踐經驗,運用毛筆書寫。以所整理甲骨文字形表爲依據,選取清晰優美、表現構字理據的字形,嚴格采用原片字形臨寫,以盡可能再現甲骨文字形所具有的原始姿態與契刻特色,同時兼顧全部字形風格上的統一。“殷契文淵”甲骨文字的書體(部分)技術性“殷契文淵”甲骨文字形庫的技術性體現在字體的製作、字庫的多級架構與字庫整體的多功能、集成性。甲骨文與殷商史(新十二輯)字體的製作,是以
15、狼毫毛筆書寫字形,用方正字庫專用紙,單字字徑 ;掃描後,通過h h 軟件進行一定程度的加工處理,使得字形大小比例等在整體上更趨統一,細節、氣韻則與原拓更爲接近。然後用 軟件處理製作爲字體。字庫的整體構架爲“部首單字異形”三級字形系統。字庫首頁置有甲骨文部首表,可以通過部首表查閲所有字形,同時可選擇查看全部單字或全部字形,或通過輸入漢字、拼音或手寫實現字形檢索。字庫的功能,一方面體現在字形多種檢索方式,另一方面體現在字形相關信息的載入,包括字形自身信息如部首信息、釋字信息,字際關係如異體字形的關聯,字形與研究材料的關係,如著録、文獻以及相關工具書的鏈接等(詳見後文)。“殷契文淵”字形庫以字形編碼
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 殷契文淵 甲骨文 字形 建設與 思考
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。