人文-赵思渊:民间文书整理与研究中的数字人文方法与文献学本位

人文-赵思渊:民间文书整理与研究中的数字人文方法与文献学本位 ,对于想了解历史故事的朋友们来说,人文-赵思渊:民间文书整理与研究中的数字人文方法与文献学本位是一个非常想了解的问题,下面小编就带领大家看看这个问题。

原文标题:赵思渊:民间文书整理与研究中的数字人文方法与文献学本位


2010年以来,上海交通大学地方文献中心一直致力于民间文书的收集、整理与研究。我们的整理方法与研究思路,以诸多学界前贤的典范工作为基础。傅衣凌等前辈学者利用土地契约分析乡村社会,一直是我们从事民间文书收集与研究的兴趣缘起与典范。(参见曹树基:《石仓契约的发现、搜集与整理》,《石仓契约(第一辑)》“代序”,浙江大学出版社,2011。)
2007年,我们的文献收集工作从浙江丽水的客家村落石仓开始,这里的田野工作与文献收集一直持续到2010年,整理与研究则至今仍在继续。石仓研究采取了在地保护的形式,契约文书经修复与电子化后,即还给当地乡民。这些文书今天仍是当地乡村文化的一部分。最近,石仓阙氏族人建立了主题博物馆,展示这些契约文书,以及其所承载的乡村历史记忆。
从2010年至2013年,交大地方文献中心陆续收集民间文书33万余件。这批文书是抢救性收集的性质,采取高校保护的形式。2012年之后,地方文献中心陆续将所收集的文书全部移交校图书馆,由图书馆保藏、修复、整理。收集民间文书,最终的目的是开放利用,服务于学术共同体的研究需要。研究中能否有效地利用文献,则是以好的文献整理为前提的。
如何整理民间文书,学界已经有一些成熟的经验。如中国社科院历史研究所对徽州文书的多年整理,以及刘伯山一直提倡徽州文书的“归户性”,都给了我们很大启发。不过,在民间文书收藏领域,33万件可能是前所未有的收藏规模,随着数量级提高,整理难度也倍增。如果统观近年来的民间文书研究,这一问题也具有普遍性。20世纪90年代,周绍泉先生曾估测存世的徽州文书为20万件左右。2000年前后,刘伯山估算为40万件以上,时至今日,已知各公藏机构的收藏数量恐怕近100万之谱。而其他如清水江文书、太行山文书、浙南文书,也俱以数十万计。也就是说,当下民间文书中的大型文献群都面临共通的问题:如此巨量的文献该如何整理、研究、利用?
数字人文方法以及重新在文献学中定位民间文书,也许是值得考虑的方向。数字人文(digital humanities)兴起于20世纪90年代,强调应用数字分析工具研究人文学问题。我认为数字人文研究大致包括文献数据库、线上博物馆、数字原生文本分析三个领域,还有的学者将数字人文归纳为学科技术应用与回顾、文本分析与作者研究、数字人文技术探索、不同语言的计算语言研究。(中文学界最新的研究综述可见高瑾:《数字人文学科结构研究的回顾与探索》,《图书馆论坛》2017年第1期。)中文学界中,项洁可能是最早引入数字人文学概念的,当下国际中国史研究中最具影响力的一些数据库与分析工具项目,都与他的团队存在研究或人员上的合作。2009年,项洁团队开发完成台湾数位历史图书馆(THDL),包含台湾古契书与台湾总督府档案两个子库。
台湾古契书数据库是对民间文书整理最具启发性的一个数字人文项目。这个数据库不仅能够实现各种类型的检索,最大的意义是凸显了元数据(metadata)对于文献分析的重要性。元数据也被称为“数据的数据”(data of data),其功能是将描述性文本转化为可分析的数据。通过元数据,数据库实现了上下手契关联、人物相关性分析,也可以与更多其他文献进行关联分析。数据库注重于帮助研究者发现文献间的联系,而不仅仅发现文献,这也更符合历史学的工作方法。建设元数据虽然本就是文献编目的基本工作,但在日新月异的数字技术的背景下,好的元数据建设将民间文书的利用方式从“读”转变为“分析”。相比于一般意义上的古籍,这对于民间文书具有更重要的意义。
为什么这么说呢?这就要回到如何从文献学出发理解民间文书的问题。相比传世历史文献,尤其是一般意义上的古籍,民间文书通常直接产生于日常生活,未经过出版暨知识再组织的过程。就民间文书的每一个单独文本来说,通常也是比较碎片化的,体量比较小。古籍通常根据着者、刊刻版本、地点等信息辨别文献,一本书也会有不同的版本。对于民间文书来说,上述信息常常是不完整乃至阙如的,从民间文书的生产过程来看,更不会形成版本。也就是说,以针对古籍的“读”的形式研究、利用民间文书,将会面临限制与困难。
民间文书或民间历史文献应当探索针对性的研究方法,学界对此已有倡议。2004年,郑振满曾经探讨了建立民间历史文献学的必要性,2012年他在访谈中提出民间历史文献的研究方法:建立文献的系统、考察文献的源流、找到文献的主人。就建立文献系统方面,郑振满提出文本的基本特征、科学分类、内在联系三个要点。(梁勇、郑振满、郑莉:《新史料与新史学——郑振满教授访谈》,《学术月刊》2012年第4期。)此后,申斌、杨培娜梳理了民间历史文献整理与研究的学术史,从中提出形成民间历史文献学的可能性。(杨培娜、申斌:《走向民间历史文献学——20世纪民间文献搜集整理方法的演进历程》,《中山大学学报(社会科学版)》2014年第5期。)
以元数据为基础建设数据库,是根据民间文书的特征推进整理、研究的有效路径。同时,元数据与数据库建设,则必须以理解民间文书的特征为基础。也就是说,设计元数据与建设数据库的过程,同时就是对民间文书做文献学研究的过程。正如郑振满指出的,欲理解民间文书的系统,需理解其特征、分类、内在联系。民间文书的特征,正如前文所说,是非组织化的。民间文书的分类,迄今已有根据不同研究需要形成的诸多不同系统。民间文书的内容可根据研究议题不同,形成繁多而相互重叠的分类系统,这样的分类是封闭的而非开放的。就数据库建设而言,当然需要稳定且开放的分类系统。欲建立稳定、开放的分类系统,则从文书性质出发,是较为有效的途径。
民间文书形成于日常生活,在民众生活中承担某种特定的社会功能,当其社会功能完成后,则又基于经济、法律或文化的原因,被长期保存下来。因此,从形成民间文书的社会活动中归纳文书分类系统,较有可能达到前述稳定、开放的目的。上海交大所藏文献,也是基于这样的思路设计分类系统的。(赵思渊、汤萌:《上海交通大学新藏地方历史文献的分类法及其依据》,《上海交通大学学报(哲学社会科学版)》2014年第3期。)
民间文书具有怎样的内在联系,需要从文献研究与田野工作中求得,但数字人文方法可以帮助分析、展示其内在联系。以契约为例,契约交易中的社会关系对交易行为有什么影响?这在经济史与社会史中都是值得探讨的议题。应用数字人文方法,可以从文书中抓取人物信息,赋予标记(tag),再利用标记做定量分析。这些分析可以验证文献研究中提出的问题,也可以帮助文献研究发现新的问题。
当然,利用数据库推动新的研究议题与研究方法,仍然需要以文献学研究为基础。也就是说,首先必须准确理解民间文书是什么,才能决定数据库能够帮我们做什么。同时,民间文书研究的推进,往往也就是在理解民间文书的性质的过程中获得的。事实上,即使是一些常见的民间文书类型,迄今也不能说已获得了深入的理解。
例如家计账簿,存世数量仅次于各类契约,但其研究相较契约还有很大空间。账簿是一种非叙事性的史料,更能够反映书写者的潜在观念,尤其是可以揭示士绅阶层书写的文献所未记载的社会面向。同时也因为账簿是非叙事性的,解读难度更大。其中的度量衡、时间、货物、货币等信息,往往是“地方性知识”,必须辅以大量的田野调查才能理解,有时甚至仅能依靠账簿内的数量关系推测其涵义。这时,建设数据库、引入数字人文工具,往往是有效的研究路径。
账簿研究已经极大拓展了我们对乡村社会的理解。他们的空间流动性之大远超想象,也对跨区域市场具有高度敏感与经营能力。(参见刘永华:《从“排日账”看晚清徽州乡民的活动空间》,《历史研究》2014年第5期及《小农家庭、土地开发与国际茶市(1838-1901)——晚清徽州婺源程家的个案分析》,《近代史研究》2015年第4期。)20世纪70年代波普金(Samuel I. Popkin)与斯科特(James C. Scott)曾经关于农民道义经济的争论,也许可以从中演绎出新的解释空间。账簿研究中还可以进一步讨论的是乡村社会中的观念演进,村民如何理解价格、货币?(可参看蒋勤等:《清代石仓农家账簿中数字的释读》,《社会科学辑刊》2016年第5期;以及章毅等:《受限制的市场化:近代浙南五谷会研究》,《社会科学》2013年第9期。)如果以欧洲史研究为对照,早期近代社会中私人财产权的形成,经济观念的演变等等重要议题,都是从账簿研究中获得论证的。(如艾伦·麦克法兰:《英国个人主义的起源》,管可秾译,商务印书馆,2008。)
民间文书的文献学研究中所产生的研究内容,将有可能为历史学的其他研究领域,乃至经济学、法学等社会科学,贡献新的论据与研究议题,这将使民间文书在更广阔的学术领域中展现其学术价值,也将民间文书研究者联结入更大的学术共同体之中。
文章来源:《中国史研究动态》2017年第5期