加入收藏   ENGLISH
網站首頁
中心簡介
研究人員
學術活動
出版品
研究資源
所內專區
首页  学术活动  活动纪要
青年學者說 | 數字人文視野下的歷史學
  发布时间: 2020-09-07   信息员:   浏览次数: 417

引言

计算机和互联网技术的发展,极大改变了人文学科的研究范式、教学手段与成果呈现方式。数字人文就是数字技术和人文学科互动下诞生的新兴学术领域,在文献数字化基础上,以文本挖掘、量化统计、地理信息系统、社会网络分析、可视化等为代表的数字人文方法给历史学带来了很大变化,也逐渐成为我国史学界的关注热点。尽管认识尚有差异,但数字时代已然来临,人文学科面临着如何数字化的问题。明理君邀请几位作为数字人文引入历史学科的见证者、参与者和推动者的青年学者,围绕数字人文与历史学发展这一主题进行研讨,从理念到方法再到实践,回顾数字人文引入历史学的历程和得失,展望未来的新可能,以期对深化相关研究与探讨有所助益。

 

与谈人:

彭凯翔  河南大学经济学院教授

潘威  云南大学历史地理研究所副研究员

赵思渊  上海交通大学历史系副教授

 

主持人:

申斌  广东省社会科学院历史与孙中山研究所助理研究员

 

技术与思维:数字人文与史学的不期而遇

主持人:数字人文从本质上说究竟是一种技术工具,还是一种思维方式?如果是前者,那么我们应该坚持学科本位,用数字人文技术来解决自身问题。但如果数字人文是一种因应于数字化时代的思维方式,那么它将会给史学等传统人文学科带来哪些深刻影响呢?数字人文是怎样一步一步介入史学研究的具体过程呢? 

潘威:在我看来,数字人文集中体现了计算机科学对人类思维方式的影响。数字人文作为新兴交叉领域,不同学科、不同领域、抱有各自具体目的的学者进入这一领域后,产生不同的看法很正常。数字人文的本质应当是更偏向一种思维方式,因为技术体系不能脱离具体的研究问题而存在,至于它是否会颠覆性重构传统人文学科,我认为不能简单地回答“是”或“否”。作为学术研究而言,传承与变革往往同时存在于我们的工作之中。比如,在历史自然地理研究方面,“黄河八百年安流期” “唐代气候特征” “明清小冰期与中国历史走向”等,都是长期被关注的重大课题,需要信息化技术的支持,数字人文如果能推动这些传统问题的解决,其生命力才能更为持久。

在计算机普及之前,学者的工作很大程度上依赖图书馆,个人工作必须适应公共资料管理方式;计算机的普及为建立学者个人资料管理体系提供了可能;高性能个人计算机和互联网的成熟进一步降低了构建个性化资料管理体系的资金成本和人力成本。数字人文进入史学领域很重要的一个契机,就是顺应了史学研究中对个性化信息管理的需求。今后,史学研究更需要跨越学科领域、跨越学者单位,形成复合型的、模块化的研究团队,数字人文进一步深入史学就需适应这一趋势,在发展个性化资料管理体系的基础上,形成基于互联网的“资料交互网络”。 

彭凯翔:数字人文首先是一种技术工具,但它的确会影响看问题的——尤其是研究议题的选择。因为每一种工具都有自己处理起来最有效率的问题,可以把这些问题推到学术前沿。就数字人文而言,它一方面是将人文学科的文本、图像等信息以数字化的方式储存及利用,通过“E考据”等方式提高传统人文学科研究的效率;但更具革命性的方面在于,它将信息聚合在一起,进行归类、编码、匹配等处理,使信息转化为可比或可关联的数据,最终让研究者能够从信息中发现或检验某些趋势、某些关系,为我们从更高维度、以更贯通的方式解释信息提供了契机。在传统的学科划分里,人文学科更偏重特定信息的诠释,而对通过趋势、因果关系等来进行理论探讨关注不够。数字人文有助于打破这一划分,促进社会科学、自然科学与人文学科的交叉,解决一些难点问题(如制度变迁、环境变迁等)中的数据“瓶颈”。

数字人文最核心的理念是对信息进行系统归类、编码,而不限于数字化。如果这样来理解的话,中国传统文献中的类书、谱牒之属,可谓先声。但真正给这种工作提供动力,是来自近代社会科学、自然科学的需要。以20世纪前期的国内史学为例,传统史学工作者的谱录编纂固然活跃,但更能反映风气之变的当属有社会科学关怀的汤象龙、梁方仲等学者对经济史料的表格化整理,以及气象学家竺可桢将文字记录转化为历史气候数据等工作。20世纪中期以后,一些国家级的工程又振其余绪,如谭其骧主编《中国历史地图集》,中华书局《二十四史》点校中的人名和地名标注,中央气象局组织绘制的《全国近五百年旱涝分布图》等。至于相对格式化、规模化的地方志、族谱等史料,海内外学者也在20世纪中期前后就开始爬梳其中的农业、人口等方面资料,并尝试进行数据化。如果没有20世纪以来对史料的编码化处理作基础,今天的数字人文或许就仅仅是数字化,而不能真正实现数据化,也难以产生我们所看到和期待的深刻影响。

赵思渊:我感觉对人文学科来说,数字人文首先改变了研究环境。从迄今为止数字人文的发展来看,特别是在历史学领域,多数个案研究的核心议题、提问仍然来自历史学的传统话题,甚至研究方法也未必超出原本以量化或结构化方法处理史料的方法论。换言之,历史学总是以史料学为基础的,这一点不论任何时代都不会发生变化。不过,数字人文的确改变了整理、分析史料的工作环境,也令一个历史学家所能处理的史料规模达到前所未有的程度。数字人文要面对不同人文学科传统和多种区域文化传统,这意味着数字人文本身可以有多重理解,有不同的研究脉络。

就数字人文与中国史领域结合而言,项洁主编的《数字人文研究》丛书出版(20102016)可能是一个值得关注的事件。此后中文历史学界有关数字人文的讨论逐年增加,以“大数据”或“数字人文”为主题的会议,在2015年之后也显著增加。就历史学内部来说,历史地理是最早自觉引入各种数字技术的领域,这与历史地理学的研究特色分不开。而经济史领域因为处理量化资料,也很早就引入统计分析软件,并且建设数据库。不过,对中国古代经济史来说,虽然传统中国史料中也包含大量经济相关的数字,但要把这些数字转化为可分析的数据面临诸多瓶颈。仅就最基本的价格与度量两类数字来说,银两有多种不同的成色、计重,各类货物的称重、体积也都有各种不同的表示方法。如果这些数字不能进行统一的换算,就很难应用现有的数字人文工具进行分析。当然,这也推动我们去思考如何结合史料与研究主题的特性,开发有针对性的数字人文工具。

 

超越检索:数字人文在历史学应用的新进展

主持人:诸位可否结合具体工作介绍一下数字人文在史学研究应用中的新进展呢?未来数字人文还可能对史学研究有哪些重大改变? 

潘威:对于我所从事的历史自然地理研究而言,环境和社会信息都非常复杂,建立一种能够清晰呈现自然与社会关系、辅助我进行决策的工作环境非常必要。

2016年,我们提出了“数字历史河流”概念,其核心是实现“历史时期地表水文过程及人文因素影响机制模拟方法”,对这一理念的试验是“数字历史黄河”平台,包含6个方面:高精度的三维微地貌,水利工程与地形模型的融合方案,河道三维形态的复原,地表水历史时期的运动过程模拟与展示,历史时期的降雨特征重建,历史时期河流—水利管理方式。而“数字历史黄河”作为“数字历史河流”理念的实践,不仅是一个展现历史时期黄河河道时空变化的可视化成果,而且是专业历史资料管理平台+一个专题数据集+一系列历史信息分析和展示功能,是将地理信息系统、工程建模、水文模拟、文本结构分析、社会网络分析等多种技术手段进行融合的一个尝试,同时,也是对既有黄河历史研究中资料体系的重大突破。

“大数据”和“移动互联网”为历史地理信息化的进一步发展准备好了必要条件。但要将这一机遇转化为实际的创新还有很多问题需要解决。最重要的就是营造好技术创新环境,数字人文建设需要经费、场地、设备、培训,这些都需要投入,也需要加强管理。至于具体技术方面,“人工智能”是可以预见的一项具有重大意义的创新。 

彭凯翔:对历史的理解可以通过对历史事实按一定的时空关系排比叙述来建构,但无论是时间上的先后关系还是空间上的区域范畴,本身都不足以构成因果性的解释。另一种理解历史的方式是,将它视为多个变量相互影响产生的一个过程,史料则是这个过程给观测者呈现出来的某些记录(或样本)。在后一种方式里,每条记录都在某种程度上向我们透露变量间的关系,而我们则要努力拼合记录中的信息,来找出变量间最可能的关系。为此,就需要将历史记录结构化,把样本中的信息分解为若干变量的取值或编码,形成数据库。在以往的历史数据库建设中,较常见的是将原本就是数据形式的史料进行汇编或电子化,也有的数据库是对原始数据进行某种处理后得到的。近年来的一大进展是越来越多的人物、制度等方面非数值但结构化较高的史料得到整理,形成了《中国历代人物传记数据库》《明清人名权威资料库》《辽宁多代人口数据库》《清代缙绅录数据库》等成果。与此同时,近20 年来,一个突出的现象是经济学者介入了历史数据库工作。他们一方面将历史学家已整理的数据按时空单元匹配起来,形成多变量的数据库,另一方面也对一些未结构化的史料进行整理,建立新的数据库。

史学界的数字人文目前还较少应用人工智能和云计算。人工智能也可以理解成人工+智能。史料的数字化直到现在主要还是依靠人工,也通过人工在文本识别、点校、标注等方面提供了堪称海量的数据积累,为迈向智能提供了很好的基础。云计算是和人工智能相辅助的。相信将来我们不仅能够在互联网上方便地查阅史料,还能利用人工智能来更有效地找出我们真正需要的史料。另外,目前民间文献的数字化还很不够。对于内在结构较特殊的账簿、族谱等史料的数字化,学界恐怕还要做不少探索。

 

审视与期许:从史学学科传统展望数字人文的未来

主持人:任何一种技术、方法都有其适用对象、适用限度,须与其他研究方法技术相配合。数字人文热之下,更需要我们回到历史学学科传统进行冷静的审视与反思,以更好地发挥数字人文的作用。请就此谈谈看法。 

潘威:就我个人的经验和认识而言,数字人文只是改变了历史叙述的方式,辅助研究者进行史料辨析、建立因果链条等,数字人文并不能代替研究者的决策地位。至于历史感的形成和升华还是需要依托传统方式,阅读、写作、经历、田野考察等才能真正培养历史感,数据库、地理信息系统等技术手段能够使这些方法的运作更为有效,但无法从根本上改变历史感的培养方式。

彭凯翔:研究人员在面对更加大量的数字化文献时,的确可能会在文本的咀嚼上不够从容,但并不意味着后者不重要。事实上,如果要对史料进行结构化编码的话,就需要对史料的体裁、笔法、制度背景等有系统的把握,这些都离不开考据上的积累。所以,现在构建新的历史数据库,同样也要在史料辨析上先下足功夫,所谓“越多人工,越多智能”。另外,历史学的传统本身有多元性,专门史等分支的交叉性一直就很强。只是,历史学者在最近的交叉研究中受技术等限制,往往局限于史料或数据提供者的角色,这是有必要矫正的,交叉研究不应仅是用其他学科比较华丽的技术重新印证已有的解释,而是要让历史学也从中开拓新领域,得到新发展。 

赵思渊:我始终相信,数字人文不会改变历史学所关切的根本议题。但数字人文的确改变了历史学家面对历史文献的方式,只是这种改变在历史上也不止一次发生过。对历史学家来说,也许当下更需要思考的是将来如何面对原生数字化史料,尽管以数字人文处理传统史料是当前较为活跃的领域。此外,数字人文对历史学的影响不仅在于研究方面,也在于教学以及面对公众的方式,可视化、人机交互等都是显著的变化。这些变化不仅意味着如何讲述历史,也将改变历史研究成果发布中学者与读者之间的关系。 

主持人:数字人文想要持续、健康发展,必须在原始资料的收藏与提供者(档案馆、图书馆、博物馆等)、资料的加工者与数字人文产品的提供者(商业公司、收藏机构、科研机构、研究者)、数字人文产品的使用者(研究者、公众)之间形成良性互动与循环。其中,研究者兼有需求方和供给方双重角色。诸位可否从这两种不同角色来谈谈对数字人文产品提供者有什么期待以及数字人文基础设施建设所面临的问题与可能的解决途径呢? 

潘威:从需求方而言,我们希望各级档案管理部门能够提供资料查阅和使用方面的便利。从数字人文的研制方而言,我认为最重要的是建立有战斗力的工作团队,特别是在史学研究机构推行实验室建设。如果能有更多高校重视“数字人文”实验室建设,将其纳入学校统一的实验室管理体系,实验室管理方式和运营方式的改变将会极大改善数字人文的科研环境。 

彭凯翔:目前在高校利用较多的是商业化的数字人文产品,主要形式是全文数据库和可检索的图像数据库。不过,这些产品对于深度的数字人文研究而言,还有不小的改进空间。一种比较彻底的改进思路是为某些数字产品提供主流数据分析软件的应用程序编程接口,让有需要的用户可以自主调用。当然,配套的版权规范也要跟上。而方志、族谱等基础史料的数据化,其工作量既非某一团队或机构所能胜任,其受益方也是整个学界,最好有国家层面的协调机制。 

赵思渊:这里可能有几个不同层次的问题需要考虑。第一,数字人文也是互联网浪潮的一部分,开放,更开放,应当是数字人文发展中的追求方向。第二,对于历史学来说,如果我们将数字人文理解为研究环境的转变的话,这种转变的驱动力既可以是研究者个人,也可以是公藏机构与学术单位,还可以是商业机构。数字人文产品的供给必然是多元的,如果能够形成一些通用标准,对更多的研究者是有利的。比如说,各个数据平台之间是否能够设置通用的数据接入、转换接口,或者在开放获取方面达成一些共识。第三,数字人文的确可能为学者与公藏机构的合作带来新的可能性。我们已经看到,数字人文的发展为公藏机构拓展自身的研究领域打开了新的空间。在这个新的空间中,学者与公藏机构唯有紧密合作才可能有新的创获。进一步说,馆藏资源的价值与影响力,将更多由关联研究所决定,而不仅是资源本身是否稀缺。

 

(原载光明日报202083114版 史学



版權所有:廈門大學民間歷史文獻研究中心 地址:廈門大學南光一號樓二零四
         電話:0592-2185890 服務信箱:crlhd.amu@gmail.com
Copyright © 2010 , All Rights Reserved 廈門大學ICP P300687