李林/华东师范大学教育学系(基础教育改革与发展研究所)
一疫情之下文献阅读和标注的经与权年春季学期,我在华东师范大学教育学部开设硕士课程《中国教育名著选读》及《生活史研究》。突如其来的新冠疫情,使得这段教学经历异常特殊,因此我决定将其中的片段记录下来,并对关联问题稍作省思。最近五六年,《中国教育名著选读》课程修读同学总在6—12人之间,非常适合小班读书的教学方式。本学期共有8名同学正式选课。选课学生在本科阶段多数属教育学或小学教育专业,部分为中国文史类专业毕业,少数为跨考的其他学科(包括理工科)学生。受疫情影响,课程采取线上教学。大家充分商议之后稍作权变,即纵向上仍以孟宪承、孙培青编注的《中国古代教育文选》为经,横向上从朱熹《四书章句集注》入手,[1]藉此上溯先秦,下及明清,旁涉释老,配合拓展阅读研究论著及标点练习,完成本轮教学。教学中,学生先行预读,课堂上大家轮流解读并讨论,认识其人(时代)、其书(版本)、其学(思想)的主要议题。每周课堂读书之外,另有两事:一是阅读相关的正史传、志,以及指定的研究论文或著作章节,一是稍作古籍标点练习。以下探索和记录,即是从课外标点练习中引申出来的。过往几届教学,我会在每堂课最后二十分钟左右,派发一两页影印古籍,一起标点释读,以期增进大家对于古典文献载体形态的认识,并提升语感,加深理解。若未完成,课后继续练习。本学期采取在线教学,遂将这一环节移到课后。我延续之前的做法,继续发给大家电子版古籍,请同学打印标注或电脑标注后,发到课程群里;同时,兼用中华书局的“句读Pro”小程序。该程序依托书局出版的标点古籍,相对可靠,而且能自动评改,较为便利;不足之处是,练习所见小程序中文本只有经文而无注文。传统与现代两相结合,每次课后练习,同学们都“超额”完成指定条目。图1、图2、图3是传统及新型标注模式下的几份学生练习。图1学生课外标点练习(传统练习方式)
图2学生课外断句练习(在线练习方式)
图3学生课外标点练习(书影标注方式)
学期前八周,我们参照《四书集注》,逐条读毕《中国教育文选》中编选的《论语》篇章。而后开始选读《孟子集注》,先解《序说》,正文则以《梁惠王上》《告子上》及《尽心上》三卷为主。课外标点练习,兼用中华书局的小程序。另外,由于《序说》中涉及韩愈对于荀子和扬雄的“有限肯定”评价,而后程、朱再“有限肯定”韩愈,进而对荀、扬“升级批评”,其中涉及的时代及义理问题丰富而有趣。因此,我特别选了五臣集注《法言》中的司马光序文,来做标点练习;并找来宋本《法言》电子版发给学生,以便大家能间接感受宋版书之优美。[2]本学期大多数直接在电子版上标注,再发到群里。虽断句偶有偏误但能看出学生们都在认真完成练习。二在网络环境中追寻“同文异读”做老师和做家长有一些相似之处,比如不宜时时处处都扮得全知全能。对于不少问题我确实所知有限,如果同学曾教益补正了我,我只要记起,都会补充或纠正前堂的不足,并且说明是谁拓展或纠正了我。理想的教学活动中,师生应该都可以放心说某个问题“我不懂”。当然,不懂之后应该是主动探究及相互学习,而非“一物不知,深以为荣”。这次,我在课程群中留下的信息为:好的,谢谢大家!我暂时无法判断对错,因此想继续交给大家一项探索任务:请用你能想到的办法,找到《司马温公注扬子法言序》较为可靠的标点本,发到群里来,并且略说你是怎么找到的。下周停课,时间充足,大家可以休息休息,从容探索。请在5月6日之前,将探索结果发到群里(没有找到的也请说说做过何种努力)。[3]没到限定时间,同学都在群里分享探索过程和结果。过程有的简单直接,有的曲折复杂。大家都各尽所能,调用各种搜索引擎、数据资源、文献传递服务等,努力探索。这就是学习——结果固然重要,过程更加关键。至于结果,我预期学生会用两种思路去探究:其一,通过今人校注、译注的《法言》,寻找旧序的标点本;其二,通过司马光的集子,找到这篇序文及其断句或标点。实际结果是,多数同学通过不同方式,最后殊途同归,找到韩敬《法言全译》中所附的该序标点。只有林曼曼同学接近第二种思路,不过还是隔着一层没有突破。我稍微补充第二种进路的探索结果。我也是通过几种在线数据资源,找到“宋集珍本丛刊”影印本《增广司马温公全集》(线装书局年),以及“国学基本丛书”断句本《司马温公文集》(商务印书馆年),均未见收录此序;而后在标点本《司马光集》(四川大学出版社年)补遗卷10《序跋》中,见录《注杨子法言序》。也有一位同学,提供的是一般的网络纯文本标点版本。我阅读后提示大家,这种版本可以稍看,但其文本及断句疏漏的可能性更大。在电子资源异常丰富的时代,如何调用各种技术和工具,快速找到文献的不同版本,并对照判断优劣,灵活取用,又是电子时代的资源检索需要拓展的技能。以下引述两位同学在课程群中的探索自述:我把序言中的一句话作为关键词,搜索到一篇引用这句话的论文,然后根据论文的参考文献,找到了《法言全译》这本书,书的附录中有“《法言》旧刻序跋”,其中包括了带标点的《司马温公注扬子序》。[4]我根据《司马温公注扬子序》中的关键词,检索到了“国学大师”网站中元刊本的《纂图互注扬子法言》,里面有标点版本,但是没有注明是哪位作者标注的,而且是私人网站权威性不高。所以我就在鸠摩搜书和读秀中继续检索《纂图互注扬子法言》,找到了很多没有句读的刊本。之后又继续检索关键词,找到了《司马温公集编年笺注》作品集,其中有“集注《法言》序”一篇,但是内容不全,不过可以作为参考。之后又继续检索关键词,找到了山右历史文化研究院编的《山右丛书初编十》,其中有《扬子法言》的温公序,也是不全,但可以和上部书一起共同参考。目前为止我还没有找到《司马温公注扬子序》完整的标点本,希望借鉴一下同学们找到的版本。[5]上引两段发言,第一种思路和结果乃多数人所取者;第二种则较为迂折,最终也没有完成预定目标,但过程中所见较多,而且稍具比较判断不同资料来源权威性的意识。无论如何,同学们的所见所得虽然不见得都很高明,但可以肯定的是,她们都在真实探索,相互学习。如前所述,《法言》存世刻本不少。郭俊玲同学在探究过程中,还从“国学大师”网站找到了一种和刻本。我循着她自述的探究历程回溯,也找到该版;而后通过京都大学所建“全國漢籍データベース”(全国汉籍数据库),[6]查知此乃日本万治二年(,清顺治十六年)跋、京都中野小左卫门覆明世德堂刊本,完整题名《新纂门目五臣音注扬子法言》,十卷本,日本宫内厅书陵部、国立公文书馆、东北大学、东京大学、九州大学、京都大学、东洋文库、名古屋大学等机构均有典藏,应该是和刻本中流通最广的本子。这样,我们找到了这篇序文的两个主要现代标点版本(即《法言全译》本及《司马光集》本),[7]这是本次练习的“初始任务”。我请同学对照看看,两者在处理上有何异同。同学们对勘之后,举述两个标点版本在全文是否分段、部分句子是否断开、句号或逗号的使用,以及书名号、专名号处理等方面的细微差异。分段、标点等细微的“技术差异”背后,其实关涉的是文献的产生和流通以及后人对于文本内容的理解和处理等重要问题,这也是传统学术训练重视此类细节的主要原因。至此,我们的教学主要仍然依循传统模式进行,不过交流方式改为在线而已,并未自觉涉及“数字人文”议题。三人类的“阅读”与AI的识文断句依照过往课程的设计,标点练习应该到此为止。本学期中借着在线教学之便,我向学生们拓展介绍了安徽大学开发的“奎章阁中国古典文献资源导航系统”[8],及其新近发布的“全球汉籍分布GIS系统”。教学中,我主要请大家在其“实用工具”一栏,打开由北京师范大学中文信息处理研究所研制的“古诗文自动句读”系统,[9]将这篇《法言》序文的繁体版文本,分两次复制到系统左栏的文本框中,点选“断句”。我自己根据宋版书影校过发给大家的繁体文本。我本来打算先试着用书同文公司的“点字成金”古籍OCR系统识别,再作校核,顺便检验其准确性,但未能注册试用;给客服留言也没有回复,只能作罢。[10]断句结果出来后,我请大家各自复制粘贴到自己的文档中,也可再尝试选择“标点”(当时这项功能尚在测试之中)。完成之后,可以得到由系统提供的图4所示断句结果。这样,每个同学手上就有这篇序文的四种标点/断句版本:两种出自人工专家、一种出自她们自己(文科研究生)、一种出自人工智能系统。我请大家再对照着看,各个版本有何异同。次堂课上,我先请同学逐一讲述自己的对勘结果和感受。同学们在前一堂课对照两份人工专家标点的基础之上,补充讨论系统断句的可能逻辑。大家基本一致的深刻感受是:没想到人工智能的断句结果,竟然已到这个地步!是的,自动断句中只有少数几处严重偏离文义,可以绝对判错,其余地方整体上并不影响疏通文义。不过,大家对于此种文本处理的方式及结果,总体上还存在不少疑虑。少数同学一并测试了“标点”功能,指出如果施加现代标点,则错漏比只做断句更多,在书名、专名等的处理上尤其明显。图4北京师范大学自动断句系统处理司马光序文结果
其间,一位同学勇敢说出了事实:以两个版本的人工专家断句为参照,对比自己第一次断句的结果,人工智能断句的准确率竟然比自己还高!我肯定了她的诚实,并拓展补充统计事实:依据中华书局和北京师范大学的合作及实测,自动断句的准确率已达90%以上。[11]这个数据背后,是计算机专家和语言学家密切合作,用精密算法、以多达数十亿字的原有专家点校本在不断训练系统。这种基于“深度学习”的设计,基本理念或许与以人类实战棋谱训练Alpha系列“棋手”相似。其准确率,高于70%以上的文科研究生的断句水平。[12]在此过程中,我们触及了以下问题(虽然不能全部予以解答):第一,以上引述的数据可靠吗?这几乎是研究者的本能疑问,何况有些数据还是由所谓“利益相关者”发布的。其对照实验设计及取样代表性如何?比如,断句难度完全不同的散文和韵文(诗词)是否分开计算?诸如此类,我们希望继续学习更加细致的统计和研究,增进认识。目前只能说,自动断句(不是标点)的准确率,超出了我们的预期。而且此类系统尚在不断优化改进,比如中华书局已发布其在线自动标点系统。[13]第二,传统学术机构及出版机构近年高度重视古籍数字化和整理智能化,固然反映出在语言处理领域,以诺维克(PeterNovick)为新近代表的“经验主义”与以乔姆斯基(AvramChomsky)为代表的传统“理性主义”之间的争持,以及前者对于后者的挑战甚至部分“超越”。[14]不过,我们是应该在短期之内将已知古籍尽数搜罗整理?还是应当适当放慢速度并注重质量,以便“但存方寸地,留与子孙耕”?抑或是说,目前的局面,实际仍是人工智能驱动下文化领域的“剧场效应”?进而言之,此类“文化基础设施建设”是否需要更高位的、更具见识的“顶层设计”,并探索标准规范的建立?第三,既然如此,我们这书还要读吗?这似乎不成问题。正是因为持续的数字化,极大改变了“文献”既有的形态,我们不仅要读,对于核心文本还需去读较好的整理纸本,有条件时还应去读接近文献原貌的版本,哪怕只是影像档或影印本。何况,学以为己,他人/物读得再多,与己何干?谷歌Alpha系列战胜人类顶尖棋手,并不影响普通爱好者继续享受“手谈”之乐。更不用说,作为以读书为业的人文学者,其研究当是源自不断地阅读、思考与内化,在这方面,算法系统再怎么高明,也于事无补。不过,事异而备变,读书的视野和方法确实应当稍作转换;相应地,研究中也面对一些前所未有的问题。在目前的技术条件和持续投入之下,可以预见未来一段时间里,各种以前稀见文献的影像及全文,以及用以分析这些资源的工具会被陆续发布。此种情况,首先会给学术研究带来很大便利,今日青年学人完全不用电子资源展开研究者,只怕已微乎其微。因此,与其纠结支吾于“是否用”,不如敞开探究“如何用”。其次会给学术研究带来很大的挑战,因为随手可得的材料很多“来路不明”,或者“泥沙俱下”,如何辨识和拣择会是更大的问题,没有整体图景和问题意识而贸然“入库”,反而可能被淹没在枝节之中。而且,不少数据库建置时由于缺少人文学者的深度参与,加之其底层架构设置较为单调,又因商业利益而各自为阵,以致功能有限,很难达到深入挖掘、结构关联的要求,更不用说与其他同类资源互联互通。因此需要留意,在实际检索中,“见”与“不见”都具有研究意义。最后,现在的研究条件和研究积累,对于研究者的综合素养及成果水平提出了更高的要求。由于现在文献检索和获取极为便利,对于重视材料搜集与分析的历史学科,如果研究中遗漏关键史料较多,就更难以令人信服。四作为知识资源的工具书和数据库以上断句,主要是根据文理脉络(理性主义)及语词规律(经验主义)完成。这对于研究者而言,并不足够。要确切理解文义,还需扫清一些具体障碍,并由此生发出新的研究问题。因此,我请同学尝试对序文中的一些名词术语进行注释,这是源自传统的阅读古书的基本要求。以表1中的十个语汇为基准,也请同学拓展至自己觉得重要或不解的语汇。因为其中涉及较多职官及机构名称,我准备了三种工具书之电子版:CharlesHucker教授所编ADictionaryofOfficialTitlesinImperialChina,龚延明教授编著《中国历代职官别名大辞典》及《宋代官制辞典》;[15]并建议结合《宋史·职官志》(用中华书局“中国经典古籍库”)、《十通》全文检索系统(用书同文古籍产品库)及“鼎秀古籍全文检索平台”,作为拓展参考。词条查实之后,同学可以照录典籍及工具书原文,或根据文献自行综合疏释,均需注明出处;无法查考者,也可略说自己做过什么努力。表1司马光《注杨子法言序》探究语汇列表
到了预定时间,同学们发来课外作业。有直录辞典及史料原文者,有兼用截图并作标注者(特别是对贺凯《辞典》);更有排比几种材料之后,自己尝试再加总结裁断者。有仅用推荐资源之一二者,亦有拓展至推荐范围之外者;亦有同学拓展至注释“镂版”及“俗本”等词;又有同学检得未标点文本时,连带用及上文所提自动断句系统。以原图直引同学处理“祠部郎中”一条的部分材料内容如图5。[16]图5学生提交词条注释作业局部图
该同学尝试列出五类文献来源中,有关“祠部”及“祠部郎中”的注解及引文,然后自己尝试归纳凝练,以数行文字重新注释词条,也是一种别样的尝试。不过,其中对于文献先后主次的排列,包括归在《宋史·职官志》之下的引文内容,其处理不无问题。在此条作业中,既有学生自己录入的文字,亦有纸书PDF版本之截图,还有数据库检索内容的复制,“电子文档”在这里呈现出不同的形态和功能。当然,这里提及的仍是文献典籍的电子版或数据库。原因无他,疫情居家期间,莫说是新入门的学生,就算是一般从事中国文史教研的老师,若非能在家校之间来回周转,也很难随时翻阅这些文献的纸本。至于篇幅,此次学生所交作业少则三千来字,多则万余字。要知道,这只是一次课外小练习,而且我只是略说探究范围,提示资源线索,对于篇幅与体例并无要求。如果同学们希图因陋就简,按照寻常“名词解释”的套路,十个语汇在一页之内即可敷衍完成。不过,她们显然都没有这样做。邓广铭教授曾提出,职官制度、历史地理、年代学、目录学乃研治史学的“四把钥匙”。[17]今日虽然文献类别繁多,技术条件也与之前大有不同,但基本原理仍是如此。我也相信,以传统尤其是宋代职官制度之繁难,她们未必都能洞察细微(即我自己亦然);不过,她们确实在以自己的方式,努力处理这些并不易懂的资料,并且试着去比较、去归类、去总结,难能可贵。次日上课,我们先用一节课的时间,交流探索心得。大家除了分享自己完成此次课外作业的历程,又研讨了主要涉及的议题。其一,龚氏、贺氏两种辞典虽然都是处理职官制度,不过整体上前者断代而详,后者通概而略;且因主要预期读者对象不同,对于背景知识的处理也各有侧重,应当参互对观,兼得其益。由此,我也引申谈及认识工具书体例及结构的重要性。其二,辞书内集中凝练的释文内容,其资料证据大多可从今日数据库检索内容中获得,不过要将后者化作前者,需要经历相当精深的去取和整合功夫;同时,有时也会发现检索所见的部分内容,并不被既有工具书所涵括,甚至有相互抵牾之处,因此权威工具书也常有修订更新的必要。其三,即便是同一词条,在不同的工具书中其释文内容不仅可能详略有差,立论也会有不同,需要结合新的学术研究成果,加以裁断。其四,犹如前几周的探究中多次提及,利用数据库时关键词选择及检索条件设定,以及理解所用数据库的基本结构逻辑、甚至字符处理可能带来的问题,都至关重要。其五,对于词条检索结果的时代及类型分布,以及检索中的“见”与“不见”,也应存有必要的警觉。关于“天复”,司马光序文称“不知何谓”。我们的此次探究,也未有实质推进。只能依据前人有限的考察,以“天复”为唐昭宗或后蜀王建所用年号,视“天复本”为今已亡佚的唐末五代《法言》版本(当为蜀本)。以下完整引述一条同学注释“天复本”的作业内容:天复,唐昭宗年号(—)。前蜀高祖王建在蜀称制时以此为年号。“天复者,唐昭宗纪元而王建在蜀称之。”天复本,盖《扬子法言》注本,书本、作者在宋代均已失传。“天复本……然则蜀本也。撰人当出五代宋初间矣。”[1]李轨注的《扬子法言》是存世的最早的《扬子法言》注本,注本中有《扬子法言音义》一卷,没有记载作者,其中多引用天复本的说法。“五代时缺名氏撰《扬子法言音义》,其中多引天复本某作某,又辨俗本作某之误。”[2]由于已经失传,所以司马温公也未见天复本。“音义多引天复本,未知天复何谓也?”[3][1](汉)扬雄著.李守奎,洪玉琴译注.扬子法言译注[M].哈尔滨:黑龙江人民出版社,:.[2]胡朴安.文字学常识[M].长春:吉林出版集团股份有限公司,:.[3]司马光撰.司马光集[M].成都:四川大学出版社,:.[18]可以看到,该同学在尝试综合古今学者的既有见解,并将其与序文内容关联论述,文脉亦属通贯。虽然未能对此问题的认识带来根本突破,但对于学生而言,仍有“日知其所不知”之效。此外,同学们也提到对比其他作业之后,发现自己的有待改进之处。基于同一目标任务,同侪各自探究后又相互学习,也是课程建群及在线交流应有之义,以免“独学而无友”的弊端。引导学生研究,阅读她们的练习,对我而言也是很好的学习。而且,她们毕竟都已经是研究生,有展开探究的能力与必要。[19]总而言之,传统工具书和新近数据库作为重要的知识资源,需要恰当综合运用,才能兼取其长而有“添翼”之助。反观今日整体趋势,学界较多依赖数据库而废弃传统工具书,也成问题。五探寻文本内外的“为学方案”我们探究至此,主要涉及的是与这条文献相关的版本、句读及制度等问题。我仍希望大家在此之外,稍微了解序文作者司马光在宋代学术史、思想史版图中处在何种“节点”之上,以及传统儒学史中“学案”的地位。因此,我请她们先读朱鸿林老师的《儒家“为学方案”:学案著作体裁》一文,[20]以便稍知传统学案写作的性质、目标及其结构。而后,浏览《宋元学案》之《涑水学案》;[21]并请大家将前附学案表截图重拼为一页(图6)。最后,我请她们进入北京大学最近发布的“《宋元学案》知识图谱系统”,[22]以多种方式查询其中有关司马光的资料;并尽量探索了解该系统,比较传统纸本学案及在线知识图谱系统各自的优劣,思考此类系统的研制给学术研究可能带来的启发与挑战。我请大家在下次课前,仍将探究历程及思考以Word文档发到课程群中,内容形式及篇幅长短均无限制。图6《涑水学案》前附学案表
同学们仍在预定时间分享了探究文档,整体情况也是:琳琅满目,各尽所能,没有一篇出于偷懒应付。我当时不在电脑前,只在手机上逐一打开快速浏览一过,并在课程群中留言:
很好,谢谢大家如此用心!明天上堂[课]读书之前,我们仍先交流此次探究心得。大家如果愿意,也可以有意识地保存自己在如此特殊的时期,认真修读这门课程所产生的“档案”;并尝试就自己的学习以及当下的教育教学,稍做一点反思,以深化认识。我们是研习历史的人,对于正在见证的重大历史局面,也应当有些敏锐感。[23]次日课上,我们用了一节半课的时间,充分交流此次探究心得。同学们整体都是依循“读朱氏论文—初阅《涑水学案》纸本—探索知识图谱系统”的路径展开,也有部分同学延伸查询其他文献,加以辅证。学案中选录了司马光《疑孟》一文,也与这几周正在研读的《孟子集注》互相照应。我先简介朱鸿林老师及其对传统学案的深入研究,并略说自己初步了解的《宋元学案》知识图谱建置背景。我们赞叹并感激该团队花费大量心力,建成系统后免费开放使用,让我们有机会拓展教学与探究的视野。由于该系统乃近年新建,技术条件相对成熟,又有计算机专业团队把关,因此内部架构颇有可观之处。其中的若干思路和技术问题,远非寻常文科师生所能设想和解决。传统纸本学案提供的文本与架构,对于揭示部分学派的传承关系很有帮助,这也是网络数据结构的基础。但是,若非常年深入研究宋元学术思想的专家,很难在脑中勾勒出图谱全景,更不用说其中复杂的交错关联。经过结构化处理的学案知识图谱系统,其“远读”部分对于关系图谱、学术流变、师承关系、学派传承有整体概观,对于所涉人物的“网状联结”,快速查知某位学者在网络中的节点位置等,助益尤多。诚如邓小南教授所言,“历史学处理的材料,是对于有形事件、人物、制度的叙述,而这些背后,将方方面面勾连为一体的,事实上是无形的关系”。[24]而该知识图谱(图7)之“精读”设计,除了传记文本资料,对于这些人物活跃的时间、地点,其中涉及的主要著作名称及职官名称等,都有较好的结构化处理思路。初步“勘探”之后可知,这个系统在快速检索、强化关联、便捷制图几个方面,尤有所长,善用者应能做出不俗的研究,亦如其主页所称“宋代学术史再发现”。初步看到此类系统带来的便利和助益的同时,我们也尝试反思其中的局限及可能存在的问题。首先,从建置理念和逻辑而言,整部学案实际并非单个学案的简单叠加,而是具有某种学术和思想目标的一部著作。系统基于信息抓取、统计和“机械化”关联所提供的结果,在追求直观可视化的同时,也会将思想和学术的复杂性过分化约。其次,从呈现方式来看,目前系统中“远读”所能呈现的图示,非常简洁,但也较为简单(或许尚有更多进阶功能暂未开发或开放)。若非对于时代、学术和文本已具整体认识,凭此图谱也难以提供更加深刻的阐释。再次,从文本细节上看,或许由于版权原因不能直接录入已刊繁体点校本,系统中的简体文本(偶见繁简混排)在文字和标点上时见错漏,仅就《涑水学案》所附司马光小传所见,其中错漏即不下数十处(年5月20日检索);而且与纸本相较,系统电子文本没有书名号、专名号,也不再区分纸本固有的字号大小、栏位高低。这些文本校勘意义上重要细节的缺失,会给有效理解文本和信赖使用系统造成较大影响,尚待精校。我也提示大家,需要对文本有清晰的“上下游”意识;而且,虽然数字人文技术日新月异,归本还原,有足够的精校文本才是“王道”。以下引述两位同学的探究体悟,很具有代表性:我认为在线知识图谱的优点显而易见,就是通过技术,达到某些数据如文本的智能检索和快速关联,这大大提高了我们搜寻信息的速度,而且可以做到可视化,更加直观。但是缺点亦不可忽视。一,仅仅依靠数据关联的文本相关性,存在许多不恰当之处。二,知识图谱将众多学案打散,可能破坏文本的整体性,“时代与编者自身的复杂性”似乎无法体现。这种知识图谱,似乎纯粹地将这些信息作为零碎的史料来拼接运用,而不考虑不同学案作者的主观意图。三,无法代替研究者做出价值判断。线上知识图谱,更加强化联系这一概念。它将人物,著作,地点,时间等等要素联系起来,但是对于儒者本身的思想内容的把握和判断,是没有办法代替研究者完成的。[25]
无疑,在线知识图谱可以帮助我们建立起知识点之间的联系,更好地理解和掌握内容,带来了极大的便利,甚至我希望所有传统纸本内容都能电子化建立起知识图谱系统,形成庞大的学术网络和海量的资源库,任一知识点可由此溯源,串联起相关信息。但如果形成只依靠网络解决所有问题的习惯,长久以往容易使人造成惰性,我们仍需要通过传统纸本进行学术训练,严谨科学,精益求精,同时学会利用网络资源的优势以求互补,并学会鉴别其中的疏漏。而实际上,无论传统纸本还是在线系统,终究只是辅助工具,我们对此所作的思考和探索,不同的理解与感悟,才是真正的核心所在。[26]
我赞许大家表达的真实看法,尤其是她们关于纸本与网络两者之间关系的辨析;同时,我也提示我们应明了研究者与建置者各自的位置与局限,以免责人太过,无暇责己。我们使用时向系统发送的一个简单指令,背后都是有赖建置者不断书写代码、修改结构、补充材料,才能达成。培养同学的开放态度、审辨思维和方法技能,正是此番探究的要义所在。这些见解,有深有浅,有对有错,但若非请同学先行探究,单靠我自己口头介绍,以空对空,基本就如粤语所谓“水过鸭背”。我同时提示大家,在受惠并感激此类项目工作的同时,我们应更多将其视为一种项目成果的展示,是一种难得的努力尝试,而非一种已为定论的研究成果。学者应该基于此类系统提供的思路、信息和工具,进行再次发掘,做出自己的研究。我们讨论涉及的议题和观点,有些可能已近“前沿”,这倒不是说我们的见解有多深刻,而是有些问题此前根本就不存在,或者大家也不大从这些角度去切实探索和思考。
图7北京大学“《宋元学案》知识图谱系统”学派传承图
六CBDB:关系型数据库的勘探实验打铁趁热,我想借此机会,再带大家多了解一点电子资源及数字工具。如哈佛大学费正清中国研究中心、中国台湾“中央研究院”历史语言研究所及北京大学中国古代史研究中心三方合作开发的“中国历代人物传记资料库”(ChinaBiographicalDatabaseProject,CBDB)。我请大家先浏览CBDB项目主页,[27]了解该项目的内容和可能作用;拓展要求是实操练习,借助在线数据、软件以及教学视频的帮助,自定义绘出司马光的社会关系网络图。我先在“查询社会关系网络”项下,只选择学术关系及*治关系(距离设为1、循环次数为2,以免节点数据过多),检索数据后导入Gephi,稍加调整后画出司马光的社会关系网络简图(图8)。亲自实验过,我知道这个过程并不太容易,因此预计学生多不会选做此题。到了预定时间,大家又齐齐在课程群中分享探究文档。这次确实出乎我的意料之外。因为这项任务不是必选,而且不易完成,我原本预期有2—3人完成已很不错。但是,她们竟然又都完成了!图8司马光主要学术关系及*治关系网络简图(李林绘图)
图9Pejak及Gephi呈现司马光社会关系简图(胡甲一、孙芳洁绘图)
次日上课,我们先用一节课的时间,交流探究心得。首先是一些纯粹的技术问题。近日百度网盘链接很不稳定,因此我为了节省大家时间、打包分享的探究资源,她们终究未能下载,而是根据我提示的路径,自己分别溯源下载,这样她们其实会学到更多。我给大家推荐的绘图软件只是Gephi,不过她们有几位拓展探究了同类软件Pajek,并比较两者的异同,以及如何在Gephi中解决节点标签中文字符的显示,节点颜色、大小、布局的呈现与意义等问题(图9)。其次是她们自己下载试用CBDB数据的经验。同学从不同角度,都留意到“自定义”检索及输出的重要性,以及CBDB不止是作为“人物词典”的关键性质与定位。我则介绍CBDB尚有很多可以探索挖掘的空间,如文本挖掘、地理空间分析、社会网络分析及时间分析等,该数据库都能有所关联和兼顾。随着其中添置的历史人物信息不断增多,结构若能再加完善,应该会越来越有影响。截至年5月,库中历史人物总数增至约,名(表2)。[28]表2CBDB所收历代人物数量对比图
至于CBDB等项目能在何种程度上推进中国古史研究,则除了取决于数据库本身的不断完善,更取决于研究者自身的功力和视野,以及在面对这类数字资源时能提出什么样的问题,进而去解决这些问题;魏希德(HildeDeWeerdt)教授论此,尤其强调数字历史中“想象力”(imagination)的重要性。[29]学生们和我自定义的人物关系范围不同,选用软件及布局不同,因此图示各异。不过总体而言,这些图示大致都能提示,司马光自然是这个社会关系网络的中心节点。在司马光的学术与*治关系网络上,王安石占据另一个“关键节点”,司马光、王安石、欧阳修之间,司马光、范缜、宇文之邵三个节点之间形成密切的“三角关系”,透过安惇、邢恕及邢居实,司马光的社会关系与蔡京发生关联,又与皮公弼存在非比寻常的密切关系,程颐、范祖禹和尹才在司马光社会网络上居于重要位置,等等。这些“关系网络”,是虚是实,是对是错,如何解释,都还需要结合文本,循此深究细查,才能理解其背后的“思想世界”及“历史世界”。学生自述探究心得,亦称:最初在使用Gephi软件进行绘图时遇到一些困难,主要是不知道该怎么具体操作。之后通过观看教程、参考已有的案例来摸索、学习、操作,绘成最终的图片。这点也让我觉得,如果在进行研究时使用这种方法,研究者需要学习如何使用该软件,这对研究者在技术方面有一定的要求。以这种可视化的图片来呈现人物的社会关系,其优势是不言而喻的。关于其劣势,在我绘图的过程中,我所查询的资料十分详细地说明司马光与某个人物的具体关系是什么,但是绘制成图,我们只能看到他们之间是存在一定关系的,但具体是什么关系,则并不清楚。在文字信息转化成图的过程中,可以说存在信息丢失的现象。由于每个人的经验与学识不同,每个人从图上解读出的内容也是不一样的。[30]
诚然,数据库可以提供并整合信息,进而部分生产“知识”,但无法形成真正的见识——这来自人脑而非电脑。当前的数据资源及数字工具所能做的,主要集中在三个方面:快速检索、批量统计及可视化呈现;目前的数字人文技术中,较为成熟也比较能够快速解决人文研究问题者,主要为文本挖掘、社会网络分析及GIS技术。[31]其中的任何一环若要“出彩”,都离不开学者自己的深度分析,数据内外的司马光研究亦然。其实,还有一种更加贯通的练习和探究思路——读完标点排印的《涑水学案》后,将校正纯文本上传到荷兰莱顿大学研制的Markus半自动文本标记平台,标记人名和地名。[32]校正调整后,再尝试将标记与统计结果与CBDB数据关联,最后借助HGIS、Pajek或Gephi,应该也能画出《涑水学案》所涉学者系谱图和地域分布图。不过,这样时间投入更多,因此我没有将其设计为必须的探究内容,留待他日。在进阶的学问探索领域,教师即便不再带领学生一同“登山”,也不必因为顾虑山上可能有自己不知的物种,而不告知学生世间本有此山。七架构具有兼容接口的“知识主机”再往前走几步,还可能探究出一些专门论题。实际上,教学中我也不断鼓励同学,可以从这篇序文中所提示的文献学问题,或是制度问题、思想问题、人物评价问题等为线索,撰写学期小论文。以往几届修课考核,虽有诸如撰写史料提要及编制专题书目的作业形式,不过总以撰写论文为主。这次因应修课学生背景及现实情况,我提供了另外两项作业选择:一是购买国家图书馆影印的宋本《大学章句中庸章句》,循其浅痕点断后提交,遇疑试注,遇错试纠;一是全文翻译《哈佛亚洲研究学报》(HarvardJournalofAsiaticStudies)近刊长文“TheLastWordsofConfucius”(孔子的遗言)。[33]上述课外系列探究实验:古籍标点—自动断句—专名训释—知识图谱—社会关系,我们探索了五个星期,共读《孟子集注》三卷;余下五周,我们读《大学》《中庸》两篇。期间,每个人都在依照自己的进度,阅读《四书集注》及有关研究论文。除了课上共读,学期前十三周我自己将《孟子集注》重读了两遍,理解稍增几分。在课堂上,我们的教学方式很“土”,主要就是拿着《四书集注》,逐字逐句轮流读解和讨论选定的内容,整个学期没有播过一页PPT。这当然不是要有意“抗拒”网络技术。我只是觉得,既是“读书”,尤其是读古人书,就应当手边真的有书、有笔,以便随时勾圈点画;而且除了默识心通,还应当出声朗读,讲论一番,如此理解才会深刻。但在课堂之外,我们除了继续阅读相关研究论著,则最大限度地调动、挖掘网络资源和技术,开展“项目式学习”(project-basedlearning)。此时,电脑屏幕取代并拓展了“黑板”,成为传递和延伸知识的重要新型载体,纸书、黑板与网络得以相互融通。在这个过程中,我给学生、也给自己不断试错的机会,以此探索共同学习提高的可能。借用今日基础教育术语,近于佐藤学教授所倡导的“学习共同体”中“活动式、合作式、反思式学习”。[34]我们虽不能至,心向往之。崔允漷教授也曾一再提示教师留意:教了,不等于学了;学了,不等于学会;学会,不等于会学。[35]我有时半开玩笑地对学生说:如果你们今后不是以此为业,深造自得,今天我们所讲的若干知识细节,你们很快就会忘记,这点我很有信心。既然知识细节会被遗忘,除了取得学分、拿到学位,你们修读这科有什么意义?这是学生需要思考的问题,更是老师应该反思的问题。这门课不是数字人文导论之类的课程,甚至也不是古代教育思想史或教育文献学概要课程,课程宗旨是实际去读一些选定的教育原典篇章,我们始终贯彻。课外系列练习中,能够借机认识几种最新的数据平台和人文工具,乃至试探几种软件的用法,估计是学生从未料想到的。其实对我而言,此前虽然对这些平台和工具稍有摸索和了解,但若非此次疫情所“逼”,我大概也不会考虑在自己的教学中,作这样的拓展探究。当然,这并不是这门课程的全部,甚至也不是最关键的部分,这只是一则课外练习的插曲而已。探究全程之中,同学们的参与及反馈都非常积极。每次讨论,她们显然都是有备而来,有话要说。隔着屏幕,也能感觉到她们的向学热忱。还有同学回溯反思五周探究全程,分析各个环节中网络资源的得失与优劣,最后谈及自己对传统纸质书籍与数据化系统的思考,体会较深。[36]在这个过程中,我希望我们除了拓展专业知识,也对我们的思维及方法有所训练,对自己的学业、所处时代及社会有所省思。今日各个行业,都希望从业者具有贯通互联的思维、“无问东西”的潜能以及在“事异备变”中不断学习调适的能力。沈章明博士曾比较梳理过全球各主要国家、地区和国际组织提出的学生发展“核心素养”方案,指出“学会学习”是所有“核心素养”的真正核心。[37]最后,我对她们说:这是一个高度专业化的时代,学无专长则难以立足;这也是一个高度连接和整合的时代,太过偏枯则有碍生长。理想的情况,是能在自己的知识“主机”之上,留下一些较有兼容弹性的“接口”,这对拓展视野和增加趣味,应该都会很有帮助。[38]
故事还能继续吗?当然可以,学问探究永无止境。不过,这毕竟只是一段由阅读《四书集注》的课外标点练习引起的插曲,“编年”故事需要暂停于此。由于这条案例文献的牵引,我们借助书籍与网络之“两翼”,从传统形式的教室、黑板、课桌之中“放飞”,在古今中西之间往回穿巡。身处今日,不宜只视互联网为在线教学的技术平台。RobertCowen教授指出,互联网乃拥有无尽资源、具有非常弹性的“教科书”。[39]和不少同仁一样,疫情期间我也参加过许多在线讲座、沙龙、工作坊的学习,出入于各类教学平台及虚拟“教室”“班级”之间。因危生机,疫情正在实质重塑全球教育的格局,通过突破传统教学中时间、空间、内容、媒介等的限制,重构传统的教与学,进而重塑一种新型的“师生关系”和“教育认同”,乃至可能创生新的教育学理——将“黑板教育学”拓展至“网络教育学”。在此意义上,“传道之器”同时成了“变道之器”。教育是知之似浅、行之甚深的学问领域,作为在教育学科工作的人,我没有理由不去反思和改进自己的教学。我以前是中学老师,现在是大学老师,在所有教学经历中,我逐渐体味到的不是现代意义上的“教学”(instruction),而是传统意义上的“教学”(teachingaslearning)。我们自然需要研究教育名家的思想及其工作,从中获得启发;但似乎也不该忘记,我们周围的师生以及自己的日常职业活动,同样具有研究的价值和必要。囿于专业背景限制,我没有系统研习过现代课程与教学理论,只在实践中隐约体会到,大纲及教材呈现的只是相对显性的课程,师生教学的方法、思维与态度,则是同步展开的较为隐性的“课程”,两者应该同样重要。借鉴杨斌教授的观念而稍易其言:吾之所以教,亦吾之所教。[40]这是大学教育尤其是师范教育的“要领”之一。八内省:既是方法,也是对象本学期的教学形式,前未曾有。应对疫情期间的教学,同学们除了本门课程必须购备的几种纸本文献,如《四书章句集注》《中国古代教育文选》等,手边的参考资料相当有限,这促使我们去尽量使用、探究并反思电子资源。每次与同学们一起探究,实际也是进行在线搜寻和辨别文献、进而稍作“知识考掘”的训练。这是疫情之“危”,也是学习之“机”。如果借用马克·布洛赫的表达,这算是因应时代而拓展研习新的“技艺”吧。[41]无论是传统的征文考献,还是新近的数字人文,水都很深,我们其实连“摸石头过河”都还说不上,不过是在浅水区亲舀一瓢来尝尝酸甜,而非临海远眺并自诩“观水有术”(《孟子·尽心上》)。今日科技昌明,“隔空教学”得以实现。不过,我越来越深切地体会到,在互动交流的意义上,决定师生之间距离的不是空间隔阂,甚至也不是技术等差,而是在人。网络技术能让天涯变咫尺,但有效教学还是取决于师生互动(意动胜于形动)。不然,即便学生端坐眼前,也难免神游太虚。荀子说,“大天而思之,孰与物畜而制之”(《荀子·天论》),这句话一度被引来为“朴素唯物主义”背书,未知是否。其中的原理,倒适用于看待今日的技术问题:视之过高或一味摈绝,似乎都不是“辩证的”态度;实际上手摸索一番,才会知道其功用,明了其限度,而后确定用或不用。最后,请让我来“解构”自己。本文不是出于计划中的写作(我倒是为此暂停了既定写作计划),并非有意识的行动研究,只是寻常讲个故事。这当中缺少方法自觉,无力建构宏大叙事。这则微观记录,只是关于一位普通高校教师如何在疫情期间结合传统及现代资源与技术开展教学工作。各种因缘际会,让我决定将之记录下来。因此,这当中既有追述,也有同步记录,更有少数先期设想而后印证补述。还需坦承的是,历史书写是记忆和失忆不断博弈的过程和结果。在这个过程中,有些东西会被有意选择和重点强调,有些东西则会被有意无意地遗忘,以便裁剪和编织出某个貌似具有特定主题的故事。举个现成的例子,不少人读完这个故事,可能脑中留下的主要是关于电子资源和数字工具的“幻象”;甚至可能会想:这哪里是传统“文选”类课程的正确打开方式?但实际上,我们十倍逾此的时间和精力,都是在阅读繁体竖排的整理本古籍以及相关的现代学术研究论著,并尝试标注一些影印本古籍。你看,这就是选择性叙事的结果。而且,我们作为参与者在经历探索时,最多是觉得这样的学习方式特别一些,很少想过背后竟有许多的“意义”。可见,意义很多是被赋予的,至少是被阐发的。但无论是要建构、阐发意义,还是要解构意义,都需要跳出碎片,并有意识地“脱逸”于某种意义。言说至此,顺路再发几条“后见之问”。第一,这次探究中,有*一农教授提倡的“E考据”吗?[42]只能说埋了条引线,但还不是,因为我们只是结合电子资源,稍作课外练习。若能深入探索,比如将《法言》“天复本”的问题实质推进(极难),那才算接近E考据。第二,这当中有所谓“深描”(thickdescription)吗?[43]对于这个名相,我只是略有耳闻,未尝深究,因此这里不敢轻易攀附。而且我确曾听闻专业人士指教过,所谓“深描”,在人类学中也是属于说不清、道不明的那类“知名概念”。我确实尝试从多个角度,去描写和分析一些细节;但实际上,更多的细节是被“折叠”了。第三,叙事中照顾到所谓的“主体性”(subjectivity)了吗?开始我根本就没有想这个问题,写完回头去看,应该说还是有所观照的(小心又是建构陷阱)。但是不是因为故事中满篇的第一人称“我”,以及被代表的“我们”,主体性就会自我呈现呢?恐怕又不是。要想很好地关照主体性,可能恰好需要时时将主体客体化,同时尝试将“他者”主体化。第四,其中是否符合叙事研究“有道理,有冲突”的特点?[44]貌似没有,这个探究过程虽然不易,但很“和谐”,也少道理。不过细想就会发现,更大的“冲突”不在情节之中,而是被当作背景而“后置”了:这里有非常时期当面授业与隔空教学之间的冲突,亦有传统学问与现代技术之间的张力。第五,时局如此,经由互联网连接的人类活动,能否撑起教育学意义上的“行动研究”或形成社会学/人类学意义上的“田野”?我没有研究,只能提问,不能回答。当然,如果答案是肯定的,我们会开心很多:原来疫情期间天天家里蹲,都是在做fieldtrip(野外考察)!关于“理论”,不可说。故事讲到这里,才第一次出现这个词,而且它也只会出现在这一段中。对于“理论生产”,我们时常不无焦虑地强调“特色”,高谈“建构”。透过这些“大词”就能感受得到,真正的理论离我们有多遥远!写到这里,脑中自然想起经典游戏《红色警戒》(RedAlert)中的那句“construction