- +1
歷代人物傳記資料庫的視覺化實(shí)驗(yàn):如何繪制中國的家譜樹?
中國家譜樹的繪制實(shí)驗(yàn)報(bào)告
——基于中國歷代人物傳記資料庫的視覺化實(shí)踐
The Drawing Experimental Report of Chinese Family Tree based on
the Visual Practice of Biographical Database of Chinese Dynasties
內(nèi)容摘要:
如果大量的家譜數(shù)據(jù)庫被公開,歷史研究者就可能利用歷史資料追根溯源——把相關(guān)的人物按照家庭關(guān)系連接起來,以獲得更悠長、更廣泛的家族族譜,并繪制出一棵家族大樹,讓我們獲得一張“尋根”的地圖。
本文描述了一個(gè)大型家族樹繪制的過程,在過程中發(fā)現(xiàn)了RT 算法的不適性,但這種不適性卻能夠幫助學(xué)者在觀察中快速發(fā)現(xiàn)歷史文獻(xiàn)中的問題,尤其是唐宋時(shí)期的“一子多父”現(xiàn)象。本文中的兩個(gè)案例,都為歷史研究提出了新的問題。
關(guān)鍵詞: 視覺化、可視化、家譜、家族樹、RT 算法
我們都曾經(jīng)問過“我從哪里來”, 這個(gè)“哪里”指從母親的子宮轉(zhuǎn)向到家庭、地方、地區(qū)、國家,時(shí)代、文化、基因等概念。家譜是我們尋根最直接的依據(jù),家族樹則是家譜中常見的一種信息呈現(xiàn)方式,它不僅可以表現(xiàn)家族的血緣關(guān)系,也象征著生命持續(xù)地繁衍發(fā)展。隨著視覺技術(shù)的發(fā)展以及越來越多的人口數(shù)據(jù)庫的開放,我們可以通過個(gè)人信息推斷出更多的家庭關(guān)系,并連接起比傳統(tǒng)家譜更縱深、更寬闊的樹形結(jié)構(gòu)。那么是否可以將開放的家譜數(shù)據(jù)繪制成為參天大樹?
一、相關(guān)項(xiàng)目
目前有許多商業(yè)開發(fā)的家譜軟件包、網(wǎng)站提供給個(gè)人去查詢自己的家族歷史, 例如:MacfamilyTree 軟件[1] 以及網(wǎng)站 w ww.archives.com,可以幫助擁有大型家譜的個(gè)人去觀察自己的家族結(jié)構(gòu)。但是這些家譜樹看起來一點(diǎn)都不像自然的樹形,甚至無法看清其中的支系關(guān)系。

“幾個(gè)世紀(jì)以來,家譜關(guān)系一直以手工繪制的幾十個(gè)人圖表的形式呈現(xiàn)。系譜軟件現(xiàn)在可以在技術(shù)上容納數(shù)十萬個(gè)個(gè)體的數(shù)據(jù)集。然而,沒有任何軟件能夠以一種清晰的方式將大型數(shù)據(jù)集視覺化”。[3]

可以說,研究者們還在尋找合適的家族樹形來展現(xiàn)大型家譜信息。那么我們是否可能運(yùn)用中國歷代人物信息發(fā)現(xiàn)大型的家族樹呢?發(fā)現(xiàn)之后,還能否看到不同家族樹的姿態(tài)差異呢?
二、中國歷代人物傳記資料視覺化實(shí)踐
我們采用中國歷代人物傳記資料庫( 以下簡稱:CBDB),它是由哈佛大學(xué)歷經(jīng)數(shù)年主持開發(fā)而成的,包含從傳記資料索引、史料、文學(xué)作品、官方文書等收錄的7 世紀(jì)至19 世紀(jì)的37 萬人的資料。[6] 但是,CBDB 并不是一個(gè)純粹或者現(xiàn)成的家譜數(shù)據(jù)庫,其中只有一部分人有家族關(guān)系記錄。
我們?cè)诩易V中檢查兩個(gè)人之間的家庭關(guān)系性質(zhì),例如檢查兩個(gè)人之間是否有共同的父親,從而確定兄弟關(guān)系;找到兄弟關(guān)系,從而確定他們共同的父親;找到多個(gè)人之間是否有共同的祖父,則可以確定他們是否是同一輩人。構(gòu)成一棵棵家譜樹形是我們的初衷,因此我們采用了RT 算法(Reingold-Tilford Algorithm),運(yùn)用Processing 程序?qū)⒚總€(gè)家族(按照姓氏)的個(gè)人轉(zhuǎn)化為節(jié)點(diǎn),節(jié)點(diǎn)之間相互用線連接,根據(jù)父子關(guān)系由下向上延展出層層分支,最終生成了幾個(gè)姓氏的視覺化家譜圖像。(圖3)


這些圖像都顯示出了人口總量的差異以及同一家族的信息在不同朝代的差異。例如,崔氏家族鼎盛于隋唐時(shí)代;李氏家族自唐代就是一個(gè)大型家族。整體來說,我們可以看到CDBD 數(shù)據(jù)庫中擁有的數(shù)據(jù)集中于唐、宋、明、清朝幾個(gè)歷史階段,朝代之間則有信息的空白。每一個(gè)姓氏并沒有形成一個(gè)整體的家族樹,而是一個(gè)個(gè)小的叢林。明代區(qū)域的一棵棵小家庭樹如同展開的雨傘,并不縱深,只有四五代人的信息;而唐宋之間有一些明顯的家族樹,其中橫陳了大量的雜亂連線,讓人無法看清。(圖4)

三、問題的梳理與新發(fā)現(xiàn)
當(dāng)我們以手工方式清理唐宋時(shí)期的雜線結(jié)構(gòu)時(shí)發(fā)現(xiàn),那些看起來雜亂的橫線大部分是由于“一子多父”的情況造成的。也就是說,RT 算法并不能滿足“一子多父”的關(guān)系,它是一個(gè)單向發(fā)展的、父親的位置總是處于子女中心的關(guān)系分布方式,而當(dāng)多個(gè)父親出現(xiàn)時(shí),這些父親只能被留在一個(gè)無法控制的位置與子女之間拉出一條不合理的長線。這些長線看起來是橫向的,實(shí)際上則應(yīng)該是縱向的,只是因?yàn)楦缸雨P(guān)系之間的層級(jí)高差不大,而RT 算法無法控制第二個(gè)父親與子女之間的橫向距離,因此彼此之間橫向距離較遠(yuǎn)的父子之間的連線就變成了亂線。這個(gè)亂線的現(xiàn)象在Jokbo 中同樣存在,但是作者并沒有對(duì)其進(jìn)行深度的解釋。
我們調(diào)整了RT 算法,并結(jié)合手工整理(縮小部分樹枝之間的分布距離),看到了王氏、張氏、李氏、崔氏及朱氏家族中所有的“一子多父”案例。(圖5)

存在“一子多父”現(xiàn)象的王氏大家族

存在“一子多父”現(xiàn)象的李氏大家族
那么是什么造成了這樣一種不可能的生物家族結(jié)構(gòu)呢?
根據(jù)個(gè)案的考察,我們發(fā)現(xiàn)“一子多父”的現(xiàn)象有多種情況。例如有的人完全嫁接于另一個(gè)家庭、多個(gè)父親的名字看起來相似、多個(gè)父親的名字完全一致。而兩個(gè)父親的現(xiàn)象更多出現(xiàn)在大家族的中段,或是小家族的根部。我們猜想有些原始文獻(xiàn)本身是錯(cuò)誤記錄的,某些家族關(guān)系則是人為嫁接的,而有些則是在歷史文獻(xiàn)抄錄、數(shù)據(jù)庫錄入中出現(xiàn)的,這些混亂的現(xiàn)象恰恰應(yīng)該是歷史信息的真實(shí)狀態(tài)。例如一個(gè)人的兩個(gè)父親都叫張植,這可能是因?yàn)檫@兩個(gè)張植在CDBD 數(shù)據(jù)庫中有不同的識(shí)別號(hào)碼。(圖6)

從繪制中國歷代家譜樹的目標(biāo)來說,RT 算法并不合適,它只適合于由下向上的分支結(jié)構(gòu),而我們的數(shù)據(jù)庫中存在向下分支的需要。因此,RT 算法好像增大了噪聲的音量,讓可能深埋于數(shù)據(jù)庫中的虛假、矛盾、錯(cuò)誤的信息變得明顯了起來,為歷史學(xué)研究激活了新的問題點(diǎn)。
四、實(shí)證研究案例
在“一子多父”的家族樹中,我們對(duì)其中一些特點(diǎn)突出的家族結(jié)構(gòu)進(jìn)行考證,嘗試?yán)梦墨I(xiàn)資料考察這些特點(diǎn)形成的原因。
1. 對(duì)王阮的攀附質(zhì)疑
在王氏的家族樹中,我們發(fā)現(xiàn)了王果家族的家族譜系中有一支明顯的嫁接支系。樹冠結(jié)構(gòu)中的王阮是南宋中興詩壇的重要詩人,與張孝祥、朱熹、周必大、范成大、 王質(zhì)、陸游等著名詩人交游甚密。根據(jù)《宋史》,其曾祖、祖父、父親都是有功之人,王阮本人對(duì)自己的祖輩倍感自豪,在詩詞中也經(jīng)常炫耀家世,例如《題東林一首》《 謝趙宰拜襄敏墓并留題二首》 都是表達(dá)對(duì)祖父的敬佩懷念之情。[7] 但是,王阮自豪的祖輩關(guān)系在家族樹中卻看起來是嫁接的。(圖7)嫁接點(diǎn)的人物是王阮的父親王彥博的兩個(gè)兒子:王龜齡和王松齡,從名字的構(gòu)成來看王阮與兄弟們無血緣關(guān)系。

王彥博的兩個(gè)父親也是值得探究的問題點(diǎn),CDBD 所搜錄的宋人傳記資料索引(電子版)中王彥博的父親是王丕,但王丕支系的祖輩并沒有顯赫的人物。雖然王阮在《雪山集序》 中記錄過其父王彥博因?yàn)榭拷貦u而被除名后死于貶所,但是擁有曾祖王韶對(duì)于王阮來說應(yīng)該是有利的,因?yàn)橥跎嘏c大文人蘇轍、王安石都有交情,而作為王韶曾孫的王阮,與南宋著名文人交往也是在身份上對(duì)等的。

因此,我們可以懷疑,王阮頌揚(yáng)祖父的詩文可能是刻意的自我身份表達(dá),而其祖父未必是王阮的祖父。王阮是宋代詩歌研究中經(jīng)常提及的人物,他也是歷史學(xué)者研究的對(duì)象,但是王阮家世中的疑點(diǎn)至今沒有學(xué)者提及,而是將王阮作品當(dāng)作可信的史料。將家族樹與史料對(duì)照之后,歷史學(xué)家可能對(duì)王阮其人、其作品會(huì)有新的解釋。
2. 對(duì)崔氏家族關(guān)系的考察
在“一子多父”的樹林中,有不少大型的家族樹,集中于隋唐時(shí)期,其中李氏的家族樹最為龐大,而崔氏則有不少的獨(dú)立家族樹,是什么原因造成了崔氏家族樹多且相對(duì)較大的現(xiàn)象呢?一方面,當(dāng)我們對(duì)比崔氏家族研究的文獻(xiàn)來觀察家
族樹時(shí),了解到崔氏家族確實(shí)是中國中古時(shí)期的世家大族,它有不同的支系,對(duì)于中國古代歷史研究有著重要的意義。
而至今可查的崔氏家族相關(guān)的研究都是以世系表格的形式呈現(xiàn)人物關(guān)系,并不能表達(dá)家族之間的宏觀關(guān)系。我們所繪制的家族樹沒有歷史文獻(xiàn)描述得那么長,卻將個(gè)體之間的關(guān)系明確地聯(lián)系了起來,呈現(xiàn)了與文獻(xiàn)描述所一致的一些支系結(jié)構(gòu)。例如鄭州崔氏的家族樹就非常獨(dú)立和清晰,具有比文獻(xiàn)更多的信息。

另一方面,某些家族樹通過人工比對(duì)合并之后,呈現(xiàn)了比文獻(xiàn)記載更清楚的家族結(jié)構(gòu)。例如,當(dāng)我們?cè)诩易鍢鋱D中合并了崔寅等三個(gè)同名同姓的祖父、父親和兒子的位置之后,兩只家族樹合為一棵大樹,這個(gè)結(jié)構(gòu)恰好應(yīng)對(duì)了《世系表二下》所描述的家族關(guān)系:“清河大房:逞少子諲,宋青、冀二州刺史。生靈和,宋員外散騎常侍。生后魏贈(zèng)清河太守宗伯。生休、寅。休號(hào)大房”“清河小房:寅字敬禮,后魏太子舍人,樂安郡守。……” 同時(shí),這個(gè)家族樹結(jié)構(gòu)充實(shí)了《世系表》記中所記載的家族支系中“房”的概念,例如“崔氏定著十房:一曰鄭州,二曰鄢陵, 三曰南祖,四曰清河大房,五曰清河小房,六曰清河青州房,七曰博陵安平房,八曰博陵大房,九曰博陵 第二房,十曰博陵第三房”[8]。文中所謂的“房”與“房”之間的邏輯關(guān)系并不清晰。家族樹的結(jié)構(gòu)表明,清河大房、清河小房共有一個(gè)六世祖父,應(yīng)算同一個(gè)支系,與青州房的開端也不是同時(shí)代。因此可以說,“崔氏十房”的房與房之間并不是同期形成的。也許這也正是為什么“不少學(xué)者在對(duì)崔氏家族進(jìn)行研究時(shí)就非常容易混淆這兩個(gè)支系的成員”[9] 的原因。(圖8)
以上兩個(gè)實(shí)證研究案例都揭示了尚未被研究者意識(shí)到的問題。我們認(rèn)為,這種將視覺化結(jié)構(gòu)圖與文獻(xiàn)對(duì)照的考察方法應(yīng)該是有效的、有需求的,它可以幫助學(xué)者更有效率地獲取信息,快速地發(fā)現(xiàn)歷史文獻(xiàn)中的矛盾點(diǎn),并對(duì)應(yīng)史料進(jìn)行進(jìn)一步考證。
總結(jié)
我們的實(shí)踐證實(shí),繪制整個(gè)中華民族的族系森林是尚不可能的事情,盡管這個(gè)初衷是符合邏輯的。原因在于:一方面歷史數(shù)據(jù)并不充分;另一方面,點(diǎn)線型的樹形結(jié)構(gòu)只適用于表現(xiàn)小型家族,并不適用于展示上千人大型家族脈絡(luò)和人物關(guān)系我們獲得了對(duì)于中國歷代人物家族關(guān)系的鳥瞰視野,發(fā)現(xiàn)了一些大型的家族,以及“一子多父”的普遍現(xiàn)象。“一子多父”的現(xiàn)象讓我們相信,真實(shí)的人類家族關(guān)系并不會(huì)如同自然的樹形一般生長,它的結(jié)構(gòu)可能兼具生物性與非生物性特征。
RT 算法雖然并不適用于繪制“一子多父”的家族樹,但是其不適應(yīng)性恰好可以讓研究者在家譜信息中快速發(fā)現(xiàn)問題點(diǎn)。這些家族樹看起來扭捏、機(jī)械,卻具有自然植物的方向性、層次感特征,恰如一個(gè)個(gè)盆景植物,糾合了人為和自然兩種力量,人為的干預(yù)也包括錯(cuò)、漏、虛、實(shí)。
注釋:
[1] https://www.syniumsoftware.com/macfamilytree
[2] Park, Jin Wan. “Information Aesthetics With Visual Genealogy Project.” Leonardo, vol. 44, no. 5, 2011, pp. 464–465. JSTOR, JSTOR, www.jstor.org/stable/41421782.
[3] A. Bezerianos, P. Dragicevic, J.-D. Fekete, J. Bae, B. Watson, "Geneaquilts: A system for exploring large genealogies", Visualization and Computer Graphics IEEE Transactions on, vol. 16, no. 6, pp. 1073-1081, Nov 2010.
[4] M. Ghoniem, J.-D. Fekete, and P. Castagliola. On the readability of graphs using node-link and matrix-based representations: a controlled experiment and statistical analysis. Information Visualization, 4(2):114– 135, 2005.
[5] M. Wattenberg, F. B. Viegas, "The Word Tree an interactive visual concordance", IEEE Transactions on Visualization and Computer Graphics, vol. 14, pp. 1221-1228, 2008.
[6] https://projects.iq.harvard.edu/chinesecbdb/home
[7] 王可喜:《南宋詩人王阮生平事跡考》[J],《長江學(xué)術(shù)》,2009年第2 期 ,137-144 頁。
[8] 、[9] 吳桂美:《東漢崔氏家族世系及地望的考辨》[J],《古籍整理研究學(xué)刊》,2007 年1 月,第81-88 頁。
該項(xiàng)目入選IEEE VIS 2018 (2018年國際可視化學(xué)會(huì)藝術(shù)單元項(xiàng)目)
入選名單:http://visap.net/program



后記: 這是我們少有地涉足中國歷史學(xué)數(shù)據(jù)的一次實(shí)驗(yàn)性創(chuàng)作,得到了來自社會(huì)科學(xué)、數(shù)字人文科學(xué)的各位的朋友的鼓勵(lì)和支持。 如有學(xué)術(shù)探討的興趣,歡迎聯(lián)系我們。
原文發(fā)表于《裝飾》雜志2018年11月期。
向帆 朱舜山
2018年11月29日于清華園
本文首發(fā)于微信公眾號(hào)“向帆”,稿件原標(biāo)題為《中國家譜樹的繪制實(shí)驗(yàn)報(bào)告》,澎湃新聞湃客頻道經(jīng)授權(quán)轉(zhuǎn)載,未經(jīng)允許禁止轉(zhuǎn)載。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司