如何找到一个词或一句话的最早出处?

如何找到一个词或一句话的最早出处?如果是西方某种语言的词,一般能在词源词典很快找到答案,其中最好用的词典无疑是Wiktionary.org。如果是中文词,首先应该检查是否已有学者对此做过研究,Wiktionary给出中文词词源的可能性不大,但因为方便也不妨查一下。以下讨论没有词典可查,甚至没有前人研究的情况,该方法也可用于质疑或核实、补充已有的研究。

以“才高八斗”为例。据百度百科:
“南朝·宋·无名氏《释常谈·斗之才》:文章多,谓之八斗之才”
“《南史·谢灵运传》:‘天下才共一石,曹子建独得八斗,我得一斗,自古及今共分一斗。’”
赵所生先生查阅《南史》后得出结论:“《南史》并无此言”。

那么,这个说法的最早出处如何得知?假如你的个人文库——无论在网上还是桌上电脑里——有全部古籍,你当然可以整个搜一遍。但我们可以用一个简单得多的方法:搜某一家古籍网站。有些人用“国学大师”(guoxuedashi.net),有人用“国学网”(guoxue.com)、Wikisource等等。但我最喜欢“中國哲學書電子化計劃”Ctext.org,这个网站于2006年由英国Durham大学计算机教授Donald Sturgeon创建,古籍远远不限于哲学书,主要的好处是典籍搜集相当完备[注1]。你可以用网站本身的搜索,但我更偏爱Google,比如用如下关键词:
才高八斗 site:ctext.org
很多网站包括百度都接受site标签,它将搜索范围限定在它指定的网站或网址内。由于Ctext.org基本只有古籍[注2],搜索结果基本都是古籍。随后你就将搜索结果两两相比,每次比较留下写作日期更早的,如此,我找到金·王若虚《滹南遺老集卷之三十二雜辨》“謝靈運甞謂天下才共一石,子建独得八斗”,这句话是这个意思的最早文献出处,后有宋《翰苑新书别集》,明尤其清时出现得很多。

那么,假如是现代的词或语句呢?以“妇女能顶半边天”为例。首先搜到2017年一篇网络文章《“妇女能顶半边天”爆红美国 这句话是谁说的?》和钟雪萍的文章《‘妇女能顶半边天’一个有四种说法的故事》,后者指出“20世纪60年代才出现”,但两者都没能给出原出处。你可以用Google或百度的限定时间的网页搜索,但这样做的结果仍然将“最早”出处定在1990年代,毕竟互联网是那个年代才出现的。此时就需要用到Google图书,搜索结果可按出版时间排序,最后得知1963年中国电影出版社《李双双:从小说到电影》中出现这句话。但这还不能肯定是最早出现,详见我的短文关于“妇女能顶半边天”

_____________________
[注1] 网站的缺点是典籍都用OCR识别文字,对字迹模糊的文献识别率就比较低。
[注2] Ctext目前有很少一点读者讨论,所以干扰很小。希望今后也不会有太多读者讨论,或讨论所在的URL很好识别以便排除(用减号),但假如网站的读者讨论数量足够大并且不易在搜索时排除,用普通搜索网站如Google、百度加site标签就会很不方便。Ctext全网站几乎只有汉语古籍这一点很独特,我曾想用类似方法搜出(传说)拿破仑“中国是睡狮”一说的最早出处,到法语论坛问是否有类似Ctext的、只有或绝大部分是法文前现代文献的网站,没有人给出满意的答复。

2021年4月

Contact me
To my CNNotes Page