統計原理破譯哈拉巴文字
遵循文字發展的自身規律、對照著另一種文字來解讀古文字稱為一種有效的方法,然而在對哈拉巴(Harappa)文字進行解讀的過程中,統計學的方法也起了很重要的作用。
在印度古文明的發祥之地曾發現一些類似文字的符號───哈拉巴文字。自發現以來便困擾著人們。上世紀80年代,考古學家和古文字學家開始了破解哈拉巴文字的征途。
令人不解的是,即使是在人類擁有了高度發達的密碼破譯技術和高性能電腦後,研究者對古人的區區二十幾個符號始終困惑不解。畢竟,學者們僅僅得到了印章上的銘文和陶器上的少量粗糙雕刻,資訊量實在太少。相關遺址總共只發現4000枚印章、印跡和陶器上殘破不全的銘文雕刻。而且現知的所有銘文中沒有一個超過21個符號,每段銘文的符號數通常只有五六個。
破譯這種文字的難點還在于它們是一種未知語言的未知文字,誰也弄不清它們與古代或現今何種語言文字的關係,也沒有一塊兩種文字對照的石碑作為破譯的參照,像埃及的羅塞塔石碑和伊朗的貝希斯頓石刻那樣。一開始,學者們試圖把哈拉巴文字與古代西亞的米諾文字、迦南文字、赫梯文字聯繫起來,但破譯工作進展還是極為有限。
好在哈拉巴文字旁邊有圖畫,而這些文字和圖畫之間vG有某種聯繫,這給了人們推演的線索。
早在上世紀30年代,英國學者罕特就著手收集哈拉巴文字。他確認了396個不同的哈拉巴符號,並逐漸增加至419個。這些符號在2290段銘文中出現了13376次。統計表明,其中有113個符號僅出現了1次,47個出現了2次,59個出現的次數少于5次。而只有約200個符號使用得較為廣泛,統計法給出了破譯的另一條思路。
這些發現說明:哈拉巴文既不是像梵文(印度的一種古文字)一樣的拼音文字,又不是像中文那樣的一字一音的象形文字的變體。哈拉巴文介乎兩者之間,有些符號是一字一詞一音的實體文字,有的符號卻只代表發音。
考慮到大部分文字體系中都有表示單數、複數、男性(陽性)、女性(陰性)的一些文字規則,還有一些對尊貴人物的稱謂,往往必須放在文章句子的開頭,學者們發現一些哈拉巴符號經常出現在句子的中部,而另一些則反覆出現在句子的開頭和結尾。而其閱讀順序是從右到左,這點與古代中文和阿拉伯文相同。
在這種思路下,古文字學家和考古學家在破譯哈拉巴銘文時使用了一種格柵法,它是基于統計原理來分析哈拉巴符號在句子里的前後順序,從中發現規則並最終破解了這種文字。
留言列表