破解早已消亡的语言的关键

来自世界上一些最古老文明的泥板上记载着数千年前的生活细节,但今天很少有人能读懂它们。新技术正在帮助它们解锁。

在大英博物馆(BritishMuseum)柔和的灯光下,人们只能勉强看到镌刻在这些古老泥板上的密密的楔形印记。这些微小的符号是世界上最古老的书写系统——楔形文字——的遗迹。

楔形文字起源于多年前的美索不达米亚,位于底格里斯河和幼发拉底河之间,也就是现在的伊拉克所在的地方。在这个复杂而迷人的文明中,楔形文字捕捉了生命长达年之久。从互相争斗的王室兄弟姐妹之间愤怒的信件,到安抚一个脾气暴躁的婴儿的仪式,这些泥板提供了一种独特的视角,让人们了解一个历史之初的社会。

它们记录了阿卡德、亚述和巴比伦帝国的兴衰,这是世界上第一个帝国。据估计,其中50万人已经被挖掘出来,还有更多的人被埋在地下。然而,自从约年前学者首次破译楔形文字以来,该文字的秘密只透露给了一小部分能读懂它的人。约90%的楔形文字仍未翻译。

多亏了一个非常现代的帮手:机器翻译,这种情况可能会改变。

“美索不达米亚对我们自己文化的影响是人们不太了解的,”多伦多大学亚述学研究员艾米丽·佩奇-佩龙(EmiliePage-Perron)说。美索不达米亚给了我们车轮,天文学,60分钟小时,地图,洪水和方舟的故事,以及第一部文学作品,吉尔伽美什史诗。但它的文本主要是用苏美尔语和阿卡德语写成的,这些语言很少有学者能读懂。

佩奇-佩龙正在协调一个项目,对公元前21世纪以来份美索不达米亚行政记录进行机器翻译。其中一个目的是为新的研究打开过去的秘密。

佩奇-佩龙说:“我们有关于美索不达米亚人生活的许多不同方面的信息,我们不能真正从不同领域的人的专业知识中获利,如经济或政治,如果他们有渠道,可以帮助我们更好地了解那些社会。”

除了泥板之外,还有5万多枚美索不达米亚雕刻印章散落在世界各地。几千年来,美索不达米亚人使用由雕刻石头制成的印章,这些印章被压入潮湿的粘土中,用来标记门、罐子、泥板和其他物品。这些书中只有10%被编入目录,更不用说翻译了。

牛津大学亚述学教授雅各布达尔(JacobDahl)表示:“我们从美索不达米亚获得的资料比从希腊、罗马和古埃及获得的资料加起来还要多。”挑战在于找到足够多的人来阅读它们。

佩奇-佩龙和她的团队正在对一个数字化数据库中的个古代行政文本样本进行算法培训。每个记录交易或交付羊,芦苇束或啤酒到寺庙或个人。这些文字最初是用芦苇笔刻在粘土上的,现在的学者已经把它们音译成了我们的字母表。例如,苏美尔语中的big一词可以写成楔形文字,也可以写成我们的字母表中的gal。

这些行政文书的措辞很简单:例如,“第15天厨房有11只保姆山羊”。这使得它们特别适合于自动化。一旦这些算法学会了将样本文本翻译成英语,它们就会自动翻译其他经过音译的泥板。

佩奇-佩龙表示:“我们正在研究的文本不是很有趣,但如果你把它们当作一组文本来看,它们就非常有趣。”他预计英文版将在明年内上线。这些记录向我们展示了古代美索不达米亚人的日常生活,权力结构和贸易网络,但也展示了其社会历史的其他方面,如女工的角色。可搜索的翻译将使来自其他地区的研究人员能够探索古代生活的这些丰富方面。

理解美索不达米亚是理解人类意义的一种方式

佩奇-佩龙解释说:“这些人与我们是如此不同,如此遥远,但同时他们也有同样的基本问题。”“理解美索不达米亚是理解作为人类的意义的一种方式。”

她希望机器分析也能阐明苏美尔人的某些特征,这些特征至今仍困扰着现代学术界。这种已经灭绝的语言与任何现代语言都没有关系,而是保存在以楔形文字书写的碑文中。这可能是我们与更古老、更没有记录的社会之间最后的联系。

“苏美尔语可能是数千年前的一大语系中最后一个成员,”欧文·芬克尔(IrvingFinkel)说。“文字出现在这个世界上正好是为了拯救苏美尔人……我们很幸运,在它和其他文字一起消失之前,我们有一些‘麦克风’把它捡了起来。”

芬克尔是世界上顶尖的楔形文字专家之一。在他大英博物馆堆满书的办公室里,他解释了由于多语种的关于一位国王的题词,手稿是如何被慢慢破译的,就像帮助研究人员理解埃及象形文字的罗塞塔石碑(RosettaStone)一样。

他说:“事实上,当你在几千年的时间里发现人类的思维时,你会惊讶地发现,这是多么有趣的一件事,就像和他们通过电话交谈一样。”“当你遇到这些人的时候,这是世界上最令人兴奋的事情。”

古老的访问

我们很少有人会把有年历史的泥板放在手里。但多亏了先进的成像技术,现在任何人只要能上网就能接触到宝藏,比如世界上现存最古老的皇家图书馆,它正在被数字化。它是由亚述国王阿什巴尼帕尔(Ashurbanipal)在尼尼微(Nineveh)建造的。作为阿什班帕尔专题展览的一部分,大英博物馆展出了一些他的藏书中幸存下来的碑文。虽然尼尼微在公元前年被洗劫时被火烤黑变硬,但他们所携带的文字仍可阅读。

新的成像技术使得处理这些古老的、经常被损坏的文本变得更加容易。有了非常详细的图像,就有可能找出那些肉眼看不见的模糊标记。

达尔和他的同事一直在德黑兰、巴黎和牛津为一个名为“楔形文字数字图书馆倡议”(CuneiformDigitalLibraryInitiative)的项目对储存在馆藏中的泥板和印章进行数字化。这个庞大的在线数据库已经包含了世界上约三分之一的楔形文字,以及一些未被破译的书面语言,如古伊朗的原始埃兰语。如果没有这样庞大的数字资源,培训机器翻译甚至是不可能的。

数字化也在帮助研究人员把分散在世界各地的文本联系起来。达尔与南安普敦大学和巴黎南特雷大学的研究人员一起,对来自美索不达米亚的大约枚石印的3D图像进行了数字化处理。在一个试点项目中,他们使用人工智能算法检查了一组六种泥板,并识别出世界其他地方发现的与之匹配的印记。算法正确地选择了当前存储在意大利的泥板和存储在美国的泥板;这两个都盖有相同的印章。

在过去,匹配印章和印痕是出了名的困难,因为许多印章和印痕相隔数千英里。达尔估计所有的印章都可以在五年内数字化,这样就可以追踪到其他图案。例如,有一些迹象表明,某些类型的石头受到女性的青睐。

达尔说:“这类问题你无法回答,除非你有大量的印章图像,就像我们正在做的那样,并应用了算法或机器学习等技术。”他希望随着人工智能的发展,它将帮助我们解开世界各地收集的丰富信息的全部潜力。

“我希望亚述学走在这方面的前沿。亚述学涵盖了人类历史的一半,是一种濒临灭绝的文化遗产。”

破解密码

影像技术也将研究转变为未破译的文字。在这种类型的破译中,人类往往比机器做得更好,通常需要少量的文字、创造性的思维跳跃,以及对人类如何生活和组织自己的理解。它还涉及到很大的智力灵活性。

例如,早期楔形文字的符号甚至不是排列在线性文本中,而是简单地与画在它们周围的方框放在一起。原始埃兰语是三维的:一个圆的浅层印象与深层印象有着不同的含义。然而,技术通过提供可以放大、分享和比较的详细图片,帮助了破译过程。

“关键问题首先是要得到合适的图像,”达尔说,他正在破译这个神秘的剧本。“这是前年研究原始埃兰人所缺乏的。”

这些进步超越了亚述学领域。剑桥大学高级研究员菲利帕·斯蒂尔(PhilippaSteele)是研究古克里特和希腊早期文字系统的专家。其中包括“线形文字A”(一种未破译的文字)和“线形文字B”(一种古代希腊语的书写形式)。

多亏了以这些文字为特征的古代泥板拍摄复杂图像的技术,斯蒂尔发现了新的细节。她说:“你可以辨认出肉眼很难辨认的特征。”这些特征通常与撰写文档的人与文档交互的方式相对应。例如,对于线性B,你可以分辨出擦除。有时你可以判断出撰写这份文件的人是什么时候想出来了什么,然后又在上面写了什么。

佩奇-佩龙希望机器最终能够翻译更复杂的苏美尔语泥板和其他语言,比如阿卡德语。她说:“关于古代文化,还有很多东西有待发现。”

也许有一天,我们将能够阅读我们所有的早期翻译文本——尽管美索不达米亚的许多谜语可能比我们活得更久,尤其是因为许多缺失的楔形文字碎片仍在地下,等待挖掘。

古代美索不达米亚的国王们深深地思考着过去和未来。他们崇敬前世的楔形文字,埋藏着特殊的铭文,上面记录着他们的名字和成就,并承诺会对后来的统治者给予奖励。在某些方面,他们的愿望实现了。他们的战斗和征服可能被大多数人遗忘。但是他们最强大的发明——书写——在过去的几千年里帮助人类发展了思想和技术——现在,训练机器从过去学习。




转载请注明:http://www.aierlanlan.com/cyrz/5015.html