一次把一绺头发夹到耳后。
“但是什么?”
凯瑟琳叹了口气。“但是今天我得到的有关这个传奇的消息,是可靠的信息来源提供的,是真的。”
“嗯……”她这么含糊其辞地是要说些什么?
“我准备和我哥哥谈谈这事儿,但我突然想到,在这之前你也许能给我一些启发。我很想知道,这个传说能否从其他历史文献中得到确证?”
“所有的历史?”
凯瑟琳点点头。“世界上所有的历史,任何语言、任何时间段的历史。”
奇怪的要求,翠西想,可这肯定办得到。十年前,也许这是一项不可能的任务。但今天,在互联网和全球所有大图书馆和博物馆的在线数据帮助下,凯瑟琳的这一要求只需使用配有翻译模块的相对简单的搜索引擎,输入一些精心挑选的关键词就能办到。
“没问题。”翠西说。这个实验室的许多研究资料包含许多用古代文字书写的段落,翠西经常被要求编写一些特定的光学字符识别翻译模块,把那些晦涩的文字变成英语文本。她不得不成为世界上惟一使用古老的弗里斯兰语①『(Frisian),古代居住在荷兰北部的条顿人使用的语言。』、米克语②『(Maek),据东密歇根大学的语言学网页介绍,这是韩国东部极少数居民使用的一种口语,但有些专家怀疑这种语言的存在。』、阿卡得语③『(Akkadian),古代生活在美索不达米亚的闪米特人游牧部族阿卡得人的语言。』建立光学字符识别翻译模块的元系统专家。
这些模块会有助益,但要想建立一个有效的搜索蜘蛛④『(search spider),搜索引擎的一种自动程序。』,关键还在于选对关键词。具有独特xìng却又不能过度限制。
凯瑟琳似乎已经想到了翠西前面,在一张纸上匆匆写下一些可能的关键词。
写了几个后,她停顿一下,思索片刻后又写了一串。“好了。”她说着把那张纸递给翠西。
翠西接过那张搜索词表,眼睛猛地睁大了。凯瑟琳要调查的是什么疯狂的传说啊?“你要我搜索所有这些关键词条吗?”里面甚至有个翠西都不认识的词。
这是英语吗?“你真的认为我们在一个地方找齐全部东西?逐字逐字?”
“我想试一下。”
翠西本想说不可能。但这个单词在这儿是被禁用的。凯瑟琳认为,在一个会把预先设定的谬误变成确定的真理的领域里,这是一个危险的意识设定。翠西唐纳极为怀疑对这些关键词的搜索会落入那个范畴。
“需要多长时间?”凯瑟琳问。
“编写蜘蛛需要一两分钟,然后启动搜索。大概十五分钟后,蜘蛛就会抓得差不多了。”
“这么快?”觊瑟琳看上去颇受鼓舞。
翠西点点头。传统的搜索引擎通常需要一整天时间来爬梳整个在线世界,以找出新的文本,消化其内容,然后添加到可搜索的数据库里。但这不是翠西要编写的蜘蛛。
“我会编写一个名为代理者的程序。”翠西解释说,“这不是完整的程序,但用起来很快。原则上,就是命令别人的搜索引擎为我们的工作服务。大部分的数据库都有内部搜索功能图书馆、博物馆、大学、政府机构等等。我编写的蜘蛛会找到他们的搜索引擎,输入你的关键词,要求他们进行搜索。使用这种方式,我们可以驾驭成千上万的搜索引擎共同为我们工作。”
凯瑟琳对此深表赞赏。“程序并联。”
一种元系统。“发现了什么我会叫你的。”
“谢谢你,翠西。”凯瑟琳拍拍她的背,向门口走去。“我在图书室。”
翠西开始写程序。以她的水平,编写搜索蜘蛛实