1952年,18名学者聚首于MIT举办的第一届机器翻译“国际”会议,布斯是唯一的非美国籍代表。随后,大约40名语言学者参加了同年在伦敦召开的国际语言学大会(International Linguistics Congress)。一年后,“机器翻译”首次出现在由布斯伉俪编写的学术教材《自动数字计算器》(Automatic Digital Calculators)(Booth and Booth,1953)中。该书的目标读者是计算机科学家,其中的一章《计算机器的一些应用》(“Some applications of computing machines”)详细地讨论了“机器翻译”这本书重印了两次,分别是在1956年和1965年,后于1957年翻译为俄文。1954年,一场大力宣传的展示会在IBM总部举办。展示会精选49句俄语样句、由250个选自不同领域的俄语单词及其对应的英语所组成的词汇表,以及6条句法规则。IBM的新闻稿上写道:“一个完全不懂苏联人语言的小女孩在IBM的卡片上打出了俄语信息。机器的‘大脑’飞速运作,以每秒两行半的速度在一台自动打印机上给出了对应的英文翻译”。 同年,哈佛大学的安东尼·奥廷格(Anthony Oettinger, b.1929)发表了世界上第一篇有关“机器翻译”的博士论文(Oettinger, 1954),杂志《机器翻译》(Mechanical Translation)也首次登台亮相。
1955—1966年,领域内部以小组为单位进行划分,例如划分为主攻字典、词典和语义问题的小组和主攻句法问题的小组;采用实践研究法的小组(主要在英国)和采用理论研究法的小组(主要在美国);以及研究短期操作系统的小组和研究高质量长期操作系统的小组。这几年中,针对“机器翻译”开展了十几次重要的大会、聚会和研讨会,“机器翻译与计算语言学协会”(Association of Machine Translation and Computational Linguistics,AMTCL)也于1962年6月13日成立。除美国和英国外,保加利亚、加拿大、前捷克斯洛伐克、法国、以色列、日本、前苏联及后来成立的独立国家等都开展了相关研究。
虽然在1960年6月美国众议院科学和航天委员会编制的报告中,美国的资助机构已经对“机器翻译”之于“我国信息和科学领域的总体发展”的重要性表示了认可(Hutchins,1986, p.159),但6年后一家在资助机构的要求下成立的独立咨询委员会所给出的结论,给美国对“机器翻译”的研究经费资助画上了句号。1966年出版的声名狼藉的ALPAC自动语言处理咨询委员会。报告《语言和机器:翻译和语言学中的计算机》(Language and Machines: Computers in Translation and Linguistics)对自动翻译的需求、成本和表现进行了批判,甚至提议说:既然英语是科学领域中的优势语言,那么与提供翻译服务相比,让俄语文章的重度使用者学会俄语会更划算。报告在最终建议中列出,应该将资金用于开发人工译员的辅助机器和“计算语言学”来提高翻译质量,而这已经超出了“机器翻译”的范畴。ALPAC的报告终结了对完美翻译的研究,并将自己的理想归于乌托邦的范围。对宏观意义上的语言学,尤其是“计算语言学和人文计算”来说,这份报告改变了人们对未来的语言研究项目的思考角度,或者用维克多·英格维(Victor Yngve)的话来说就是:
“机器翻译”在人文数据的电子处理中参与度极高。早期有关“机器翻译”的文章中提到,对索引、频率列表和词形还原的使用必不可少。按照安东尼奥·扎姆波利(Antonio Zampolli, 1937—2003)的话说,这些都是“词汇文本分析”(Lexical Text Analysis, LTA)的典型产品(Zampolli, 1989)。针对这一点,在“机器翻译”的相关书籍中找到有关“文学研究中的计算机”的文章也就没什么奇怪的了(Booth,1967)。
迈克尔·列文森(Michael Levison)已经对20世纪50年代和60年代初,“机器翻译”和“词汇文本分析”学者间的合作进行了报告。1958年,他以博士生的身份加入了布斯的实验室。虽然布斯在当时的以人文学为基础的工作基本上都属于“机器翻译”领域,但20世纪50年代中期以后,人们对计算机在其他语言学中的应用产生了浓厚的兴趣(Booth et al.,1958)。20世纪60年代早期出现了文本、文体学和索引制作的统计分析项目(Levison,1962)。1967年,列文森在《文学研究中的计算机》(“The Computer in Literary Studies”)一文中,对可以成功应用计算机的文学问题进行了分类描述:索引、术语表、作者判断、文体研究、相关年表、莎草纸的碎片问题,甚至还有数字图书馆的雏形——磁带柜。“络绎不绝的拜访者”都来“寻求文学和语言学问题上的帮助”(Lessard and Levison,1998,p.262),他们频繁造访布斯的实验室,对上述文学问题进行研究,甚至有几位地质学家提议用模拟的方式研究是否可能对“波利尼西亚人漂流航行后的定居”作出解释(ibid)。
尽管布斯在这些项目取得成果前就离开了实验室,但毫无疑问是他的灵感和声誉促成了这些合作。甚至可能布斯的两位学生,莱昂纳多·布兰伍德(Leonard Brandwood)和乔治·克利夫(John Cleave)是首次将计算机应用于人文学科中非语言问题的博士生。布兰伍德主要研究柏拉图著作的年表和索引(Booth et al.,1958, pp.50-65),而克利夫则负责布莱叶点字法(Braille)的机械转录(ibid, 1958,pp.97-109)。
虽然布萨在与IBM的密切合作中运用到了穿孔技术,但约翰W.埃里森(John W. Ellison)也利用雷明顿·兰德公司(Remington Rand)所提供的计算设施,即磁带技术和通用自动计算机第一代大型计算机(UNIVersal Automatic Computer),完成了他的《修订标准版本圣经计算机索引》(Computerized Concordance to the Revised Standard Version of the Bible)。故事大概是这样的:大约在1954年,布萨遇见了埃里森, 向他在计算研究中取得的成果道贺,然后回到IBM将穿孔卡片都转移到了磁带上,并在1957年《死海古卷》(Dead Sea Scrolls)项目的出版中使用了计算机技术和编程。对整本《托马斯著作索引》,布萨(2004b,p.xvii)用了1 800卷磁带,每一卷长2 400尺,总长达到1 500千米。