语言与加密

二战时期的密码学发展到了一个空前的程度。一方面,德军使用的多替换(多码)恩尼格码密码在海陆军作战中广泛使用;另一方面,盟军的破译密码专家阿兰·图灵(英)与信息论之父克劳德·香农(美)则在密码学的两端做着不同的工作,试图得到完美密码的破解与证明并用于实践。

简单的加密也就是替换,但由于拉丁语系语言的冗余特点,很容易被语言中的模式匹配。在香农看来,模式就等同于冗余,并且他大胆预测:英语的冗余度是百分之五十。后来证明这一推断的科学性非常之高之接近。

拿开那些艰深的数学论据和公式推导,在数学科学日益发展中我们发现,纯粹(传统)语言学在解决一些语言编码问题和一些大规模的论断中已经越来越力不从心了。在数学家们一天天的唱衰中,语言学逐渐在退到时代的幕后,“伺机而动”。

“语言学在这些前沿的方向不是没有用”,这样的论点很多,但缺乏有力的支持。J·J·托尔金在《指环王》中创造了精灵族、霍比特人以及矮人族在内的数种不同的语言,当然他本人在语言学方面的造诣登峰造极,而这可能正是一种相对“反抗”统计学和数学破译的加密方法——通过系统的构造,在纯语言的角度创造新的语言去加密,这样的密文相对于那些“已证明”的无法破解的繁复密码可能更符合人类的学习习惯。想象一下,如果MI6和克格勃早先就开始研究自己的几种语言,如果德军使用几种不是“德语”的德语,再如果丘吉尔和罗斯福没有依靠香农的信息论而是跟着托尔金的咕噜姆“咕噜咕噜”的交谈,二战的结局可能还未可知。当然这只是想象。相对于机械化来说,人的能动性恐怕还没有达到这个程度,有朝一日兵临城下,这些也恐怕来不及了。方言也可能是一个方向。民国时期的语言学大家赵元任,精通数十种方言土语,游历世界到哪里都被认为是“老乡”,如果将方言的某些特殊化的表达方式与密码相糅合,也许会有奇效吧。也有一些将数学统计与语言特点结合的案例。小说《暗算》的瞎子阿炳,一方面用统计学模式来判断敌人,另一方面用语言学的法则来定义密文,但他的得天独厚,仅仅是没有视觉导致的听觉感知灵敏;然而,一切总是有规律可循,不管是语法,还是模式,有特例,而这些特定领域的瑕疵在大环境下几乎影响不到正常的交流。所以我们说信息学是极其伟大的战争科学,当然也不只是战争科学。

J·J·托尔金的语言自然有其语法,但可以确认的是它仍然比那些多码密码更难以破解,或者说,就是翻译。打乱的模式之间共通的可能性已经很小,再加上不明确的表示方式,使得单独自成语言的密码“熵”更高。“信息是不确定性,是出人意料,是困难程度,是熵”。由于人类记忆的特点,人类需要不停反复的去那些他们赖以生存的事情,直到他们的潜意识接收这些重复的信号并做出下意识的反应,这就是“熟能生巧”,这也是为什么“带有模式(语法语义)”的语言会成为人类的交流方式,这里也包括肢体语言和其他可能的通信,“万物皆比特”。那么,一种语言在长期发展使用的过程中,总可以用一些模式来表述,一方面是人们的使用与总结——人总是希望减少自己的工作量,希望对一切事物都找到一种“通性通法”;另一方面则是传播所导致的膨胀,由之衍生出的文化、贸易锁带来的“学习”的潮流,这结果是,语言的熵随着传播而下降,或者是那些不为人所揣摩的特点被逐渐挖掘了出来,而新语言则又总是艰深的,回想拿破仑从埃及带回的那块罗塞塔石碑,上面的象形文字虽然在数十年后被破译,但那无疑是一种极其伟大的“加密”方法,只是这并非当年埃及人的本意,而又正是由着这样的意义,这块石碑至今仍然是大英博物馆的镇馆之宝。

加密为了保证信息的安全,而从根源上讲,就是翻译,那么将明文变成密文实际上就是更换了一种表述的“语言”。无论是数字信号也好,模拟信号也好,还是肢体之间的沟通也罢,都是在传递信息,促进人类的进步发展。