“701实验室”的挂牌,如同在平静的湖面投入一颗巨石,不仅在轧钢厂内部激起层层涟漪,更在有限的知情圈子里引发了持续震动。专项经费和外汇额度迅速到位,来自部属院校和研究所的技术骨干也开始陆续报到。原本略显逼仄的“静思室”旁,又开辟出了两间更大的办公室,摆放着新添置的仪器设备和绘图板,空气中弥漫着新鲜油漆和电子组件混合的特殊气味。
实验室的人员结构瞬间复杂起来。除了谢明华的内核助手小张(张卫东),新来的成员里有来自清华的尖子生赵健,理论功底扎实,眼神里带着象牙塔出来的清高与锐气;有从中科院计算所调来的工程师老周,经验丰富,但思维略显保守;还有几个从其他工厂抽调来的技术好手,动手能力强,但系统性思维稍弱。
如何将这群背景各异、性格能力参差不齐的精英凝聚起来,形成合力,成为了谢明华面临的首要课题。他深知,单打独斗的时代已经过去,未来的征程需要的是一个高效、协同的团队。
他没有急于分配具体的开发任务,而是将“汉字编码方案”这个基础而又内核的议题,摆在了第一次全体技术讨论会的桌面上。
会议室内,烟雾缭绕(这个年代的技术人员,不少都有抽烟提神的习惯),气氛严肃。谢明华站在一块大黑板前,上面已经写下了几个关键问题:
1 现有内部编码的局限性。
2 目标:制定一套统一、规范、可扩展的实验室标准。
3 考虑与未来国家标准的兼容性。
“同志们,”谢明华开口,声音平稳而清淅,瞬间吸引了所有人的注意,“yh-dos 的成功,证明了中文信息处理的可行性。但我们现有的16位内部编码,是为了快速验证概念而设计的,存在字符集有限、排序规则不明确、与外部交换困难等诸多问题。在我们开始构建更复杂的应用之前,必须首先解决这个根基性的问题——我们需要一套更完善、更科学的汉字编码方案。”
他首先让张卫东介绍了现有编码的结构和使用中遇到的实际问题。接着,他抛出了引导性的问题:
“大家认为,一套理想的汉字编码方案,应该具备哪些特性?”
问题一出,下面立刻议论开来。
清华的赵健率先发言,语速很快,带着理论派的自信:“谢主任,我认为首要的是逻辑严谨和效率。编码应该尽可能紧凑,减少冗馀。可以借鉴信息论,根据汉字的使用频率来分配码位,高频字用短码,低频字用长码,这样可以最大化存储和传输效率。”他提到的“哈夫曼编码”等概念,让几位工厂来的技术员听得有些云里雾里。
计算所的老周扶了扶眼镜,持不同意见:“小赵的想法理论上很好,但实际应用太复杂。编码译码器设计起来麻烦,而且不利于人工识别和记忆。我认为,还是应该按照部首、笔画等汉字固有的属性进行分区、分层编码,就象字典的检字法一样,有规律可循,便于学习和使用。”他的观点代表了传统的、结构化的思路。
另一位来自工厂的技术员则更务实:“谢工,我觉得吧,还得考虑咱们现有的硬件条件。码位太长,字库就大,内存和存储都吃不消。能不能先保证最常用的两三千字够用,其他的慢慢再加?”
众人各抒己见,争论逐渐激烈起来。效率派、结构派、实用派……各自的观点都有其合理性,但也存在明显的局限性。谢明华耐心地听着,不时在黑板上记录下关键点,并没有急于表态。
他注意到,来自清华的赵健虽然理论水平高,但有些脱离实际,对硬件约束考虑不足;老周经验丰富,但思维定势较强,对更新、更高效的方法接受度不高;而其他几位则更关注眼下的实现难度。
这就是他想要的效果——让不同的思想进行碰撞。他不需要一言堂,而是需要经过充分辩论后形成的共识。
等到讨论的高潮稍稍平息,谢明华才用粉笔敲了敲黑板,将所有人的目光重新吸引过来。
“同志们说的都有道理。”他先肯定了大家的思考,“编码效率、结构规律、实现成本,这些都是我们必须权衡的关键因素。”
他走到黑板前,开始系统地梳理和总结:
“第一,关于字符集。我们的目标不能只局限于几千常用字。必须考虑到专业领域、古籍整理、人名地名等须求,编码空间必须留有足够的扩展馀地。我建议,初步目标复盖《现代汉语常用字表》及部分次常用字,约六千字左右,但编码体系要能支持数万字的扩展。”
“第二,关于编码结构。我倾向于采用‘分区管理’的思想。借鉴老周提到的结构规律性,但进行优化。我们可以将编码空间划分为几个大区:比如,01-09区留给字母、数字、符号;10-15区作为自定义区,用于图形符号或未来扩展;从16区开始,按部首或拼音顺序对汉字进行排列。这样,既保持了部分规律性,便于学习和检索,又避免了纯按频率编码带来的复杂性和不稳定性。”
他一边说,一边在黑板上画出了分区的示意图。这个思路,某种程度上借鉴了未来gb2312标准的雏形,但根据当前的技术条件和认知进行了调整。
“第三,关于具体实现。考虑到硬件限制和处理效率,采用双字节(16位)定长编码仍然是现阶段最现实的选择。相比于变长编码,定长编码处理起来更简单,速度更快。至于小赵提到的按频率优化,我们可以在字库存储和输入法词库设计时进行考虑,而不是在底层编码层面实现。”
谢明华的方案,巧妙地将效率、规律性和可实现性结合在一起,展现出了超越当前时代的前瞻性,又充分顾及了现实约束。
赵健若有所思地点点头,似乎意识到了自己之前想法的理想化。老周也微微颔首,觉得这个分区方案比完全无序的编码要合理得多。其他技术员也纷纷表示这个思路清淅,可行性强。
“这只是初步框架。”谢明华最后说道,“接下来,我们需要成立一个编码小组,由赵健同志牵头,老周同志协助,参考《新华字典》和相关的汉字研究资料,具体完成这六千多汉字的编码分配工作。。”
他直接点名分配任务,既发挥了赵健的理论优势,又用老周的经验来平衡,明确了目标和产出。
“是!谢主任!”赵健立刻应下,脸上带着被委以重任的兴奋。老周也点头领命。
第一次技术讨论会结束,虽然争论激烈,但方向已经明确。看着手下这群刚刚开始磨合的团队成员,带着任务和思考离开会议室,谢明华知道,这只是团队建设和技术长征的第一步。统一的编码方案,将是未来所有中文信息处理应用的基石,必须夯实打牢。而他,作为领路人,不仅要指明方向,更要善于集成力量,让每个人都能在合适的岗位上发挥出最大的光和热。