汉字信息处理简介计算机直接对汉字信息进行输入输出和加工处理的技术
汉字字种繁多,字型复杂,汉字的信息处理与通用的字母数字类信息处理有很大差异,突出表现在汉字输入输出技术和汉字处理系统的软件方面
但是,汉字信息在信息结构、交换、信息加工等方面与西文信息加工又存在共性
因此,在汉字信息处理中多采用与西文信息处理兼容的途径,以便充分利用已取得的计算机信息处理技术 资源
同时,汉字信息处理还包括研究适合汉字特点的操作系统和汉字计算机语言
信息的加工和处理传统的二进制计算机所处理的字符数字类信息代码种类较少,一般一个字符的代码长度不超过7个二进制位,如ASCⅡ码、EBCD码等,它们代表的字符数不多于128~256个
而汉字字符种类多达数万
为利用传统的计算机技术处理汉字信息,将通用字符按一定规则组合,作为汉字的代码
最流行的作法是双字节代码表示法,如中国的汉字传输码国家标准(GB23121-80)和日本的国家标准(JIS6226)规定,均利用两个ASCⅡ码(不包括其中的控制码)表示一个汉字
因此,在汉字信息处理系统中,首要的问题是确定每个汉字同一组通用代码集合的对应关系
这样,在输入设备接收汉字信息后,即按对应关系将其转换为可由一般计算机处理的通用字符代码,然后再利用传统计算机的信息处理技术对这些代码信息的组合进行处理,如信息的比较、分类合并、检索、存储、传输和交换等
处理后的代码组合,再通过汉字输出设备,按照同样的对应关系转换为汉字字形库的相应序号,控制汉字输出设备将处理后的汉字信息直观地显示或打印出来
用于汉字信息加工处理的硬件与通用信息处理的计算机硬件类似或相同
其软件有对汉字信息进行处理的操作系统、汉字 BASIC语言、汉字FORTRAN语言、汉字COBOL语言、汉字文件系统和数据库,以及汉字的文本、字处理、通信传输、事务处理等
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。