动态图形界面(D-GUI)项目前景 | 投资方式 | 联系方式 | 我们的梦想 
米力
本页:参考文章

本项目信息查询

 
商业计划(摘要)
创新论坛
 
 
米力商务
中关村科技园区
北京产权交易所
清华校友
行胜于言
 
English Edition
 
 
 
 

项目图解   汉语的高信息墒优势— 谈谈象形文字与字母文字

作者:流波

     现 今世界上大多数国家使用字母文字,我国是使用象形表意文字从古至今的国家,溯本求源,字母文字的鼻祖还是象形文字。距今约5000年,古埃及人创造了一种 象形文字——圣书字。相比起来,圣书字还远远不及我国距今约6000年的西安半坡、临潼姜寨、宜昌杨家湾等古文化遗址的陶文字来得成熟。但它的特别意义在 于——原分布在我国伊犁河流域的闪族(赛种)因大月氏(我国古族)西进而被迫西迁到地中海沿岸,约于公元前15世纪,其中的一支腓尼基借这种象形文字创造 了历史上第一批字母文字,共22个,只有辅音,没有元音,这就是著名的腓尼基字母。腓尼基字母较早传入希腊,演变成希腊字母,希腊字母孳生了拉丁字母和斯 拉夫字母,成为欧洲各种字母的共同来源。腓尼基字母在西亚演化成阿拉米字母,成为亚洲许多文字的基础,如阿拉伯、印加、犹太字母等。公元4世纪后,阿拉伯 字母在亚洲广为流传。

    在人类有文字以来的大部分时间里,文字使用的基本轮廓是这样的:欧洲以拉丁字母和斯拉夫文字来建立各民族的文字语言体系;亚洲比较复杂,西亚以阿 拉伯字母为主,南亚受印加字母影响较大,中亚兼收并用斯拉夫、阿拉米、阿拉伯等字母,东亚广大地区如日本、朝鲜、韩国、越南等国家历史上曾经长期使用汉语 为其书面语;东非、北非的一部分受到阿拉伯字母的影响,非洲的大部,美洲、澳洲的广大地区,由于生长在这里的民族还相对处于落后状况之下,大多还只是一些 没有文字表述的土著语言。历史发展到人类近代前夕,一场血与火的文明在沉寂了近千年的欧洲大陆上酝酿着。在外,以中国四大发明为代表的东方科学技术在欧洲 得到了广泛的发展和应用;阿拉伯帝国在欧洲的最后堡垒彻底土崩瓦解,使欧洲人得以追踪阿拉伯人的退迹侵入非洲和印度沿岸;地理上因欧洲人急切需要冲破奥斯 曼土耳其帝国阻隔东西丝绸之路而寻求从海上通往中国之路,其结果是所谓美洲大陆的新发现。在内,随着思想解放的文艺复兴与宗教改革,生产力解放的资本主义 萌芽与工业革命,阶级解放的农民起义和资产阶级革命等一系列重大事件的发生发展,彻底摧毁了近千年来基督教、封建领主割据的黑暗桎梏,向着近代文明的曙光 迅跑。然而这种文明的进程是如此的野蛮和充满血腥:在非洲,广大的黑人被当做畜牲般贩卖与屠戳;在美洲,成千上万的印弟安人被驱赶枪杀,惨绝人寰;在印 度、东南亚,殖民者海盗似的掠夺俞演俞烈。正如马克思所说,“美洲金银产地的发现,土著居民被剿灭,被奴隶化,被埋于矿坑,正在开始的东印度的征服与劫 掠,非洲被转化为商业性黑人猎夺场所,都表示了资本主义产生时代的曙光。”(1)这样,美洲、非洲、澳洲或被占领或被殖民使用了殖民者的语言——拉丁字母 语言,如西班牙语、葡萄牙语、英语、法语等。南亚、东南亚一带原有本国文字语言或使用汉语的国家也纷盲引进了殖民语言。清楚了近代这场血与火的殖民史,我 们对拉丁字母语言在今天分布如此之众之广就不会迷惑不解了。

     字母文字与象形文字比较起 来,各自的特点是显而易见的。字母文字的一个显著的历史特性就是不断演生出新的文字语言。以腓尼基字母为源头,形成了拉丁、阿拉伯、斯拉夫等几种主要字 母,又以这几种字母为基础,各自产生了几种或十几种字母文字。这一方面给当时历史条件下还没有文字语言的国家民族提供了创立文字语言的方便;但另一方面, 由于字母文字表意的疆硬性,所造文字与人类自身发展的轨迹毫无关联,也就必然失去了文字表言达意的丰富内涵,这是字母文字天生的弱点。

     人 类历史上最古老的三种文字,即华夏汉字、古埃及圣书字、两河流域楔形文字,都是象形文字。后两种文字虽然夭折得很早,却留下了字母文字。唯有华夏汉字,经 数千年演变发展,到甲骨文阶段,已日臻完善,初具“六书”之功,即象形、指示、会意、形声、转注、假借。这就使得汉字或神形,如“牛”、“羊”,视字如见 物;或可意,如刀口上加一点为“刃”,或比合现意,如双“木”为“林”,三“木”为“森”;或意音相辅、形声相成,如“河”,取水之意,读“可”之音;或 建类一首同意相授,如“老”、“考”,部首同属,互转注释,才有了“先考”、“寿考”之词;或依声托事,假借引申,如“果”,像果之在木上,引托成副 词,“如果”、果然“等是也......汉字的内涵与外延是如此之深之广之蓄,使汉语与用几十个字母符号机械地与事物毫无内在联系地进行字母组合所形成的 语言文字相比,岂止迥乎不同,实有天壤之别。读先秦散文、汉赋、唐诗、宋词、元曲,之所以如吮仙露,似饮琼浆,除了汉字形、声、义兼备之外,还与汉字的洗 炼、准确、生动、明快、博采、典雅有关。这也是汉字具有历史的永恒的生命力的内在源泉。日本历史上借汉字的楷书、草书偏旁创造了日本文字,且近代的拉丁化 也近200年,但至今仍要使用很大一部分常用汉字;南朝鲜文字也使用一定数量的汉字,这都是真正感悟到了汉字不朽真谛的明智体现。

     字 母文字的另一个显著特点就是表音,所以也叫拼音文字。如果说字母文字在显意的内涵与外延两方面都先天性缺血的话,那么,它在表音方面却显示了其特性。因为 字母文字是用字母去表示语言中的音位、音节,去拼写语言中的字词等,所以,据字母组合(单词),大体可读出其字音来,反之,据字音拼读,可帮助写出其字母 组合来。仅管表音是字母文字的强项,但相比起汉字来又有许多逊色的地方。汉字经历史化、科学化、逻辑化演进而来,形声表意字达90%以上。围绕汉字的表音 研究,中国的音韵学高度发展,魏之《声类》、隋之《切韵》、唐之《唐韵》、宋之《广韵》、《集韵》等,无不闪烁着中华民族智慧的火花。汉字的单音性、词组 性、平仄的运应,双声叠韵的发展,汉语自然而然地产生了音韵之美,对仗之工,使其形成的文章读来如歌,吟之似曲,美妙无穷。

     汉 字优于字母文字的地方太多太多,如汉字饱满社会性、蓄含哲理,字母文字则呆板刻意;汉字经人类考验的历史最长,只需近6000个字左右就能表达清自然界、 人类社会的方方面面,且创造新词以适应新的发展随意入时,词汇无穷无尽,西文则动辄须用几十万个字母组合(单字)才能表述,且创造新词生硬不易;汉字简 约,表达同样的内容,汉文简洁精短,西文繁杂冗长;汉字结构优美大方,其书法自古至今成为人类历史长河中的艺术奇葩......之所以汉字与字母文字有着 如此大的差别,归根结蒂到一点,就是因为汉字源于自然、源于社会,经人类历史长河大浪滔沙成理顺章而成,是高度科学化、逻辑化、理性化、社会化的“活质” 文字;字母文字则因由字母符号进行”游戏”组合而成,完全割断了文字与自然、社会、历史的内在必然联系,随着文字的发展,虽然也有了字根、字首、字尾,历 史上也不断通过字母的细微变化衍生出新的文字来(这实际上很不利于人类的民族融合与进步),却永远也改变不了其毫无生机缺少理性的刻板的内在实质,是一种 “死质”文字。这就是这两者的本质区别。

     但伟大文字同样逃脱不了近代历史阴霾的笼罩, 西方殖民者、欧洲中心论者蓄意诋毁贬曲汉字;国内的一些人们也对自己如此通体灵光的文字缺乏的了解而盲目怀疑起来,几十年来主张汉字拉丁化者大有人在。而 当全球电脑化浪潮袭来之时,也一度产生过汉字电脑化的危机。然汉字又一次显示了其“活质”的神奇性,汉字不但电脑化得很成功,且其输入速度在有的方式中还 超过了西文。该是我们又一次认真审视自己伟大文字的时刻到了。这也是中华民族在人类历史长河中走了几千年强盛而今已彻底洗刷了近代以来因落伍惨遭蹂躏的种 种耻辱又将昂首迈入二十一世纪重振中华雄风所必须的重要文化因素之一。

        ▲本站批注:现在已经出现的能够快速输入汉字的各类输入法基本解决了提高汉字输入效率的问题,但是还没有解决兼顾效率和易用性的问题。“动态图形界面(D-GUI)”同时具备高效率输入和简单易用的优越特点而体现其价值。

     

 
  
 

项目图解   汉语的“信息熵”劣势   作者:张飞利

   有人为汉字信息量大而骄傲,殊不知它使得中文信息管理和传递的成本增加,困难加大。
美国的信息产业能有今天的称雄世界的实力,能接连不断地产生新的技术产品,是跟坚实的基础建设分不开的。这个基础建设的基本依据,是信息科学技术的 基本原理和方法:信息熵(ENTROPY)。第二次世界大战期间,美国为了提高信息储存和传递的效率,发明了多种新的编码方法,奠定了现代信息科学技术的 基础。战争结束后,这些方法得到了飞跃发展。在这些方法当中,科学家山农和霍夫曼提出的信息熵和数据压缩的理论和方法最能代表现代信息学的基本概念。个人 电脑和BBS问世以后,信息熵和数据压缩技术迅速普及。现在,这种技术已经成为电脑和联网必不可少的组成部份。信息熵的基本目的,是找出某种符号系统的信 息量和多余度之间的关系,以便能用最小的成本和消耗来实现最高效率的数据储存、管理和传递。
五十年代,现代信息论介绍到中国;七十年代,我国科学家完成了中文汉字字符信息熵的初步计算工作;八十年代又做了更完整的计算。他们的基本方法是: 逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。通过数理语言学中著名的齐普夫定律 (ZIPF’SLAW)核算,我国科学家指出,汉字的容量极限是12366个汉字,汉字静态平均信息熵的值 (平均信息量)是9.65比特。这是当今世界上信息量最大的文字符号系统。下面是联合国五种工作语言文字的信息熵比较:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大, 因而,在信息管理和传递的时候,中文处于最不利的地位。

   随着电脑的速度、储存和兼容能力等各方面的提高,中文信息管理和传递的困难是否会自动得到解决呢?不一定。例如,即便我们用四个字节来作国际标准字 符集(国际标准组织已经多次提出这个方案),使每个汉字有足够的比特剩余来作奇偶检验和特性参数,让所有的电脑和操作系统都能使用,然而,数据全面管理和 传递的效率问题依然存在。原因是:
(一)中文数据的文字方式决定了标准的多重性和规模过大,而且,只要汉字还再增加,它的字符集就是不稳定的。不管一个字符用多少字节,也不管电脑的 储存容量有多大,也不管各种系统的兼容有多么全面,这样的字符集做数据储存和检索还可以,做全面的数据管理就总是有严重问题。
(二)不管用什么中文输入方法,汉字输入输出的字符仍然需要多次转换,还是高成本和高消耗的。现有的中文输入方法跟语言文字的标准规范之间的差别依 然存在,人的操作和学习等效率还是没有得到提高。电笔和声音输入是重要的技术,但是,这些技术突破并不能取代键盘输入,更不能解决中文的效率问题。
(三)拼音文字的每个字符只要一个字节,现在用两个字节的联 码(UNICODE),已经有一个字节是多余的,在做数据处理和传递的时候,为此多支出了一倍的成本(包括处理多余字节的程序消耗)。这 些多余成本基本是为了迁就中文等亚洲文字的需要。如果用四个字节,就有三个字节是多余的,使用拼音文字就要多支出三倍的成本。将来, 各方面的发展能否抵消这些多余成本,还不清楚。拼音文字的母语国家是否乐意为了中国汉字的需要而继续牺牲自己的利益来年复一年地支出更多和毫无回收可能的 成本,也不清楚。
(四)通讯传递中,汉字字符由双字节变成了四字节,使原来的成本和消耗增加了一倍,平衡或抵消了字节增加和速度提高所带来的效益。
中文效率的根本问题不是出在电脑方面,而是出在汉字方式本身。因而,不管用不用电脑,也不管电脑技术怎么发展,中文的低效率问题依然存在。再说,电 脑技术发展,所有的语言文字都得益,相比之下,原来高效率的文字方式的效率仍然是高效率的,汉字方式仍然处于不利地位。

   可以看出,汉字信息量大,是中文信息管理和传递成本高、消耗大和效率低的基本原因。汉字为中国文明的延续发展发挥了巨大的历史作用。今天,汉字方式 是阻碍中文信息科学技术发展的头号困难因素。中国可以在信息工业的机械设计和制作方面赶上世界先进水平, 然而,如果不能摆正和改善中文的信息熵和多余度之间的关系,那么,中国的信息产业的整体就总是低效率的,就总得跟着别人后面走,难免挨打。一些美国人担心 中国发展电脑和导弹技术会造成“中国威 胁”,那的确是夸张了。即便把美国所有的电脑技术和导弹技术都交给中国,只要中国还是按照汉字方式来操作,那么,在电脑和导 弹技术方面,中国就总是处于不利地位。中国火箭导弹技术专家钱学森等人早就说过:如何提高中文效率是关系到国家安全的战略大事。
许多从事中文信息熵研究的科学家们说:中国失去了整整一个打字机时代(工业革命),对中国的综合国力建设带来了不利条件。在电脑信息时代,汉字方式 和现代科学技术矛盾更加深化了,其中最大的问题是如何利用信息熵的原理和方法来优化中文数据的管理和传递,其中包括文字方式和书写工具(例如电脑)的最优 结合。这是中国科学家近30年之久的中文信息论研究的经验,其中有些科研成果受到了国际科学界的承认和高度重视。面对日益强盛的信息时代的挑战,中国科学 家是有充分准备的。如果中国能按照原来准备好了的方向发展,那么,中国的信息产业(包括软件产业)就会避免许多弯路,微软公司对中国软件市场的误导作用也 不会那么严重。
然而,这些年来,中国有些报刊杂志望文生义,以为“汉字信息量大”是好事情,把它作为鼓吹“汉字文化”和“汉字优越”论的依据,甚至把这些违背科学 技术基本原理的东西贴上爱国主义的标签。这种作法极大地误导了人们对信息科学技术的理解。微软公司最关心的是中国市场的利润,而不是中文信息科学技术的前 途。“汉字优越”论鼓动人们不要去过问中文信息产业发展的基础科学技术问题。
信息科学技术跟语言文字息息相关,它的发展对许多国家的传统文化提出了挑战,包括对美国一类信息工业大国的挑战。中国的历史 悠长,文字方式独特,自然就受到最严峻的挑战。面对科学技术的挑战,就要用科学技术的发展来迎战。用极端民族主义的作法回应挑战,最后总是失败,传统文化 最后也还是保不住。
中国政府可以通过法律、标准和专利等手段来为中文软件和中文信息产业的发展提供环境保护。然而,“发展才是硬道理”。中文软件和中文信息产业到底能 不能在日益全球化的竞争中幸存,最后还得看自己的基础建设搞得怎么样。就目前和将来的状况来说,中文信息产业基础建设的中心课题,就是要利用信息熵的基本 原理和方法来提高中文的效率。

    ▲本站批注:使用西方人发明并为西方人服务的键盘当然难以体现汉字的优势来。“动态图形界面(D-GUI)”的出现相信会改变该文作者的观点。

 
 
国家发明专利,清华大学创业大赛优胜奖,北京产权交易所推荐项目
动态图形界面(D-GUI),PC新时代!
您能想象在屏幕上弹钢琴吗?
 
 

移动终端制高点,动态图形界面;
信息交互超快捷,徒手操作简便;
万物互联好潇洒,一切从容展现。

动态图形界面(D-GUI),创新引领未来。。。