红门提出WEB3.0 概念 并推出相应服务- -| 回首页 | 2005年索引 | - -

为什么互联网信息一定要标准化和结构化

关键词互联网                                          

信息标准化并结构化是社会发展的趋势,业内容易理解和接受的原因我归纳了3种,分别是:

A、使信息可以被正确识别
B
、使信息可以跨平台流通。
C
、方便程序的调用,使分门别类的程序能实现真正的模块化,并能完全组合。

 而我试图从另外一个层面来阐述信息标准化和结构化的必要性。

语言和文字只是传递信息的一个声音标准和文字标准,并不能视为信息的标准化,所以说,通过语言和文字的层面来标准信息,不属于信息的标准化,即使有一天出现了万国通用的语言和文字,甚至出现了可以自动对文章和句子进行翻译的软件,也不能说我们拥有了标准化的信息,只能说我们有了全球统一标准的文字和语言来表达信息。为什么很早就出现了翻译单词的软件,而能自动翻译文章的软件却迟迟没有开发出来呢?最根本的原因就是文章所携带的信息主体是很复杂的,是大量信息个体机构化存在的一个主体,并不是词语简单的垒加组合。不同语言环境下的单词词义都不是完全相同的,就是相同,在不同句子中出现所要表达的意思也会不一样。句子组合的不同,也会完全改变相同句子在不同文章中的意思。所以说文章中的词语和句子具有复杂的逻辑性和关联性,在没有对所要表达的信息标准化和结构化以前,很难出现能自动翻译文章的软件。

其实这一篇也可以说是第四篇“信息本质”篇的一个延续。我们已经阐明了,就象石油很早就存在地下了,但是直到近代随着生化、物理等学科的发展,人们才有能力开采,研究并利用石油更好的为人类造福一样,信息是早已经存在的一个主体,但是直到计算机和互联网出现以后,人类才有了一个可以研究和更好地使用信息的基础。而由于意识的惯性,我们虽然已经开始感觉到,资讯时代的来临必然会大大的改变这个世代,但同时,就象一个刚买了自行车不会骑,推着走的人一样,我们虽然已经有了计算机互联网络,但是还没有真正地利用起来。其关键是处理信息的方式并没有根本性的改变。忽略了信息的整体性、程序性和关联性。没有把信息标准化和结构化,这也是互联网存在安全、垃圾信息等各种各样问题的总根源。

一个信息值的变化受另外一种或几种信息的影响,。而一个信息值的变化,同时也会影响到其他相关信息值,这些变化都是同时产生的,并且具有十分复杂的联动关系。例如:你用银行卡购买了一个价值1000元钱的MP3同时:你的卡内资金数量减少了1000元、卖你MP3商家的销售额增加了1000元、这个厂家的产品市场占有率增加了一点数值、拥有MP3的总人数增加了1、整个世界上对电力的总需求量也会增加等等,还有数不清的信息值会发生改变。

现在各个系统虽然都在利用计算机网络建立自己的信息系统,但是都忽略了信息的整体性、关联性和程序性。10年前国家要统计具体一天全国所有办理结婚手续人数的总和,需要各个地方民政局统计好自己的数据层层再统计上报到国家汇总后才知道结果的,这一个过程至少需要数天时间。现在国家民政系统只要使用统一的在线软件。不用人工统计,就可以通过计算机和网络知道今天全国有多少人办理了结婚手续,具体各个省的分布、不同年龄阶段的分布也可以很清楚的知道了。因为网络解决了信息简单化的快速传递。但是,今天办理结婚证的人中,哪些人的电话号码写错了,有哪些人是在逃犯、哪些人具有严重的疾病等信息,民政部门无法方便得知,因为这些信息记录在电信、公安、医疗系统的信息系统中。各个系统都拥有自己独立的信息网络,由于还没有建立标准的信息结构,所以只能把和自己相关的信息按照自己的需求设计到系统中去,忽略了信息的整体性。即使两个系统之间的信息整合了,但是由于不是按照信息结构实现的整合,所以也只能实现关键信息整合。并且如果一个系统要同时和多个系统实现信息的完全整合,根本就办不到,因为和第二家的整合方案会影响和第三家系统的整合,如果和其中两家整合后,和第三家整合,其工程复杂程度就会指数倍上升。而现实生活中成千上万个信息系统都需要整合成一体,如果不先把信息标准化并结构化了,大家也只能想想,根本就无法完成。这也是为什么你现在需要在各个网站注册帐号并重复填写相同信息的原因。其实完全可以用一个帐号去登陆所有网站,并没有技术障碍,只是因为目前网络之间的信息是非标准化并结构化的,无法流通,所以你的信息只在一定区域内有效。

你去商场购买一个数码相机,付款以后,商场的销售人员需要给填一个付款单,上面写着什么时间、什么价格、购买什么型号的数码相机,然后你到收银台把条和钱交给收银员,收银员再记录什么时间、销售什么型号的什么商品收了多少钱。你拿着小票再回到销售人员哪里,服务好的商场还会帮助你填写厂家的保修卡,上面也需要记录什么时间、在哪里购买了什么型号的商品,价格是多少,并且还需要写上购买人名称和商品的ID号。这些单据并不一样,有付款单、收款单、出库单、保修卡。但是都是由于一个购买行为产生的。这个购买行为会程序性的触发一连串信息的出现和更改,因为购买就意味着需要付款、银行帐号钱会减少、商场要收款、银行要转帐、商场银行帐号要增加、仓库要出货、厂家销量要增加等一系列信息。甚至还影响到了国民生产总值和中日关系等。

其实这个社会就是一个运转信息的大程序,大程序的走向和值的变动是下层千千万万个小程序小线程值的变化所决定的,而事实上由于以前没有计算机和互联网,信息本体虽然已经变了,但是由于没有设备自动记录,也没有合适的载体来完整记录并体现信息的变化,也就无法记录信息的程序性和关联性,所以大家得到的数据都不完善、不准确,在时间上由于传递障碍也都是迟延的。所以对于很多现象我们无法理解,虽然我们以为自己知道的很多了,但事实上我们都生活在无知的里面。不然为什么一些最基础的问题,例如人是什么?我们是从哪里来的?我们要走向哪里?、社会为什么这个样子?我们生命的价值是什么等这些最基本的信息,我们都无法得知呢?一个人被抛尸荒野,一年以后才被发现,也就是与这个案件相关的一系列信息已经完整地存在一年了,但是我们还无法知道真相也无法破案,虽然公安机关收据了很多孤立破碎的零星信息,并且作出了很符合逻辑的推理,但是如果迟迟无法得到关键信息,也无法破案,其原因就是因为我们虽然存在于信息的真实中,但却受时间空间并个人能力等因素的限制,无法得到这些信息,所以对于真实我们往往是无知的。即使抓到人了,我们也只能叫嫌疑人,原因是我们还有很多不知道的东西,因为其中一个微小的真实的信息就能推翻整个推理。

现在虽然计算机和互联网出现了,其实我们还需要能把这个信息的新容器按照主体标准和结构标准重新格式化一遍。使其能够记录并模拟信息所有的关联性,并把信息标准化并结构化存储,让信息的程序性或逻辑性去支配信息个体去自由但有规则地运动。使信息不再受纸、人、软件、网站、组织、国家、文化、语言的限制,同时用设备和程序去捕捉现实中的基础信息,并用计算机程序去模拟现实中程序的运行而计算出更多的合成信息,从而驱动起整个信息系统。只有这样,才能模拟并记录信息在现实世界中运行的情况,也才可以更多地了解和认识我们自己和这个社会,从而找到现实社会中各种问题产生的总根源,进而作出修正。才能使我们从无知中逐步走出来。所以说,计算机和互联网出现的时代将是人类科学和社会大发展的时代。而这些都是建立在对信息的标准化并结构化的基础上才可以实现的。不然我们根本无法去模拟和记录信息在现实社会存在的痕迹,也根本无法实现人们通过互联网把国家、组织并所有人真正联合并协调起来的可能。因为信息是具有能量并驱动一切的,如果你不相信,你去使用一下没有BOIS或操作系统的计算机,也可以去找一个马路上的疯子聊天,如此以后你就会深刻理解我所要传递的信息了。

 

【作者: 光锋战士】【访问统计:】【2005年12月12日 星期一 17:08】【 加入博采】【打印

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=3857565

博客手拉手

中国互联网迎来第二次发展浪潮 hu2698
程度不同的人化互联网:远观、参与、互动、碰撞、主导 不修文学,而性明达
程度不同的人化互联网:远观、参与、互动、碰撞、主导 不修文学,而性明达
顺风:也谈互联网竞争的两大战略枢纽 顺风
顺风:也谈互联网竞争的两大战略枢纽 顺风

回复

评论内容: