关于作者

姓名:吴颜

性别:男

出生日期:1977-03-08

地区:河南-郑州

联系电话:13903865817

QQ:28050191婚否:已婚
用户名:reddoorwuyan
笔名:传道士
地区: 河南-郑州

日历  

快速登录

+ 用户名:
+ 密 码:

快速通道

文章索引

在线留言



同道中人

最新评论

功能区

Google

搜索WWW soln

主题链接

访问统计:
文章个数:11
评论个数:0
留言条数:0




Powered by BlogDriver 2.1

吴颜的互联网与资讯主题博客

 

本博客播的是互联网发展对社会的影响,公用信息平台开发,WEB3.0 为主题的客 希望大家能鉴赏并提出宝贵意见。

文章

为什么互联网信息一定要标准化和结构化

信息标准化并结构化是社会发展的趋势,业内容易理解和接受的原因我归纳了3种,分别是:

A、使信息可以被正确识别
B
、使信息可以跨平台流通。
C
、方便程序的调用,使分门别类的程序能实现真正的模块化,并能完全组合。

 而我试图从另外一个层面来阐述信息标准化和结构化的必要性。

语言和文字只是传递信息的一个声音标准和文字标准,并不能视为信息的标准化,所以说,通过语言和文字的层面来标准信息,不属于信息的标准化,即使有一天出现了万国通用的语言和文字,甚至出现了可以自动对文章和句子进行翻译的软件,也不能说我们拥有了标准化的信息,只能说我们有了全球统一标准的文字和语言来表达信息。为什么很早就出现了翻译单词的软件,而能自动翻译文章的软件却迟迟没有开发出来呢?最根本的原因就是文章所携带的信息主体是很复杂的,是大量信息个体机构化存在的一个主体,并不是词语简单的垒加组合。不同语言环境下的单词词义都不是完全相同的,就是相同,在不同句子中出现所要表达的意思也会不一样。句子组合的不同,也会完全改变相同句子在不同文章中的意思。所以说文章中的词语和句子具有复杂的逻辑性和关联性,在没有对所要表达的信息标准化和结构化以前,很难出现能自动翻译文章的软件。

其实这一篇也可以说是第四篇“信息本质”篇的一个延续。我们已经阐明了,就象石油很早就存在地下了,但是直到近代随着生化、物理等学科的发展,人们才有能力开采,研究并利用石油更好的为人类造福一样,信息是早已经存在的一个主体,但是直到计算机和互联网出现以后,人类才有了一个可以研究和更好地使用信息的基础。而由于意识的惯性,我们虽然已经开始感觉到,资讯时代的来临必然会大大的改变这个世代,但同时,就象一个刚买了自行车不会骑,推着走的人一样,我们虽然已经有了计算机互联网络,但是还没有真正地利用起来。其关键是处理信息的方式并没有根本性的改变。忽略了信息的整体性、程序性和关联性。没有把信息标准化和结构化,这也是互联网存在安全、垃圾信息等各种各样问题的总根源。

一个信息值的变化受另外一种或几种信息的影响,。而一个信息值的变化,同时也会影响到其他相关信息值,这些变化都是同时产生的,并且具有十分复杂的联动关系。例如:你用银行卡购买了一个价值1000元钱的MP3同时:你的卡内资金数量减少了1000元、卖你MP3商家的销售额增加了1000元、这个厂家的产品市场占有率增加了一点数值、拥有MP3的总人数增加了1、整个世界上对电力的总需求量也会增加等等,还有数不清的信息值会发生改变。

现在各个系统虽然都在利用计算机网络建立自己的信息系统,但是都忽略了信息的整体性、关联性和程序性。10年前国家要统计具体一天全国所有办理结婚手续人数的总和,需要各个地方民政局统计好自己的数据层层再统计上报到国家汇总后才知道结果的,这一个过程至少需要数天时间。现在国家民政系统只要使用统一的在线软件。不用人工统计,就可以通过计算机和网络知道今天全国有多少人办理了结婚手续,具体各个省的分布、不同年龄阶段的分布也可以很清楚的知道了。因为网络解决了信息简单化的快速传递。但是,今天办理结婚证的人中,哪些人的电话号码写错了,有哪些人是在逃犯、哪些人具有严重的疾病等信息,民政部门无法方便得知,因为这些信息记录在电信、公安、医疗系统的信息系统中。各个系统都拥有自己独立的信息网络,由于还没有建立标准的信息结构,所以只能把和自己相关的信息按照自己的需求设计到系统中去,忽略了信息的整体性。即使两个系统之间的信息整合了,但是由于不是按照信息结构实现的整合,所以也只能实现关键信息整合。并且如果一个系统要同时和多个系统实现信息的完全整合,根本就办不到,因为和第二家的整合方案会影响和第三家系统的整合,如果和其中两家整合后,和第三家整合,其工程复杂程度就会指数倍上升。而现实生活中成千上万个信息系统都需要整合成一体,如果不先把信息标准化并结构化了,大家也只能想想,根本就无法完成。这也是为什么你现在需要在各个网站注册帐号并重复填写相同信息的原因。其实完全可以用一个帐号去登陆所有网站,并没有技术障碍,只是因为目前网络之间的信息是非标准化并结构化的,无法流通,所以你的信息只在一定区域内有效。

你去商场购买一个数码相机,付款以后,商场的销售人员需要给填一个付款单,上面写着什么时间、什么价格、购买什么型号的数码相机,然后你到收银台把条和钱交给收银员,收银员再记录什么时间、销售什么型号的什么商品收了多少钱。你拿着小票再回到销售人员哪里,服务好的商场还会帮助你填写厂家的保修卡,上面也需要记录什么时间、在哪里购买了什么型号的商品,价格是多少,并且还需要写上购买人名称和商品的ID号。这些单据并不一样,有付款单、收款单、出库单、保修卡。但是都是由于一个购买行为产生的。这个购买行为会程序性的触发一连串信息的出现和更改,因为购买就意味着需要付款、银行帐号钱会减少、商场要收款、银行要转帐、商场银行帐号要增加、仓库要出货、厂家销量要增加等一系列信息。甚至还影响到了国民生产总值和中日关系等。

其实这个社会就是一个运转信息的大程序,大程序的走向和值的变动是下层千千万万个小程序小线程值的变化所决定的,而事实上由于以前没有计算机和互联网,信息本体虽然已经变了,但是由于没有设备自动记录,也没有合适的载体来完整记录并体现信息的变化,也就无法记录信息的程序性和关联性,所以大家得到的数据都不完善、不准确,在时间上由于传递障碍也都是迟延的。所以对于很多现象我们无法理解,虽然我们以为自己知道的很多了,但事实上我们都生活在无知的里面。不然为什么一些最基础的问题,例如人是什么?我们是从哪里来的?我们要走向哪里?、社会为什么这个样子?我们生命的价值是什么等这些最基本的信息,我们都无法得知呢?一个人被抛尸荒野,一年以后才被发现,也就是与这个案件相关的一系列信息已经完整地存在一年了,但是我们还无法知道真相也无法破案,虽然公安机关收据了很多孤立破碎的零星信息,并且作出了很符合逻辑的推理,但是如果迟迟无法得到关键信息,也无法破案,其原因就是因为我们虽然存在于信息的真实中,但却受时间空间并个人能力等因素的限制,无法得到这些信息,所以对于真实我们往往是无知的。即使抓到人了,我们也只能叫嫌疑人,原因是我们还有很多不知道的东西,因为其中一个微小的真实的信息就能推翻整个推理。

现在虽然计算机和互联网出现了,其实我们还需要能把这个信息的新容器按照主体标准和结构标准重新格式化一遍。使其能够记录并模拟信息所有的关联性,并把信息标准化并结构化存储,让信息的程序性或逻辑性去支配信息个体去自由但有规则地运动。使信息不再受纸、人、软件、网站、组织、国家、文化、语言的限制,同时用设备和程序去捕捉现实中的基础信息,并用计算机程序去模拟现实中程序的运行而计算出更多的合成信息,从而驱动起整个信息系统。只有这样,才能模拟并记录信息在现实世界中运行的情况,也才可以更多地了解和认识我们自己和这个社会,从而找到现实社会中各种问题产生的总根源,进而作出修正。才能使我们从无知中逐步走出来。所以说,计算机和互联网出现的时代将是人类科学和社会大发展的时代。而这些都是建立在对信息的标准化并结构化的基础上才可以实现的。不然我们根本无法去模拟和记录信息在现实社会存在的痕迹,也根本无法实现人们通过互联网把国家、组织并所有人真正联合并协调起来的可能。因为信息是具有能量并驱动一切的,如果你不相信,你去使用一下没有BOIS或操作系统的计算机,也可以去找一个马路上的疯子聊天,如此以后你就会深刻理解我所要传递的信息了。

 

- 作者: 光锋战士 2005年12月12日, 星期一 17:08  回复(0) |  引用(0) 加入博采

红门提出WEB3.0 概念 并推出相应服务
WEB2.0是目前互联网界最热的话题,热的原因,我想最主要的是它改变了人们获取信息的途径,并且在方便获取信息的同时又绕过了广告,触动了现有互联网的赢利模式,制造了重新洗牌的机会。所以目前互联网相关的企业不管喜欢不喜欢它,目前都在很认真并严肃的对待这个家伙,希望自己在这次变革中能抢占先机,不至于落伍。而就在大家对WEB2.0的概念还没有完全搞清楚的时间,有些公司更是喊出了WEB3.0的概念。使我们不得不去关注,这些企业是趁热炒做呢,还是WEB2.0真的只是一个不成熟的过度期.



        2005年12月2日下午1:30分,公用信息平台服务商红门资讯,在北京中关村数码大厦A座306会议厅召开了资讯通服务上市的发布会。在发布会上提出WEB3.0概念,并展示了基于WEB3.0所开发的针对IT产品销售商的资讯通WEB系统。我们也参加了其发布会,并给予报道.

我们先介绍并了解一下WEB2.0的基本特征:
        1:网站能够让用户把数据在网站系统内外倒腾
        2:用户在网站系统内拥有自己的数据.
        3:完全基于WEB.所有功能都能通过浏览器完成.
        (以上引用自英文版维基百科)

为了和其对应红门所提出的 WEB3.0的基本特征为:
        1:网站内的信息可以直接和其他网站相关信息进行交互和捣腾,能通过第三方信息平台同时对多家网站的信息进行整合使用。
        2:用户在互联网上拥有自己的数据,并能在不同网站上使用.
        3:完全基于WEB,用浏览器即可以实现复杂的系统程序才具有的功能..

同时红门还从信息聚合的角度定义了WEB3.0的特征:
        第一:对WEB2.0时期杂乱的微内容进行最小单位的继续拆分并词义标准化,并结构化,单位微内容具有各种属性信息,使微信息之间可以互动. 让WEB完全可编程.能满足复杂程序,,例如财务软件等,对微信息的需求.达到商务运营所要求的标准.
        第二:WEB信息可以实现和现实生成同步.在信息的同步、聚合、迁移的基础上加入了信息平台集中效验并分类存储,使分布信息能和平台信息进行智能交互。并能对原始信息进行提炼并加工.
        第三:相对于WEB1.0时期信息通过超级连接跳转互通。WEB2.0时期信息通过程序中的标识代码在页面内容里互通.WEB3.0所实现的是信息可以直接从底层数据库之间进行通讯.底层数据库具备完整的信息交换机制.





        以下是其在发布会上演示的截图并说明.具体所演示的例子,同时也是一套基于公用信息平台所开发具备WEB3.0特征的商家网站。

(图 例1是销售商企业网站的后台)


        从图可以看出网站已经包含了各种软件的功能。而各软件商都可以针对公用信息系统标准开发的软件,用户也可以按照自己的需求把不同功能不同厂家的软件无缝隙的组合.也不用担心信息不通的麻烦。


(图2 普通网民登陆销售商网站的信息体现)



(图例3 内部员工登陆销售商网站的信息体现)


        以上三幅图片显示的是不同类型用户浏览同一个网站时,系统自动聚合相关信息并于体现的巨大差异.需要强调的是,每个WEB3.0信息端所体现的信息,都是信息跨平台搜索得到,不首站内信息的限制,例如你所看到的有关这个企业的报道,并不只是这个企业录入的,其他媒体上和其相关的信息,也会被组合并在终端一起体现.


(图例4 商家的下级代理商浏览商家网站的信息体现)



(图例5  WEB3.0结构的媒体甲对商家一条价格信息的体现)



(图例6 WEB3.0结构的媒体乙对商家一条价格信息的体现)


        图例5和6需要强调的是:两条同样的信息是一家公司一次发布,在数家媒体同时出现的。.媒体并没有对信息进行录入,是通过定制从公用信息平台传递过来显示的,并且媒体还可以定制属于自己的信息体现形式。从上面两个图,一大一小,一个详细一个简单.就可以看出。

        公用信息平台的基本概念:就是一个可以使各个行业、组织、软件、网站之间的信息完全实现互通的平台。.而红门所提的WEB3。0所必须具备的,同样是,在各分布信息体间,一定要存在一个能存储并交互各种类型信息的公用平台。由此可见,红门在推出公用信息平台服务的同时提出WEB3.0的概念是有一定原因的.

        同时从以上报道可以看出,WEB3.0系统所实现的功能是很惊人的,特别是不同系统间信息同步更新、信息的最小化拆分并无重复的特点是WEB2.0从根本上就是无法实现的。可见红门称起为WEB3.0也并不过分.

        而红门为什么在这个时期推出WEB3.0概念,并推出相应的服务。业内对此会有什么样的反映.我们会继续关注,并及时为关心WEB2.0和WEB3.0发展的网民带来最新的消息。

- 作者: 光锋战士 2005年12月9日, 星期五 16:01  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之四 信息的本质和存在状态
摘要:这个世界上最简单、最基础的东西,其实也是最复杂的东西。科技越是发展,我们越是发现连最简单的东西都没有搞清楚。时间到底是什么?物质到底是什么?信息到底是什么?这些问题的答案虽然会越来越清楚、越来越多,但最后的结果也只能是无限接近而已。因为这些东西的复杂程度远不是人类有能力去完全理解的。就好比你无论是用算盘去求∏的值,还是用超级计算机去求∏的值,虽然计算机比算盘可以快出无限倍,但是结局也都是一样的,就是你永远得不到最终的结果。 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:54  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之三 网络结构到底是分布好还是集中好
摘要:分布好还是集中好的争论从来有之,一般的结论是该分布的就要让他分布,该集中的就要让他集中。然而,最好的答案应该是在集中规则(管理)下的分布。 集中是最方便管理和控制的存在形式。大家可以试想一下,上百个员工在一个大厅里工作,老总在大厅中央高台的玻璃房子里的坐着,每个人的一言一行尽在老总眼底,从管理的角度当然很好。但是如果这一百个人分散在100个独立的房子里,每个房子都独立的通往外面的世界。老总在一个同样的房子里呆着,管理起来就困难许多了。 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:51  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之三 网络结构到底是分布好还是集中好
摘要:分布好还是集中好的争论从来有之,一般的结论是该分布的就要让他分布,该集中的就要让他集中。然而,最好的答案应该是在集中规则(管理)下的分布。 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:50  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之二 互联网垃圾信息的来源及解决方法(下)
摘要:还有一种垃圾信息,我们可以称为虚假信息,或非权威信息。这样的信息也是非常多的。往往我们也是无法辨别的。也就是这样的原因,我们往往更相信一些官方网站所报道的信息,因为我们知道,他们一般是不敢乱说的。也就是因为这样,很多假信息都是披着权威媒体的羊皮而跳出来的,相信大家不止一次的听到报道说,谁谁谁,模仿什么什么网站的设计并网址发放什么什么虚假信息。前些时候,一位日本青年申请了一个和雅虎很像的网址,又设计了和雅虎一样的网页,在上面报道说中国正在偷袭日本,并向日本开战了的假消息,引起了很 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:48  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之二 互联网垃圾信息的来源及解决方法(上)
摘要:概括的讲,互联网垃圾信息的存在于以下几种情况。 1:信息传递和体现的问题,一些信息出现在了不该出现的位置。 2:错误信息、虚假信息、失效信息和非权威信息的大量泛滥。 3:互联网上大量存在的重复信息。 4:没有任何社会价值、甚至对人有损害的不健康信息。 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:47  回复(0) |  引用(0) 加入博采

吴颜谈WEB3.0之一 互联网的价值和目前急待解决的问题
摘要:互联网的全称应该是:全球信息互联的网络,即可以使世界的信息相互进行联络的网络。而信息在全球范围内的有效流通和传递所带来的价值也是非常明显的。我们可以从容易理解的几个方面来讲:  1:减少摩擦。很多国家、组织和个人之间的矛盾是由于沟通不充分、引发了误会进而产生了冲突,消耗了资源。虽然在这个沟通里面文化差异、语言差异占了很大比例,但是归根结底,还是沟通和了解不充分带来的。而互联网的出现可以从这个层面起到作用从而体现其价值。 查看全文

- 作者: 光锋战士 2005年12月9日, 星期五 15:41  回复(0) |  引用(0) 加入博采