信息空间
1.什么是信息空间
信息空间是指随着因特网和“电子商业”的迅速发展,人类正在被带入到一个新的世界环境之中。
目前的因特网的功能是把各个网址连接起来,主要功能是供人们进行数据的获取和处理及传送电子邮件,而信息空间将是人们进行交流、活动的一个新的场所,它是全球所有通信网络、数据库和信息的融合,形成一个巨大的、相互关联、具有不同民族和种族特点相互交流的“景观”,是一个三维空间。在不久的未来,全球网络的融合将改变单个网络的特性,网络将能不再只是简单地作为一种人们进行交流的中介,而将创造出一个“全球网络生态”,人们将能够在“全球网络生态”环境下从事各种活动。这是信息空间。
2.信息空间的空间特性[1]
信息空间是多维的、抽象的、不可见的。它具有两个基本特性:语义和空间特性。语义特性很明显,因为它是一个数据集信息组织的结果,揭示了数据间的语义关系,使用户能够研究和发现数据集中的信息。空间特性没有语义特性那么明显。抽象信息本身是没有形状的(Koike,1993),因此信息本身并没有构成一个空间,而是数据/信息间的语义关系构成了信息空间的结构。
一个信息空间可以由内部属性如共享关键词/主题、引文、超链接、作者组成;或者由外部结构如一个主题目录、一个词表系统、有序的检索结果列表组成;亦或者是内部和外部的结合。网页可以通过超链接进行连接。文档可以通过引文进行链接,分成等级结构目录如主题目录、分类体系或词表,编制基于布尔逻辑的一组关键词索引,还可被描述成文档项矢量模式。作为空间的一个重要属性,信息空间中两个对象之间的距离可以分别被定义为超链接体系中的最短链接路径,引文体系中的最短引用路径,等级结构中的最短路径,布尔逻辑体系中的最短路径,以及矢量模型中的欧几里得路径。目录、空间的另一特性,在超链接体系和引文系统中有特殊含义。如果一个对象的链接/引用了另一个数据库中的对象,这就意味着一个对象被指向了另一个对象。但并不意味着反过来同样成立。在等级结构中上升(下降)到等级上下文中表示从一个较低(较高)层次节点跳向一个较高(较低)层次节点。
在这样一个系统中左移(右移)意味着转换当前节点到左边(右边)的同属节点。在超链接系统中,后退或前进分别表示返回到浏览路径中的前一个网页和到达下一个网页。据我们所知,一个矢量信息检索模型定义了一个高维空间。矢量信息检索模型系统中,有基于距离的信息检索模型和基于角度的信息检索模型。检索边界、检索范围、交叠范围以及范围大小都是信息检索模型中的基本概念,常用于余弦模型、椭圆模型、合取评价模型、析取评价模型等。事实上,矢量文档模型对应于一个所有空间特性都被保护的多维空间,尽管它们对用户都是不可见的。信息空间的空间特性也可以由用户的空间能力对他们信息检索成绩的影响来确定。在需要构建空间结构和空间关系的信息检索中,具有高空间能力的个体有胜过低空间能力的个体的趋势(Seagull et al.,1992;Vicente et al.,1987)。由于信息空间的这些空间特性,人们所谓的“信息迷途”和“电脑空间迷途”就不足为奇了。