DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

数据库技术及应用(3):基本概念

数据模型是数据库技术的核心和基础,因此,对数据库系统发展阶段的划分应该以数据模型的发展演变作为主要依据和标志。按照数据模型的发展演变过程,数据库技术从开始到短短的30年中,主要经历了三个发展阶段:第一代是网状和层次数据库系统,第二代是关系数据库系统,第三代是以面向对象数据模型为主要特征的数据库系统。

数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透、有机结合,成为当代数据库技术发展的重要特征。

系统

第一代数据库系统是20世纪70年代研制的层次和网状数据库系统。层次数据库系统的典型代表是1969年IBM公司研制出的层次模型的数据库管理系统IMS。20世纪60年代末70年代初,美国数据库系统语言协会CODASYL(Conference on Data System Language)下属的数据库任务组DBTG(Data Base Task Group)提出了若干报告,被称为DBTG报告。DBTG报告确定并建立了网状数据库系统的许多概念、方法和技术,是网状数据库的典型代表。在DBTG思想和方法的指引下数据库系统的实现技术不断成熟,开发了许多商品化的数据库系统,它们都是基于层次模型和网状模型的。

可以说,层次数据库是数据库系统的先驱,而网状数据库则是数据库概念、方法、技术的奠基者。

数据库系统

第二代数据库系统是关系数据库系统。1970年IBM公司的San Jose研究试验室的研究员Edgar F. Codd发表了题为《大型共享数据库数据的关系模型》的论文,提出了关系数据模型,开创了关系数据库方法和关系数据库理论,为关系数据库技术奠定了理论基础。Edgar F. Codd于1981年被授予ACM图灵奖,以表彰他在关系数据库研究方面的杰出贡献。

20世纪70年代是关系数据库理论研究和原型开发的时代,其中以IBM公司的San Jose研究试验室开发的System R和Berkeley大学研制的Ingres为典型代表。大量的理论成果和实践经验终于使关系数据库从实验室走向了社会,因此,人们把20世纪70年代称为数据库时代。20世纪80年代几乎所有新开发的系统均是关系型的,其中涌现出了许多性能优良的商品化关系数据库管理系统,如DB2、Ingres、Oracle、Informix、Sybase等。这些商用数据库系统的应用使数据库技术日益广泛地应用到企业管理、情报检索、辅助决策等方面,成为实现和优化信息系统的基本技术。

第三代数据库系统

从20世纪80年代以来,数据库技术在商业上的巨大成功刺激了其他领域对数据库技术需求的迅速增长。这些新的领域为数据库应用开辟了新的天地,并在应用中提出了一些新的数据管理的需求,推动了数据库技术的研究与发展。

1990年高级DBMS功能委员会发表了《第三代数据库系统宣言》,提出了第三代数据库管理系统应具有的三个基本特征:

应支持数据管理、对象管理和知识管理。必须保持或继承第二代数据库系统的技术。必须对其他系统开放。

四个方向

规模会向两头发展—大的越来越大,小的越来越小。所谓大的,指的是企业级数据库的规模。前10年,数据库存储的数据大都以GB为基准衡量,几十GB就已经非常庞大。而如今,很多企业要存储的数据就要达到PB级。数据量越来越大,需要更大的数据库做支撑,这就是数据库的发展方向之一。另一方面,数据库也会越来越小。这种数据库并不要求数据存储量大,但是要求在低计算量的情况下反应快,而且能够适应外界环境的变化。

存储方式从行到列的改变。以前数据库都是以行的形式存储的,理由很简单,用户需要的是对单条数据的读取和存储。而如今,单纯的数据记录已经不足以支撑企业发展了,企业更需要的是数据分析和决策支持。那么,单纯看一条记录没有任何意义,而是要把所有数据的某一项都统计出来进行分析,这就是列的概念。

非结构化数据仍然不能纳入数据库中。非结构化数据要想进入数据库,仍然需要结构化,只是这种结构化的方法各厂商不一样,而且相比以前有了很大的进步和提高。以前图片的记录方式是记录它的文件名,如果文件名中提到了某个人的名字,那么在整个数据库查询的时候,就可以把这个图片找到。而这是非常不科学的,因为很多非结构化数据的文件名起的并不可能完全。把非结构化的数据变得结构化,其实就是在用结构化的数据描述这张图片,比如用点和位置来记录这张图片的每个像素。而一旦需要做查询的时候,可以根据像素的组合记录来比对,把符合比对要求的数据全部筛选出来。这样就把非结构化数据以结构化的方式纳入数据库中了,并能接受查询、检索等操作。

数据库和数据仓库会分开。很多数据库厂商认为,数据库一个就行,一专多能,既能用它进行实时交易,也能用它来进行数据分析。但是,其实很多用户如今在前台需要数据库提供实时交易功能,需要有很快的响应速度,而在后台,则需要设立一些规则进行数据分析和商务智能分析。(未完待续)

【来源:网络】

未经允许不得转载:DOIT » 数据库技术及应用(3):基本概念