高校图书馆网络设计与应用研究
(二)存储技术选择
随着图书馆信息量的剧增,存储规模也越来越大,信息度量单位也不断改变,从KB到MB,进而到TB,以至PB。存储这些海量信息不但要求存储设备有很大的储存容量,而且还需要大规模数据库存储和处理这些数据[9],这就涉及到硬件随时读取的速度、数据集中与分布、存储管理方法等问题。 1.常用的存储技术简介
(1)直连式存储(DAS)
DAS是所有网络存储设备的基础,依赖服务器主机的操作系统对数据进行存储维护和I/O读写,在进行数据备份和恢复的时候会占用主机的资源,包括CPU和I/O系统。直连式存储的数据量越大,备份和恢复数据所用的时间就越长,对服务器硬件的依赖性、影响性就越大[10]。
图5.1显示DAS存储拓扑:此模式的好处是前期投入低,缺点是后续成本大,总拥有成本(TCO)较高;随着应用服务器的增加,网络系统效率会急剧下降。
图5.1 DAS存储拓扑图
(2)网络附加存储(NAS)
NAS是一数据为核心的存储系统,可以实现异构平台上的文件共享,可以直接和LAN相连,提供文件级服务,其拓扑结构如图5.2所示。在实际应用中,多个用户同时并发访问同一数据时,传输过程十分繁琐,极大的增加了网络的开销,使得数据的I/O速度变慢,严重影响用户的正常使用。所以,NAS不适合在对访问速度要求过高的应用场合使用。此外NAS无法将多个NAS设备,整合成一个统一的存储池进行集中管理。
- 16 -
高校图书馆网络设计与应用研究
图5.2 NAS存储拓扑图
NAS存储设备不承担应用服务,它有自己的CPU、内存、主板和操作系统从这点看,NAS存储设备本身与文件服务器没有太大的区别。其数据访问过程如图5.3所示:
(l)客户机向服务器发出连接请求;
(2)服务器确认后将存放在存储设备中的文件目录信息发送给客户机; (3)服务器监听客户机下一个的数据请求; (4)客户机发出数据访问请求命令;
(5)服务器返回文件的地址信息,并等待客户机的下一个命令请求或其他客户机的连接请求;
(6)客户机向目标存储设备发出连接请求;
(7)目标存储设备确认后,等待客户机的读写命令,等待接收数据; (8)目标存储设备向客户机发送数据,结束后等待下一个读写请求。
图5.3 NAS数据访问过程
- 17 -
高校图书馆网络设计与应用研究
(3)存储区域网络(SAN)
存储区域网络是一个高速子网,子网中的设备可以从主网卸载流量。通常SAN由RAID阵列连接光纤通道,SAN和客户端、服务器的数据通信是通过SCSI命令而不是TCP/IP实现,数据处理是“块级”[11]。
SAN中数据访问过程如图5.4所示:
(l)首先,在IP网络中,客户端通过TCP/IP协议向服务器发送数据访问请求; (2)服务器确认访问请求后,同时在SAN网络中,服务器通过FCP协议向目标存储设备发出数据读写命令;
(3)服务器等待其他客户端的数据访问请求;
(4)在SAN网络中,目标设备将封装在FCP协议中的数据帧传输到服务器; (5)服务器上的HBA卡将FC数据帧转换为IP数据包,再通过TCP/IP协议传送到客户端。数据的传输是在一个专用、高速的网络中进行,并不占用服务器的CPU资源,使得服务器专注于应用程序的处理,也很好地解决了NAS网络中的带宽问题。
图5.4 SAN数据访问过程
2.学院图书馆存储技术具体选择
在三种主流的存储技术中,DAS是最古老的存储技术,它最主要的优势是简单易用;它的缺点磁盘利用率很低,只有30%左右,而NAS和SAN可达70%;不易扩容,在
- 18 -
高校图书馆网络设计与应用研究
将来网络扩建时会出现瓶颈,本网络中放弃使用。对于SAN来说,它的投资太大,只有电信、金融等超大型企业可以承担;文件的处理在服务器上实现,对前端服务器要求高 ;数据共享困难;对大量小文件的读写性能甚至不如NAS。
基于上述分析和该校图书馆中对文件高速上传、下载的需求采用NAS存储技术,它的优势在于简单易用,通过WEB界面管理,管理者不需专业技术;价格便宜,有的NAS甚至比SAN便宜一个数量级!共享方便,可给不同操作系统服务器/pc机同时提供存储容量;扩容方便,可动态给不同用户分配/修改存储空间;对前端服务器要求不高,文件的管理、缓存在NAS上实现[12]。
- 19 -