分布式文件系统
在本文中,您将了解操作系统中的分布式文件系统及其特点、组件、优势和劣势。
什么是分布式文件系统
分布式文件系统(DFS) 是分布在各个文件服务器和位置上的文件系统。它允许程序以与本地文件相同的方式访问和存储隔离的数据。它还允许用户从任何系统访问文件。它允许网络用户以受控和允许的方式共享信息和文件。但是,服务器对数据具有完全控制,并提供用户访问控制。
DFS的主要目标是通过 常见文件系统(CFS) 使物理分布式系统的用户能够共享资源和信息。它是作为操作系统的一部分运行的文件系统。它的配置是一组通过局域网连接的工作站和主机。在DFS中创建命名空间的过程对客户端来说是透明的。
DFS的服务有两个组成部分,分别是:
- 本地透明性
- 冗余
本地透明性
通过命名空间组件实现。
冗余
通过文件复制组件实现。
在故障或重负载的情况下,这些组件通过将来自多个位置的数据在一个文件夹下逻辑上组合在一起来增加数据的可用性,这个文件夹被称为 “DFS根目录” 。
不需要同时使用两个DFS组件;命名空间组件可以在不使用文件复制组件的情况下使用,文件复制组件可以在服务器之间使用而不使用命名空间组件。
特点
DFS具有各种特点。其中一些特点如下:
透明性
主要有四种透明性。它们如下:
1. 结构透明性
客户端不需要意识到文件服务器和存储设备的数量或位置。在结构透明性中,必须提供多个文件服务器以实现适应性、可靠性和性能。
2. 命名透明性
文件的位置在文件名中不应有任何提示。当文件从一个节点传输到另一个节点时,文件名不应更改。
3. 访问透明性
本地和远程文件必须以相同的方式可访问。文件系统必须自动定位所访问的文件并将其提供给客户端。
4. 复制透明性
当文件在各个节点之间复制时,复制的文件及其位置必须对于一个节点而言隐藏。
可扩展性
当网络中增加更多的机器或将两个网络连接在一起时,分布式系统将不可避免地增加。一个好的DFS必须被设计成能够快速扩展,以应对系统的节点数和用户数的增加。
数据完整性
许多用户通常共享一个文件系统。文件系统需要确保传输文件中保存数据的完整性。并发控制方法必须正确同步来自多个用户的并发访问请求,这些用户竞争访问同一个文件。文件系统通常为用户提供高层次的并发管理系统以保证数据完整性。
高可靠性
在有效的分布式文件系统中,必须尽量限制数据丢失的风险。由于系统不可靠性,用户不应被迫备份其文件。相反,文件系统应备份关键文件,以防原始文件丢失。作为高可靠性策略,许多文件系统使用稳定存储。
高可用性
分布式文件系统应在部分故障的情况下正常工作,例如节点故障、存储设备崩溃和连接故障。
易用性
多程序文件系统的用户界面必须简单,并且文件中的命令必须最小。
性能
评估性能的平均所需时间是说服客户的时间。它的性能必须与集中式文件系统类似。
分布式文件系统复制
最初的DFS版本使用Microsoft的文件复制服务 (FRS),允许服务器之间进行基本的文件复制。FRS检测到新文件或更改的文件,并将完整文件的最新版本分发到所有服务器。
Windows Server 2003 R2开发了“DFS复制”(DFSR)。它通过仅复制更改的文件部分并使用数据压缩来减少网络流量,从而增强了FRS。它还使用户能够使用灵活的配置选项,在可配置的时间表上控制网络流量。
分布式文件系统的历史
DFS的服务器组件首次作为附加功能引入。当它被纳入Windows NT 4.0服务器时,它被称为“DFS 4.1”。后来,它被宣布为所有Windows 2000服务器版本的标准组件。Windows NT 4.0和之后的Windows版本具有客户端支持。
Linux内核2.6.14及更高版本包括一个与DFS兼容的SMB客户端VFS,称为“cifs”。DFS在Mac OS X 10.7 (Lion)及更高版本中可用。
分布式文件系统的工作原理
DFS可能有两种实现方法,分别为:
- 独立DFS命名空间
- 基于域的DFS命名空间
独立DFS命名空间
它不使用Active Directory,并且仅允许存在于本地系统上的DFS根目录。独立DFS只能在创建它的系统上获取。它提供无故障解放,并且不能链接到其他DFS。
基于域的DFS命名空间
它将DFS配置存储在活动目录中,并在 domainname >dfsroot>或 FQDN >dfsroot>中创建命名空间根。
DFS命名空间
传统文件共享中使用的SMB路由形式是与单个服务器链接的。
基于域的DFS文件共享路径通过在整个形式中使用服务器的域名来标识。
当用户访问这样的共享时,无论是直接访问还是通过映射磁盘,他们的计算机都会连接到与该共享相关联的可访问服务器之一,根据网络管理员定义的规则。例如,默认行为是使用户访问最近的服务器; 但是,这可以更改为优先选择某个服务器。
分布式文件系统的应用
分布式文件系统有几个应用。其中一些如下:
Hadoop
Hadoop是一组开源软件服务。它是一个使用MapReduce编程风格,允许分布式存储和管理大量数据的软件框架。Hadoop由一个名为 Hadoop分布式文件系统(HDFS) 的存储组件组成。它是基于MapReduce编程模型的操作组件。
NFS(网络文件系统)
客户端-服务器体系结构使计算机用户能够远程存储、更新和查看文件。这是用于网络附加存储的各种DFS标准之一。
SMB(服务器消息块)
IBM开发了SMB协议用于文件共享。它被开发用于允许系统通过局域网读取和写入远程主机上的文件。远程主机的目录可以通过SMB访问,被称为“共享”。
NetWare
NetWare是一种被Novell, Inc.开发的被遗弃的计算机网络操作系统。它主要使用IPX网络协议来在计算机系统上执行多任务服务。
CIFS(公共互联网文件系统)
CIFS是SMB的一个衍生版本。CIFS协议是微软设计的SMB协议的实现。
分布式文件系统的优缺点
分布式文件系统有各种优点和缺点。以下是其中一些优点和缺点:
优点
分布式文件系统有各种优点。其中一些优点如下:
- 它允许用户访问和存储数据。
- 它有助于提高访问时间、网络效率和文件的可用性。
- 即使服务器或磁盘故障,它也提供了数据的透明性。
- 它允许远程共享数据。
- 它有助于增强更改数据量和交换数据的能力。
缺点
分布式文件系统也有各种缺点。其中一些缺点如下:
- 在DFS中,数据库连接是复杂的。
- 在DFS中,数据库处理还比单用户系统更复杂。
- 如果所有节点同时尝试传输数据,有可能会发生过载。
- 在从一个节点移动到另一个节点时,网络中可能会丢失消息和数据。