文件系统inode与block详解
# 文件系统详解
文件系统是操作系统用于明确存储设备(磁盘等) 或分区上文件的方法和数据结构,即在存储设备上组织文件的方法。
操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。
一个分区或磁盘在作为文件系统使用前,需要格式化,并将记录数据结构写到磁盘上。这个过程就叫建立文件系统。
个人见解:文件系统用于组织文件的存储结构、管理方法等。
# Linux磁盘分区和目录
- Linux发行版本之间的文件系统差别很少,目录结构基本上都是单个的树状结构,可以用tree进行展示。Linux任何一个分区都必须挂载到某个目录上。
- Windows的文件结构是多个并列的树状结构,最顶部的是不同的磁盘分区,如:C、D、E、F等。
# 文件系统的作用
文件系统是软件系统的一部分,它的存在使得应用可以方便的使用抽象命名的数据对象和大小可变的空间。
# 文件系统的功能包括:
- 管理、调度、组织文件的存储空间,提供文件的逻辑结构、物理结构和存储方法。
- 实现文件从标识到实际地址的映射,实现文件的控制操作和存取操作,实现文件信息的共享并提供可靠的文件保密和保护措施,提供文件的安全措施。
- 比如:为用户建立文件,存入、读出、修改、转储文件,控制文件的存取等。
# UNIX/LINUX通用结构
- 其中心概念是superblock、inode、data block、directory block、indirection block。
- 超级块包括文件系统的总体信息,比如大小(其准确信息依赖文件系统)。
- inode包括除了名字外的一个文件的所有信息,名字与inode号码一起存在目录文件中,目录文件中的目录项列表包括文件名和文件的inode号码。
- inode中又包括几个数据块的号码,用于存储文件的数据。
- inode中只有少量数据块数的空间,如果需要更多,会动态分配指向数据块的指针空间,这些动态分配的块是间接块。
# inode和block基本简介
# block - 块
硬盘的最小存储单位叫做"扇区",每个扇区储存512字节。
操作系统读取硬盘的时如果一个个扇区的读取,效率会很低,所以一般一次性连续读取多个扇区,也就是一次性读取一个"块"(block)。
文件数据都储存在"块"中,这种由多个扇区组成的"块",是文件存取的最小单位,"块"的大小,最常见的大小是block默认的4KB。
占用文件大时,可以将block块设置大一些,减少IO消耗。
占用文件小时,可以将block块设置小一点,提高磁盘利用率。
# inode号码 - 索引节点
有了存放文件数据的block,我们还必须有一个地方储存文件的"元信息",比如文件的属性信息等。
这种储存文件元信息的区域就叫做inode,标识inode的是**"索引节点",每一个文件都有对应的inode**。
inode指的是数据结构,而索引编号实际上是inode的标识编号。因此也称其为inode 编号 或者 索引编号。
inode中含有inode编号。
可以通过df -i命令查看磁盘inode大小。
通过df命令查看磁盘的block大小。
# inode的内容
- Size - 文件的字节数大小
- Uid - 文件的拥有者UID
- Gid - 文件的拥有组GID
- Access - 文件的读、写、执行权限
- Time - 文件的三个时间戳 (Change、Modify、Access)
- Links - 文件的硬链接数 (即有多少文件名指向这个inode)
- Inode 文件数据block的位置 (指针)
- Blocks 块数
- IO Blocks 块大小
- Device 设备号码
# inode的大小
- inode也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。
- 一个是数据区,存放文件数据。
- 另一个是inode区(inode table),存放inode所包含的信息。
- 每个inode节点的大小,一般是128字节或256字节。inode节点的总数,在格式化时就给定,一般是每1KB或每2KB就设置一个inode。
- 假定在一块1GB的硬盘中,每个inode节点的大小为128字节,每1KB就设置一个inode,那么inode table的大小就会达到128MB,占整块硬盘的12.8%。
- 查看每个硬盘分区的inode总数和已经使用的数量,可以使用df -i命令。
# inode号码
- 每个inode都有一个号码,操作系统用inode号码来识别不同的文件。
- 可以通过ls -i命令查看文件的inode号码。
# 文件的打开过程
- 用户通过文件名,打开文件。
- 实际上,系统内部这个过程分成三步:
- 1.系统找到这个文件名对应的inode号码。
- 2.通过inode号码,获取inode信息。
- 3.根据inode信息,找到文件数据所在的block,读出数据。
# 目录文件
- Unix/Linux系统中,目录也是一种文件。打开目录,实际上就是打开目录文件。
- 目录文件的结构非常简单,就是一系列目录项的列表。每个目录项由两部分组成:所包含文件的文件名,以及该文件名对应的inode号码。
- ls命令就是通过目录文件中目录项来列出目录中所有文件名,加上i参数会列出inode号码。
- ls命令显示的目录文件的大小,仅仅只是显示目录文件本身的大小,不包括目录文件内的文件的大小,目录文件本身只记录一系列目录项列表。
# 目录文件的权限说明
- 如果要查看目录文件中的详细信息,就必须根据inode号码,访问inode节点读取信息。
- 目录文件的读权限和写权限,都是针对目录文件本身,而执行权限则是针对inode信息。
- 读权限:允许读取目录文件内的文件名。
- 写权限:允许在目录文件中创建、移动、删除文件。
- 执行权限:允许进入目录、读取目录内文件的inode信息(读取文件属性信息等)。
# 硬链接
Unix/Linux系统允许,多个文件名(包括路径) 指向同一个inode号码。
可以用不同的文件名访问同样的内容;对文件内容进行修改,会影响到所有文件名;但是,删除一个文件名,不影响另一个文件名的访问。这种情况就被称为"硬链接"。
删除一个文件名,就会使得inode节点中的"链接数"减1。当这个值减到0,表明没有文件名指向这个inode,系统就会回收这个inode号码,以及其所对应block区域,block块内的数据不会消失,但可能会被其他新文件所覆盖。
# 目录的硬链接
- 创建目录时,默认会生成两个目录项:".“和”…"。
- 前者的inode号码就是当前目录的inode号码,等同于当前目录的"硬链接"。
- 后者的inode号码就是当前目录的父目录的inode号码,等同于父目录的"硬链接"。
# 软链接
- 文件A和文件B的inode号码虽然不一样,但是文件A的内容是文件B的路径。读取文件A时,系统会自动将访问者导向文件B。
- 因此,无论打开哪一个文件,最终读取的都是文件B。这时,文件A就称为文件B的"软链接"或者"符号链接"。
- 这意味着,文件A依赖于文件B而存在,如果删除、移动、改名了文件B,打开文件A就会报错:"No such file or directory",如果此后你创建回一个同路径的文件,链接文件就会指向此文件,不会再报错。
# inode的特殊作用
由于inode号码与文件名分离,这种机制导致了一些Unix/Linux系统特有的现象。
1.有时,文件名包含特殊字符无法正常删除。这时,直接删除inode节点,就能起到删除文件的作用。
2.移动文件或重命名文件,只是改变文件名,不影响inode号码。
3.打开一个文件以后,系统就以inode号码来识别这个文件,不再考虑文件名。因此,通常来说,系统无法从inode号码得知文件名。
- 这一点使得软件更新变得简单,可以在不关闭软件的情况下进行更新,不需要重启。
- 因为系统通过inode号码,识别运行中的文件,不通过文件名。更新的时候,新版文件以同样的文件名,生成一个新的inode,不会影响到运行中的文件。
- 等到下一次运行这个软件的时候,文件名就自动指向新版文件,旧版文件的inode则被回收。
# 文件的移动
- 文件在同分区中移动,inode号码不变,只是更新目录文件对应数据块里边的文件名和inode对应关系
- 文件在不同分区中移动,会创建新的inode,因为inode节点不同分区是不能共享的。