专栏名称: 刘超的通俗云计算
刘超,网易云解决方案首席架构师,代码级略懂OpenStack、Hadoop、Docker、Lucene、Mesos等开源软件,曾出版《Lucene应用开发揭秘》,个人博客可搜索popsuper1982。
目录
相关文章推荐
51好读  ›  专栏  ›  刘超的通俗云计算

Linux的虚拟文件系统VFS

刘超的通俗云计算  · 公众号  · 架构  · 2017-08-26 02:45

正文

没想到Virtual File System VFS还是比较受欢迎的,所以今天详细写一下这一部分。


VFS是一个抽象层,对不同文件系统的实现屏蔽,对上提供统一的接口。




这张图是Linux内核中对于VFS相关数据结构的描述。


每一个进程在内核中,都对应一个task_struct结构


include/linux/sched.h中有


struct task_struct {

/* Open file information: */

struct files_struct *files;


从注释就可以看出是对所有打开的文件的一个结构。


struct files_struct {

struct file __rcu * fd_array[NR_OPEN_DEFAULT];


这里面有一个数据,保存了打开的所有文件,每个文件有一个文件描述符File Desicriptor FD,其中默认开启的有stdin, stdout, stderr,分别为0,1,2。


所以在命令行执行一个后台命令的时候常这样用:

nohup run_command.sh > run.log 2>&1 &


也即我们把stderr和并到stdout里面,全部输出到文件run.log里面。


整个系统所有打开的文件保存在同一个链表中的,当一个文件被打开多次的时候,f_count记录被打开的次数,一般的文件系统不保护文件被多个进程写入,需要进程之间通过同步机制做这件事情。一旦一个文件被多个进程打开,如果在命令行删除文件之后,文件可能不可见了,但是不会被删除,已经打开的进程仍然可以读写文件,直到引用为0。


struct file {

union {

struct llist_node fu_llist;

struct rcu_head fu_rcuhead;

} f_u;

struct path f_path;

struct inode *f_inode; /* cached value */

const struct file_operations *f_op;

spinlock_t f_lock;

atomic_long_t f_count;

unsigned int f_flags;

fmode_t f_mode;

struct mutex f_pos_lock;

loff_t f_pos;

struct fown_struct f_owner;


其中path为

struct path {

struct vfsmount *mnt;

struct dentry *dentry;

};


这里dentry称为directory cache,顾名思义是一个缓存,为了查询快的,从系统启动开始,所有被引用过的文件,都会在这里缓存一下,在dentry结构里面有hashlist,可以方便通过文件或者路径名进行查找,有lru list,可以不断的淘汰。


这里vfsmount,称为mount list,每个被mount的linux文件系统,都会对应一项。对于被Mount的文件系统的跟路径和mount point的路径,各对应一个dentry。


如图是dentry和vfsmount的对应关系,对于左上角的图。


对于操作系统的根路径/对应一个dentry和一个vfsmount,还有一个file结构指向dentry和vfsmount。


home路径是一个mount point,因而对应两个dentry,一个表示上面这个文件系统的mount point,一个表示下面这个文件系统的root directory。有一个vfsmount对应于home路径,parent指向/对应的vfsmount。有一个file结构指向root directory的dentry和vfsmount。


project路径也是一个mount point,也对应两个dentry,有一个vfsmount,并且parent指向home对应的vfsmount。有一个file结构指向root directory的dentry和vfsmount。


对于普通的文件或者路径data和guide,各有一个dentry对应,各有一个file指向相应的dentry,vfsmount都指向project的vfsmount。


在file这个结构中,最本质的是struct inode *f_inode,了解文件系统结构的同学知道,每个文件都有一个inode保存信息。


如图所示,文件系统会有SuperBlock,还有Inode BitMap,通过Inode的一个ID号,可以在Inode Table里面找到对应的inode。



Inode里面保存的是这个文件的数据保存在了哪些block中。


内核内存中的inode是硬盘上inode的一个缓存。


struct inode {

umode_t i_mode;

unsigned short i_opflags;

kuid_t i_uid;







请到「今天看啥」查看全文