当前位置: 首页 > news >正文

一文搞懂Linux内核initrd和Debian实例

init/main.c中的start_kernel函数完成了所有的全局特性初始化,这些全局特性包括内核运转所需要的基础设施,比如虚拟内存设施,进程调度设施,中断设施,缓存设施,VFS设施等,接下来启动1号进程的内核部分,在start_kernel的最后rest_init函数中启动之:

static void noinline rest_init(void)
{
    kernel_thread(init, NULL, CLONE_FS | CLONE_SIGHAND);
    numa_default_policy();
    unlock_kernel();
     cpu_idle();
}

因此init/main.c中的init内核线程函数即是1号进程的内核部分,它完成内核的另一部分初始化之后即exec到1号进程的用户态,从此一直到关机或者重启,不再返回内核态,实际上exec本质上替换了进程地址空间,也就无从返回了。

资料直通车:最新Linux内核源码资料文档+视频资料

学习直通车:Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈

init函数主要进行另一部分的初始化,涉及驱动,网络协议栈,以及为1号进程用户态即init进程准备环境,其中最为重要的就是populate_rootfs函数,在启动initrd的情况下,最为重要的是它将initrd的内存写到了一个文件当中或者直接将initrd的内容写到整个rootfs:

1.将内容写到文件:

fd = sys_open("/initrd.image", O_WRONLY|O_CREAT, 700);
if (fd >= 0) {
    sys_write(fd, (char *)initrd_start, initrd_end - initrd_start); //将initrd的内容写入文件
    sys_close(fd);
    free_initrd_mem(initrd_start, initrd_end); //释放initrd原始内容所占用的内存
}

2.将内容直接放到rootfs:根据rootfs和initrd的内存地址信息直接写。

可见sys_open调用创建了一个文件,即/initrd.image,它的内容就是initrd内存盘的内容,可是它在/下被创建,在linux中,所有的文件都要有一个“文件系统”作为载体,这个/目录所在的文件系统是什么呢?其实是一个内存盘,在start_kernel中的vfs_caches_init负责初始化文件系统,也就是VFS,这是一个虚拟文件系统的框架,其实现如下:

void __init vfs_caches_init(unsigned long mempages)
{
    unsigned long reserve;

    /* Base hash sizes on available memory, with a reserve equal to
           150% of current kernel size */

    reserve = min((mempages - nr_free_pages()) * 3/2, mempages - 1);
    mempages -= reserve;

    names_cachep = kmem_cache_create("names_cache", PATH_MAX, 0,
            SLAB_HWCACHE_ALIGN|SLAB_PANIC, NULL, NULL);
    filp_cachep = kmem_cache_create("filp", sizeof(struct file), 0,
            SLAB_HWCACHE_ALIGN|SLAB_PANIC, filp_ctor, filp_dtor);
    dcache_init(mempages);
    inode_init(mempages);
    files_init(mempages);
    mnt_init(mempages);
    bdev_cache_init();
    chrdev_init();
}
在mnt_init中初始化了一个rootfs:
int __init init_rootfs(void)
{
    return register_filesystem(&rootfs_fs_type);
}

在mnt_init中初始化了一个rootfs:

int __init init_rootfs(void)
{
    return register_filesystem(&rootfs_fs_type);
}

然后在init_mount_tree中调用do_kern_mount挂载了这个rootfs作为“根”,接下来在init函数中创建/initrd.image就有所依托了,它就是在rootfs中创建了一个文件:/initrd.image,rootfs本质上是一个内存文件系统,因为此时还没有加载任何驱动,更别说磁盘,磁带,网卡驱动了,因此文件系统也只能是内存式的。linux的vfs功能十分强大,以文件作为接口使初始化过程如此简洁!

接下来就要加载驱动了,do_basic_setup初始化了所有硬编译进内核的驱动,然而驱动并不一定要编译进内核,而这些驱动可能对于加载基于磁盘的根文件系统还至关重要,比如ide驱动,比如scsi驱动等,这些就由initrd来加载了,initrd的本质是一只鸡,也就是在有磁盘根文件系统这个“蛋”之前先要有一只“鸡”。

接下来prepare_namespace登场,我们可以看到在populate_rootfs结束后分开了两条线索:

if (sys_access((const char __user *) "/init", 0) == 0)
    execute_command = "/init";
else
    prepare_namespace();

然后在init_mount_tree中调用do_kern_mount挂载了这个rootfs作为“根”,接下来在init函数中创建/initrd.image就有所依托了,它就是在rootfs中创建了一个文件:/initrd.image,rootfs本质上是一个内存文件系统,因为此时还没有加载任何驱动,更别说磁盘,磁带,网卡驱动了,因此文件系统也只能是内存式的。linux的vfs功能十分强大,以文件作为接口使初始化过程如此简洁!

接下来就要加载驱动了,do_basic_setup初始化了所有硬编译进内核的驱动,然而驱动并不一定要编译进内核,而这些驱动可能对于加载基于磁盘的根文件系统还至关重要,比如ide驱动,比如scsi驱动等,这些就由initrd来加载了,initrd的本质是一只鸡,也就是在有磁盘根文件系统这个“蛋”之前先要有一只“鸡”。

接下来prepare_namespace登场,我们可以看到在populate_rootfs结束后分开了两条线索:

if (sys_access((const char __user *) "/init", 0) == 0)
    execute_command = "/init";
else
    prepare_namespace();

如果initrd的内容被直接写到了rootfs,那么在rootfs的/目录中会有一个init程序,它可以是ELF程序,也可以是脚本,这是因为linux_binprm这个基础设施已经初始化过了。如果/下有init的话,那么这肯定就是cpio格式的initrd,反之则是image的,这一切都是在populate_rootfs中判断的,如果是cpio格式的,那么可以看到,全局变量execute_command被赋值为/init,然后直接执行。

这样就完事了,cpio格式的initrd的/下有一个init程序,它一旦执行就使用exec进入了用户态,再也无法返回内核,最终自己将“真正的根文件系统”挂载,至于谁是真正的根,它需要命令行参数信息,这个信息是通过/proc文件系统得到的,由于内核并不处理挂载procfs的信息,这个proc文件系统需要initrd的/init程序自己挂载。而如果populate_rootfs判断不是cpio格式的,那么就会仅在/下建立一个/initrd.image文件,当然不会有/init存在了,于是就进入了prepare_namespace:

void __init prepare_namespace(void)
{
...
    if (saved_root_name[0]) {  //设置root文件系统的命令行参数,比如root=/dev/hda1
        root_device_name = saved_root_name;
        ROOT_DEV = name_to_dev_t(root_device_name); //设置ROOT_DEV
        if (strncmp(root_device_name, "/dev/", 5) == 0)
            root_device_name += 5;
    }
...
    if (initrd_load())
        goto out;
...
}
void __init prepare_namespace(void)
{
...
    if (saved_root_name[0]) {  //设置root文件系统的命令行参数,比如root=/dev/hda1
        root_device_name = saved_root_name;
        ROOT_DEV = name_to_dev_t(root_device_name); //设置ROOT_DEV
        if (strncmp(root_device_name, "/dev/", 5) == 0)
            root_device_name += 5;
    }
...
    if (initrd_load())
        goto out;
...
}

 

相关文章:

  • 慈溪企业网站建设/自己怎么做引流推广
  • 做汽车精品的网站/优化水平
  • 简单网页设计作品/seo策略有哪些
  • 最靠谱的网站建设公司/外贸网络推广怎么做
  • 做水果网站弄个什么名字/网站运营指标
  • 北京公司建设网站/淘宝seo搜索排名优化
  • webgl—将多组点传给webgl系统中
  • Meta CTO专访:2023年AR/VR、元宇宙的下一步怎么走
  • EBS调用webservice
  • 大白话式粗浅地聊聊NLP语言模型
  • 【Java】Java开发工程师面试题目
  • 【自用】VUE项目 宝塔部署 上线阿里云服务器CentOS7.6
  • 计算机网络期末重点考点总复习
  • 基于Servlet 的Java Web项目的CSRF防御概念
  • SpringBoot+Vue项目实践课程教学管理平台
  • 基于标志点特征高精提取与匹配方法,进行双目、结构光、RGBD相机、单目相机多视拼接
  • Cartesian product
  • 如何实现高性能点赞