内核为每个进程分配一个task_struct结构时,实际上分配两个连续的物理页面(8192字节),如图所示。底部用作task_struct结构(大小约为1K字节),结构的上面用作内核堆栈(大小约为7K字节)。访问进程自身的task_struct结构,使用宏操作current, 在2.4中定义如下:

img

根据内核的配置,THREAD_SIZE既可以是4K字节(1个页面)也可以是8K字节(2个页面)。thread_info是52个字节长。
下图是当设为8KB时候的内核堆栈:Thread_info在这个内存区的开始处,内核堆栈从末端向下增长。进程描述符不是在这个内存区中,而分别通过task与thread_info指针使thread_info与进程描述符互联。所以获得当前进程描述符的current定义如下:

img

下面是thread_info结构体的定义:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
struct thread_info {
struct task_struct *task; /* main task structure */
struct exec_domain *exec_domain; /* execution domain */
__u32 flags; /* low level flags */
__u32 status; /* thread synchronous flags */
__u32 cpu; /* current CPU */
int preempt_count; /* 0 => preemptable, <0 => BUG */
mm_segment_t addr_limit;
struct restart_block restart_block;
void __user *sysenter_return;
#ifdef CONFIG_X86_32
unsigned long previous_esp; /* ESP of the previous stack in
case of nested (IRQ) stacks
*/
__u8 supervisor_stack[0];
#endif
unsigned int sig_on_uaccess_error:1;
unsigned int uaccess_err:1; /* uaccess failed */
};

可以看到在thread_info中个task_struct结构体,里面包含的是进程描述符,其他的参数如下:(可以略过)

(1) unsigned short used_math;

是否使用FPU。

(2) char comm[16];

进程正在运行的可执行文件的文件名。

(3) struct rlimit rlim[RLIM_NLIMITS];

结 构rlimit用于资源管理,定义在linux/include/linux/resource.h中,成员共有两项:rlim_cur是资源的当前最大 数目;rlim_max是资源可有的最大数目。在i386环境中,受控资源共有RLIM_NLIMITS项,即10项,定义在 linux/include/asm/resource.h中,见下表:

(4) int errno;

最后一次出错的系统调用的错误号,0表示无错误。系统调用返回时,全程量也拥有该错误号。

(5) long debugreg[8];

保存INTEL CPU调试寄存器的值,在ptrace系统调用中使用。

(6) struct exec_domain *exec_domain;

Linux可以运行由80386平台其它UNIX操作系统生成的符合iBCS2标准的程序。关于此类程序与Linux程序差异的消息就由 exec_domain结构保存。

(7) unsigned long personality;

Linux 可以运行由80386平台其它UNIX操作系统生成的符合iBCS2标准的程序。 Personality进一步描述进程执行的程序属于何种UNIX平台的“个性”信息。通常有PER_Linux、PER_Linux_32BIT、 PER_Linux_EM86、PER_SVR3、PER_SCOSVR3、PER_WYSEV386、PER_ISCR4、PER_BSD、 PER_XENIX和PER_MASK等,参见include/linux/personality.h。

(8) struct linux_binfmt *binfmt;

指向进程所属的全局执行文件格式结构,共有a。out、script、elf和java等四种。结构定义在include/linux /binfmts.h中(core_dump、load_shlib(fd)、load_binary、use_count)。

(9) int exit_code,exit_signal;

引起进程退出的返回代码exit_code,引起错误的信号名exit_signal。

(10) int dumpable:1;

布尔量,表示出错时是否可以进行memory dump。

(11) int did_exec:1;

按POSIX要求设计的布尔量,区分进程是正在执行老程序代码,还是在执行execve装入的新代码。

(12) int tty_old_pgrp;

进程显示终端所在的组标识。

(13) struct tty_struct *tty;

指向进程所在的显示终端的信息。如果进程不需要显示终端,如0号进程,则该指针为空。结构定义在include/linux/tty.h中。

(14) struct wait_queue *wait_chldexit;

在进程结束时,或发出系统调用wait4后,为了等待子进程的结束,而将自己(父进程)睡眠在该队列上。结构定义在include/linux /wait.h中。

13. 进程队列的全局变量

(1) current;

当前正在运行的进程的指针,在SMP中则指向CPU组中正被调度的CPU的当前进程:

#define current(0+current_set[smp_processor_id()])/sched.h/

struct task_struct *current_set[NR_CPUS];

(2) struct task_struct init_task;

即0号进程的PCB,是进程的“根”,始终保持初值INIT_TASK。

(3) struct task_struct *task[NR_TASKS];

进程队列数组,规定系统可同时运行的最大进程数(见kernel/sched.c)。NR_TASKS定义在include/linux/tasks.h 中,值为512。每个进程占一个数组元素(元素的下标不一定就是进程的pid),task[0]必须指向init_task(0号进程)。可以通过 task[]数组遍历所有进程的PCB。但Linux也提供一个宏定义for_each_task()(见 include/linux/sched.h),它通过next_task遍历所有进程的PCB:

#define for_each_task(p) \

for(p=&init_task;(p=p->next_task)!=&init_task;)

(4) unsigned long volatile jiffies;

Linux的基准时间(见kernal/sched.c)。系统初始化时清0,以后每隔10ms由时钟中断服务程序do_timer()增1。

(5) int need_resched;

重新调度标志位(见kernal/sched.c)。当需要Linux调度时置位。在系统调用返回前(或者其它情形下),判断该标志是否置位。置位的话,马上调用schedule进行CPU调度。

(6) unsigned long intr_count;

记 录中断服务程序的嵌套层数(见kernal/softirq.c)。正常运行时,intr_count为0。当处理硬件中断、执行任务队列中的任务或者执 行bottom half队列中的任务时,intr_count非0。这时,内核禁止某些操作,例如不允许重新调度。

接下来写一个模块,打印当前的进程名字:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
#include <linux/init.h>
#include <linux/thread_info.h>
#include <linux/module.h>
#include <linux/sched.h>

MODULE_LICENSE("GPL");
MODULE_AUTHOR("binary_tree");

int test_init()
{
printk("hello binary_tree!\n");

int i=0;
struct thread_info * info;
struct task_struct * t;

unsigned long addr =(unsigned long)&i;//
unsigned long base = addr & ~ 0x1fff;//屏蔽低13位 8K
info = (struct thread_info *)base;//
t= info -> task;
printk("it is name is %s\n",t-> comm);//打印出进程名字
return 0;
}

void test_exit()
{
printk("bye! bye ! binary_tree! \n");
}


module_init(test_init);
module_exit(test_exit);

在栈中,struct_task的存在方式如下:

img

可以看到在struct_task中有一个staks的结构体,就是一个循环双向链表,因此,我们可以模拟出一个PS命令:

(今天布置的习题)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
#include <linux/init.h>
#include <linux/thread_info.h>
#include <linux/module.h>
#include <linux/sched.h>

MODULE_LICENSE("GPL");
MODULE_AUTHOR("bunfly");

int test_init()
{
int i = 0;
struct task_struct *t;
struct thread_info *info;

unsigned long addr = (unsigned long)&i;
unsigned long base = addr & ~0x1fff;
info = (struct thread_info *)base;
t = info->task;

struct task_struct* flag = t;
struct task_struct *next = container_of(t->tasks.next, struct task_struct, tasks);
//首地址 子类的类型, 父类
//获得t下一个进程符next;
printk("now comm is %s\n",t->comm);

struct task_struct *nnext = container_of(next->tasks.next, struct task_struct, tasks);
//获得next下一个进程nnext
while(nnext != flag)
{
next=nnext;
nnext=container_of(next->tasks.next, struct task_struct, tasks);
printk("next comm is %s\n",next->comm);
}
//依次循环打印下一个进程
printk("nnext comm is %s\n",nnext->comm);
return 0;
}

void test_exit()
{
printk("exit\n");
}

module_init(test_init);
module_exit(test_exit);

在代码中,用到一个函数:container_of(ptr,type,mem),其中三个参数可分别描述为:ptr, type,mem,分别代表:

ptr:父类在子类对象中的首地址;

type:子类的类型:

mem:父类的实体(成员):

img

其具体的功能就是求下面是对container_of函数的具体实现:(重点讲解的)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
1 #include<stdio.h>
2
3 #define container_of(ptr,type,mem) (type*)((unsigned long )(ptr)-(unsigned long)(&((type*)0)->mem));
4 struct person
5 {
6 int age;
7 struct person* next;
8 };
9
10 struct man
11 {
12 int len;
13 int size;
14 char name;
15 struct person p;
16 };
17
18 int main()
19 {
20 struct man haha;
21
22 haha.len=100;
23 haha.p.age=20;
24 struct man* head = &haha.p;//已知父类在子类中的首地址    //3
25 // struct man* tmp=malloc(1);
26 // int size = (unsigned long)(&tmp->p)-(unsigned long)(tmp);
27     //2
28 // struct man* tmp=0;
29 // int size = (unsigned long)(&tmp->p);
30 // struct man* m=(struct man*)( (unsigned long )(head)-size );
31      //1
32 //struct man* tmp=0;
33 //int size = (unsigned long)(&tmp->p);
34 //struct man* m=(struct man*)( (unsigned long )(head)-size );
35
36 // struct man* m=(struct man*)((unsigned long )(head)-(unsigned long)(&((struct man*)0)->p));
37 struct man* m = container_of(head,struct man,p);
38
39 // printf("head addr is %p\n",&head);
40 // printf("m addr is %p\n",&m);
41 // printf("head of len is %d\n",head->len);
42 // printf("head of age is %d\n",(head->p.age) );
43
44 printf("m of len is %d\n",m->len);
45 printf("m of age is %d\n",m->p.age);
46
47 }
~

版权声明:本文为知乎博主「极致Linux内核」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://zhuanlan.zhihu.com/p/549156208