Unix/Linux操作系统提供了一个fork()
系统调用,它非常特殊。普通的函数调用,调用一次,返回一次,但是fork()
调用一次,返回两次,因为操作系统自动把当前进程(称为父进程)复制了一份(称为子进程),然后,分别在父进程和子进程内返回。
子进程永远返回0
,而父进程返回子进程的ID。这样做的理由是,一个父进程可以fork出很多子进程,所以,父进程要记下每个子进程的ID,而子进程只需要调用getppid()
就可以拿到父进程的ID。
Python的os
模块封装了常见的系统调用,其中就包括fork
,可以在Python程序中轻松创建子进程:
1 2 3 4 5 6 |
import os print('Current Process (%s) start...' % os.getpid()) pid = os.fork() print(pid) print("---") |
运行结果如下:
1 2 3 4 5 |
Current Process (20051) start... 20052 --- 0 --- |
可以看见执行一次fork,print运行了两次。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 |
# -*-coding:utf-8-*- import sys, os ''' 将当前进程fork为一个守护进程 ''' def daemonize(stdin='/dev/null', stdout='/dev/null', stderr='dev/null'): ''' Fork当前进程为守护进程,重定向标准文件描述符(默认情况下定向到/dev/null) ''' #Perform first fork. try: pid = os.fork() if pid > 0: # first parent out sys.exit(0) except OSError as e: sys.stderr.write("fork #1 failed: (%d) %s\n" %(e.errno, e.strerror)) sys.exit(1) ''' 从父环境中脱离 ''' os.chdir("/") os.umask(0) os.setsid() ''' 执行第二次fork ''' try: pid = os.fork() if pid > 0: # second parent out sys.exit(0) except OSError as e: sys.stderr.write("fork #2 failed: (%d) %s]n" %(e.errno,e.strerror)) sys.exit(1) ''' 进程已经是守护进程了,重定向标准文件描述符 ''' sys.stdout.flush() sys.stderr.flush() si = open(stdin, 'r') so = open(stdout, 'a+') se = open(stderr, 'a+') os.dup2(si.fileno(), sys.stdin.fileno()) os.dup2(so.fileno(), sys.stdout.fileno()) os.dup2(se.fileno(), sys.stderr.fileno()) def main(): '''示例函数:每秒打印一个数字和时间戳''' import time sys.stdout.write('Daemon started with pid %d\n' % os.getpid()) sys.stdout.write('Daemon stdout output\n') sys.stderr.write('Daemon stderr output\n') c = 0 while True: sys.stdout.write('%d: %s\n' %(c, time.ctime())) sys.stdout.flush() c = c+1 time.sleep(1) if __name__ == "__main__": daemonize('/dev/null', '/tmp/daemon.log', '/tmp/daemon.log') main() |
第一个fork是为了让shell返回,同时让你完成setsid(从你的控制终端移除,这样就不会意外地收到信号)。setsid使得这个进程成为“会话领导(session leader)”,即如果这个进程打开任何终端,该终端就会成为此进程的控制终端。我们不需要一个守护进程有任何控制终端,所以我们又fork一次。在第二次fork之后,此进程不再是一个“会话领导”,这样它就能打开任何文件(包括终端)且不会意外地再次获得一个控制终端。
另外说明:
umask():函数为进程设置文件模式创建屏蔽字,并返回以前的值。在shell命令行输入:umask就可知当前文件模式创建屏蔽字。常见的几种umask值是002,022和027,002阻止其他用户写你的文件,022阻止同组成员和其他用户写你的文件,027阻止同组成员写你的文件以及其他用户读写或执行你的文件,rwx-rwx-rwx代表是777所有的人都具有权限读写与执行。
chmod():改变文件的权限位。
int dup(int filedes):返回新文件描述符一定是当前文件描述符中的最小数值。
int dup2(int filedes, int filedes2):这两个函数返回的新文件描述符与参数filedes共享同一个文件表项。
另外,如果你使用日志模块记录相关信息,就可以把脚本中如下信息进行替换。
1 2 3 |
si = open(stdin, 'r') so = open(stdout, 'a+') se = open(stderr, 'a+') |
替换为:
1 2 3 |
si = open(os.devnull, 'r') so = open(os.devnull, 'a+') se = open(os.devnull, 'a+') |
然后把相应的sys.stdout、sys.stderr替换成日志模块方式写入信息即可。