分叉函式
頭檔案
函式原型
pid_t fork( void);
(pid_t 是一個宏定義,其實質是int 被定義在# include<sys/types.h>中)
返回值: 若成功調用一次則返回兩個值,子進程返回0,父進程返回子進程ID;否則,出錯返回-1
函式說明
一個現有進程可以調用fork函式創建一個新進程。由fork創建的新進程被稱為子進程(child process)。fork函式被調用一次但返回兩次。兩次返回的唯一區別是子進程中返回0值而父進程中返回子進程ID。
子進程是父進程的副本,它將獲得父進程數據空間、堆、棧等資源的副本。注意,子進程持有的是上述存儲空間的“副本”,這意味著父子進程間不共享這些存儲空間。
UNIX將複製父進程的地址空間內容給子進程,因此,子進程有了獨立的地址空間。在不同的UNIX (Like)系統下,我們無法確定fork之後是子進程先運行還是父進程先運行,這依賴於系統的實現。所以在移植代碼的時候我們不應該對此作出任何的假設。
為什麼fork會返回兩次?
由於在複製時複製了父進程的堆疊段,所以兩個進程都停留在fork函式中,等待返回。因此fork函式會返回兩次,一次是在父進程中返回,另一次是在子進程中返回,這兩次的返回值是不一樣的。過程如下圖。
fork調用的一個奇妙之處就是它僅僅被調用一次,卻能夠返回兩次,它可能有三種不同的返回值:
(1)在父進程中,fork返回新創建子進程的進程ID;
(2)在子進程中,fork返回0;
(3)如果出現錯誤,fork返回一個負值。
在fork函式執行完畢後,如果創建新進程成功,則出現兩個進程,一個是子進程,一個是父進程。在子進程中,fork函式返回0,在父進程中,fork返回新創建子進程的進程ID。我們可以通過fork返回的值來判斷當前進程是子進程還是父進程。
引用一位網友的話來解釋fork函式返回的值為什麼在父子進程中不同。“其實就相當於鍊表,進程形成了鍊表,父進程的fork函式返回的值指向子進程的進程id, 因為子進程沒有子進程,所以其fork函式返回的值為0.
調用fork之後,數據、堆、棧有兩份,代碼仍然為一份但是這個代碼段成為兩個進程的共享代碼段都從fork函式中返回,箭頭表示各自的執行處。當父子進程有一個想要修改數據或者堆疊時,兩個進程真正分裂。
示例代碼:
注意!樣例代碼僅供參考,樣例代碼存在著父進程在子進程結束前結束的可能性。必要的時候可以使用wait或 waitpid函式讓父進程等待子進程的結束並獲取子進程的返回狀態。
fork()在Linux系統中的返回值是沒有NULL的.
Error Codes
出錯返回錯誤信息如下:
EAGAIN
達到進程數上限.
ENOMEM
沒有足夠空間給一個新進程分配.
fork函式的特點概括起來就是“調用一次,返回兩次”,在父進程中調用一次,在父進程和子進程中各返回一次。
fork的另一個特性是所有由父進程打開的描述符都被複製到子進程中。父、子進程中相同編號的檔案描述符在核心中指向同一個file結構體,也就是說,file結構體的引用計數要增加。