Linux системные вызовы fork

Давайте напишем командную оболочку Linux

Всем привет! Хочу поделиться своим опытом написания собственной командной оболочки Linux используя Posix API, усаживайтесь поудобнее.

Что должна уметь наша командная оболочка

  1. Запуск процессов в foreground и background режиме
  2. Завершение background процессов
  3. Поддержка перемещения по директориям

Как устроена работа командной оболочки

  1. Считывание строки из стандартного потока ввода
  2. Разбиение строки на токены
  3. Создание дочернего процесса с помощью системного вызова fork
  4. Замена дочернего процесса на необходимый с помощью системного вызова exec
  5. Ожидание завершения дочернего процесса (в случае foreground процесса)

Немного про системный вызов fork()

Простыми словами системный вызов fork создает полный клон текущего процесса, отличаются они лишь своим идентификатором, т. е. pid .

#include #include #include int main() < pid_t pid = fork(); if (pid == 0) < printf("I'm child process!\n"); >else < printf("I'm parent process!\n"); wait(NULL); >return 0; >

I’m parent process!
I’m child process!

Что же произошло? Системный вызов fork создал клон процесса, т. е. теперь мы имеем родительский и дочерний процесс.

Чтобы отличить дочерний процесс от родительского в коде достаточно сделать проверку. Если результат функции fork равен 0 — мы имеем дело с дочерним процессом, если нет — с родительским. Это не означает, что в операционной системе id дочернего процесса равен 0 .

Причем, порядок выполнения дочернего и родительского процесса ничем не задекларирован. Все будет зависеть от планировщика операционной системы. Поэтому в конце блока родительского процесса добавлена строчка wait(NULL) , которая дожидается окончания дочернего процесса.

Подробнее про exec()

В документации есть различные вариации системного вызова exec , но они отличаются только способом передачи токенов в параметры функции, смысл от этого не изменяется.

Системный вызов exec заменяет текущий процесс сторонним. Естественно, сторонний процесс задается через параметры функции.

#include #include #include #include int main() < pid_t pid = fork(); if (pid == 0) < execlp("ls", "ls", "-l", NULL); exit(1); >else < waitpid(pid, NULL, 0); >return 0; >

total 16
-rwxr-xr-x 1 runner runner 8456 Jan 13 07:33 main
-rw-r—r— 1 runner runner 267 Jan 13 07:33 main.c

Родительский процесс как обычно ожидает завершения дочернего процесса. В это время после системного вызова exec происходит замена дочернего процесса на консольную утилиту ls , она была взята для примера.

Можно сказать мы реализовали простую командную оболочку, вся логика заключается именно в этом.

Перейдем к полноценной реализации

Часть 1. Чтение строки с консоли

Изначально нам надо уметь считывать строку из командной строки. Думаю, с этим не возникнет сложностей.

char* readline() < char* line = NULL; size_t size = 0; ssize_t str_len; // Reading line from stdin if ((str_len = getline(&line, &size, stdin)) == -1) < // Logging all errors except Ctrl-D - terminal shutdown if (errno != 0) < printf("[ERROR] Couldn't read from stdin\n"); >free(line); printf("\n"); return NULL; > // Remove useless \n symbol if exists if (line[str_len - 1] == '\n') < line[str_len - 1] = '\0'; >return line; >

В данной функции происходит чтение строки с применением функции getline . После чего, если в конце строки имеется символ переноса строки, удаляем его.

Обратите внимание, что при чтении могут возникнуть ошибки, одна из них — нажатие сочетания клавиш ctrl-D . Однако это штатный случай завершения работы командной оболочки, следовательно в данном случае не должна выводиться ошибка.

Часть 2. Разбиение строки на токены

В данной части будет представлена реализация разбиения строки на массив токенов.

#define DEFAULT_BUFF_SIZE 16 #define TOKENS_DELIMITERS " \t"

Определения начальной длины массива и разделителей строки.

char** split(char* line) < size_t position = 0; size_t buff_size = DEFAULT_BUFF_SIZE; char* token; // Allocate memory for tokens array char** tokens = (char**)malloc(sizeof(char*) * buff_size); if (tokens == NULL) < printf("[ERROR] Couldn't allocate buffer for splitting!\n"); return NULL; >// Tokenize process token = strtok(line, TOKENS_DELIMITERS); while (token != NULL) < // Emplace token to array tokens[position++] = token; // If array free space ended - increase array if (position >= buff_size) < buff_size *= 2; tokens = (char**)realloc(tokens, buff_size * sizeof(char*)); if (tokens == NULL) < printf("[ERROR] Couldn't reallocate buffer for tokens!\n"); return NULL; >> // Getting next token token = strtok(NULL, TOKENS_DELIMITERS); > // Place NULL to the end of tokens array tokens[position] = NULL; return tokens; >

Код выглядит довольно громоздким, однако в нем нет ничего сложного.

Читайте также:  Вывести содержание файла linux

Очередной токен получается с использованием функции strtok . После чего данный токен копируется в массив токенов. Если в массиве токенов не достаточно места, массив увеличивается в 2 раза.

Завершается всё добавлением завершающего токена равного NULL , т. к. функция exec() ожидает наличие данного завершающего токена.

Часть 3. Выполнение процессов

Структура хранения списка запущенных процессов

Напишем определения структур для foreground и background процессов, fg_task и bg_task . А также определение структуры для хранения всех процессов tasks .

// Struct of background task struct bg_task_t < pid_t pid; // Process id bool finished; // Process state char* timestamp; // Process state char* cmd; // Command cmd >; typedef struct bg_task_t bg_task; // Struct of foreground task struct fg_task_t < pid_t pid; // Process id bool finished; // Process state >; typedef struct fg_task_t fg_task; // Struct of all tasks struct tasks_t < fg_task foreground; // Process id of foreground bg_task bg_task* background; // Background task list size_t cursor; // Cursor of background tasks size_t capacity; // Background array capacity >; typedef struct tasks_t tasks;

Создадим в коде глобальную переменную типа tasks , которая и будет хранить все наши запущенные процессы.

// Global variable for storing active tasks tasks t = < .foreground = < .pid = -1, .finished = true >, .background = NULL, .cursor = 0, .capacity = 0 >;

Вспомогательные функции добавления процессов

Установка foreground процесса выглядит банально и не нуждается в комментировании.

void set_foreground(pid_t pid)

Добавление background процесса выглядит посложнее.

int add_background(pid_t pid, char* name) < // Temp background task variable bg_task* bt; // If end of free space in background array - increase size if (t.cursor >= t.capacity) < t.capacity = t.capacity * 2 + 1; t.background = (bg_task*)realloc(t.background, sizeof(bg_task) * t.capacity); if (t.background == NULL) < printf("[ERROR] Couldn't reallocate buffer for background tasks!\n"); return -1; >> // Print info about process start printf("[%zu] started.\n", t.cursor); // Save task in temp variable bt = &t.background[t.cursor]; // Save process info in array bt->pid = pid; bt->finished = false; time_t timestamp = time(NULL); bt->timestamp = ctime(×tamp); bt->cmd = strdup(name); // Move cursor right t.cursor += 1; return 0; >

На деле же все проще. Смотрим есть ли место в массиве для хранения информации о процессе. Если его недостаточно — увеличиваем длину массива в 2 раза. После чего происходит добавление структуры bg_task в массив и последующее заполнение полей структуры информацией о процессе.

Данная функция возвращает -1 в случае неудачи.

Вспомогательные функции для завершения процессов

Добавим функцию экстренного завершения foreground процесса. Данная функция с помощью системного вызова kill с параметром SIGTERM завершает процесс по id процесса.

Также добавим функцию для завершения background процесса.

int term(char** args) < char* idx_str; // Cursor in index arg int proc_idx = 0; // Converted to int index arg if (args[1] == NULL) < printf("[ERROR] No process index to stop!\n"); >else < // Set cursor in index arg idx_str = args[1]; // Convert string index arg to int while (*idx_str >= '0' && *idx_str // Kill process if process index not bad // and target process not finished if (*idx_str != '\0' || proc_idx >= t.cursor) < printf("[ERROR] Incorrect background process index!\n"); >else if (!t.background[proc_idx].finished) < kill(t.background[proc_idx].pid, SIGTERM); >> return CONTINUE; >

Данная функция принимает в себя массив токенов вида «, NULL> . После чего преобразует токен индекса background задачи в число. Убивает background задачу посредством системного вызова kill .

Читайте также:  Create swap file on linux

Непосредственно запуск процессов

Для удобства введем функцию is_background , определяющую является ли задача фоновым процессом. Данная функция просто проверяет наличие & в конце.

int is_background(char** args) < // Current position in array int last_arg = 0; // Finding last arg in array while (args[last_arg + 1] != NULL) < last_arg += 1; >// Checking if task is background` if (strcmp(args[last_arg], "&") == 0) < // Remove '&' token for future executing args[last_arg] = NULL; // Return true return 1; >// Return false if: '&' wasn't founded return 0; >

Введем функцию launch которая будет запускать background процесс если в конце присутствует токен & , иначе будет запускаться foreground процесс.

int launch(char** args) < pid_t pid; // Fork process id int background; // Is background task // Checking if task is background background = is_background(args); // Create child process pid = fork(); // If created failure log error if (pid < 0) < printf("[ERROR] Couldn't create child process!\n"); >// Child process else if (pid == 0) < // Try launch task if (execvp(args[0], args) == -1) < printf("[ERROR] Couldn't execute unknown command!\n"); >exit(1); > // Parent process else < if (background) < // Try add background task to array if (add_background(pid, args[0]) == -1) < // Kill all processes and free // memory before exit quit(); >> else < // Set foreground task to store set_foreground(pid); // Wait while process not ended if (waitpid(pid, NULL, 0) == -1) < // Logging error if process tracked with error // Except when interrupted by a signal if (errno != EINTR) < printf("[ERROR] Couldn't track the completion of the process!\n"); >> > > return CONTINUE; >

То, что происходит в этой функции уже должно быть все понятно.

  1. Создается дубликат процесса с помощью системного вызова fork
  2. Заменяем дочерний процесс на требуемый с помощью системного вызова exec
  3. Определяем является ли процесс фоновым
  4. Если процесс фоновый — просто добавляем его в список bacground задач
  5. Если процесс не фоновый — дожидаемся окончания выполнения процесса

В функции присутствует неизвестная функция quit . Ее мы разберем в следующем блоке.

Вспомогательные функции для командной оболочки.

Введем функцию execute , которая в зависимости от первого токена выбирает нужное действие.

int execute(char** args) < if (args[0] == NULL) < return CONTINUE; >else if (strcmp(args[0], "cd") == 0) < return cd(args); >else if (strcmp(args[0], "help") == 0) < return help(); >else if (strcmp(args[0], "quit") == 0) < return quit(); >else if (strcmp(args[0], "bg") == 0) < return bg(); >else if (strcmp(args[0], "term") == 0) < return term(args); >else < return launch(args); >>

Данная функция пропускает действие, если первый токен NULL . Смена директории, если первый токен cd . Вывод справки об использовании, если первый токен help . Завершение работы командной оболочки, если первый токен quit . Вывод списка background задач, если первый токен bg . Завершение процесса по индексу, если первый токен term .

Во всех других случаях запускается процесс.

Реализация вспомогательных функций

#define CONTINUE 1 #define EXIT 0

Значение CONTINUE означает дальнейшее исполнение главного цикла командной оболочки. Значение EXIT прерывает выполнение главного цикла программы.

int cd(char** args) < if (args[1] == NULL) < printf("[ERROR] Expected argument for \"cd\" command!\n"); >else if (chdir(args[1]) != 0) < printf("[ERROR] Couldn't change directory to \"%s\"!\n", args[1]); >return CONTINUE; >
int help() < printf( "Simple shell by Denis Glazkov. \n\n" "Just type program names and arguments, and hit enter. \n" "Run tasks in background using '&' in the end of command. \n\n" "Built in functions: \n" " cd - Changes current working directory \n" " term - Kill background process by index \n" " help - Prints info about shell \n" " bg - Prints list of background tasks \n" " quit - Terminates shell and all active tasks\n\n" "Use the man command for information on other programs. \n" ); return CONTINUE; >
int quit() < // Temp background task variable bg_task* bt; // Disable logging on child killed signal(SIGCHLD, SIG_IGN); // Kill foreground process if (!t.foreground.finished) < kill_foreground(); >// Kill all active background tasks for (size_t i = 0; i < t.cursor; i++) < // Place background task to temp variable bt = &t.background[i]; // Kill process if active if (!bt->finished) < kill(bt->pid, SIGTERM); > // Free memory for command name free(bt->cmd); > return EXIT; >

Функция quit отключает все callback функции по событию SIGCHLD — т. е. функции, выполняющиеся когда дочерний элемент был завершен. После этого завершает все активные процессы.

#define PRIMARY_COLOR "\033[92m" #define SECONDARY_COLOR "\033[90m" #define RESET_COLOR "\033[0m"

Основные цвета командной оболочки.

int bg() < // Temp background task variable bg_task* bt; for (size_t i = 0; i < t.cursor; i++) < // Store background task in temp variable bt = &t.background[i]; // Print info about task printf( "[%zu]%s cmd: %s%s;%s pid: %s%d; %s" "state: %s%s;%s timestamp: %s%s", i, SECONDARY_COLOR, RESET_COLOR, bt->cmd, SECONDARY_COLOR, RESET_COLOR, bt->pid, SECONDARY_COLOR, RESET_COLOR, bt->finished ? "finished" : "active", SECONDARY_COLOR, RESET_COLOR, bt->timestamp ); > return CONTINUE; >

Часть 4. Главный цикл командной оболочки

#include #include #include "include/shell.h" int main() < char* line; // User input char** args; // Tokens in user input int status; // Status of execution // Add signal for killing foreground child on ctrl-c signal(SIGINT, kill_foreground); // Add signal for handling end of child processes signal(SIGCHLD, mark_ended_task); // Shell is running while // status == CONTINUE do < // Printing left shell info display(); // Reading user input line = readline(); if (line == NULL) < exit(1); >// Parse line to tokens args = split(line); if (args == NULL) < free(line); exit(2); >// Try execute command status = execute(args); // Free allocated memory free(line); free(args); > while (status); return 0; >

Здесь и происходит вся магия. Взгляните на следующие строки. С помощью функции signal задаются callback функции на заданные события.

// Add signal for killing foreground child on ctrl-c signal(SIGINT, kill_foreground); // Add signal for handling end of child processes signal(SIGCHLD, mark_ended_task);

Событие SIGINT — срабатывает при нажатии комбинации ctrl-C , которое в дефолтном поведении завершает работу программы. В нашем же случае мы переназначаем его на завершение foreground процесса.

Читайте также:  Выделить все файлы линукс

Событие SIGCHLD — срабатывает при завершении дочернего процесса созданyого с помощью системного вызова fork . В нашем случае мы переопределяем его на пометку фоновой задачи как выполненной с помощью функции mark_ended_task .

void mark_ended_task() < // Temp background task variable bg_task* bt; // Get process id of ended process pid_t pid = waitpid(-1, NULL, 0); // Handle foreground process if (pid == t.foreground.pid) < t.foreground.finished = true; >// Handle background process else < // Search and remove process form background tasks array for (size_t i = 0; i < t.cursor; i++) < // Place task to temp variable bt = &t.background[i]; if (bt->pid == pid) < // Print info about process end printf("[%zu] finished.\n", i); // Set new state for background process bt->finished = 1; break; > > > >

Все что описано в главном цикле командной оболочки можно описать словами:

  1. Вывод информации о пользователе и текущей директории с помощью функции display
  2. Чтение строки из стандартного потока ввода
  3. Разбиение строки на токены
  4. Выполнение ранее описанной функции execute , которая в зависимости от массива токенов выполняет нужное нам действие.

Нам осталось реализовать одну оставшуюся функцию display . Которая получает информацию о текущей директории с помощью функции getcwd и имя пользователя с помощью функции getpwuid .

void display() < // Try get and print username with color uid_t uid = geteuid(); struct passwd *pw = getpwuid(uid); if (pw != NULL) < printf("%s%s%s:", PRIMARY_COLOR, pw->pw_name, RESET_COLOR); > // Try get and print current directory with color char cwd[MAX_DIRECTORY_PATH]; if (getcwd(cwd, MAX_DIRECTORY_PATH) != NULL) < printf("%s%s%s", SECONDARY_COLOR, cwd, RESET_COLOR); >// Print end of shell info printf("# "); >

Часть 5. Итоговый результат

Надеюсь, данный материал полезен. Если вам есть чем дополнить данный материал, буду рад услышать ваши мысли в комментариях.

С исходным кодом проекта вы можете ознакомиться по данной ссылке.

Источник

Оцените статью
Adblock
detector