Can strace make you fail? (Дмитрий Левин, OSSDEVCONF-2016)

Короткая ссылка: 201610019

Содержание

1 Аннотация
2 Видео
3 Слайды
4 Расширенные тезисы
5 Что дальше?
6 Примечания и отзывы

Аннотация[править | править вики-текст]

Докладчик: Дмитрий Левин

strace is a diagnostic, debugging and instructional userspace utility for Linux.
It is used to monitor interactions between processes and the Linux kernel, which include system calls, signal deliveries, and changes of process state.
This year strace has been extended to tamper with tracees using controllable syscall fault injection.

Видео[править | править вики-текст]

on youtube

Слайды[править | править вики-текст]

Расширенные тезисы[править | править вики-текст]

Введение[править | править вики-текст]

strace как инструмент мониторинга взаимодействия пользовательских процессов с ядром существует уже почти 25 лет и широко применяется для диагностики, отладки и изучения поведения программного обеспечения. Многочисленные параметры управления фильтрацией дают возможность пользователю strace легко и гибко настраивать отображение системных вызовов и сигналов. С каждым выпуском strace таких возможностей становится больше, а точность отображения — выше.

В этом году Nahim El Atmani, студент лаборатории LSE в École pour l'informatique et les techniques avancées (EPITA), в рамках одного из проектов GSoC 2016^[1] реализовал прототип новой функции^[2] в strace, которая принципиально отличается от всех предыдущих и открывает новые направления применения strace.

fault injection как метод тестирования[править | править вики-текст]

Как тестировать обработку программой нетривиально воспроизводимых ситуаций вообще, и особенно ошибок, которые не происходят во время тестирования? Например, можно искусственным образом создавать у программы представление о том, что тестируемое условие произошло. Но как это сделать, не внося изменений в тестируемую программу? Можно попробовать изменять поведение системных вызовов, например, с помощью strace!

strace и системные вызовы[править | править вики-текст]

strace отслеживает системные вызовы, выполняемые подопечными процессами, с помощью системных вызовов ptrace и wait4. ptrace-запросами PTRACE_SYSCALL strace поручает ядру останавливать трассируемые процессы при выполнении ими системных вызовов. Эти процессы на входе в любой системный вызов переводятся ядром в состояние syscall-enter-stop, а на выходе из любого системного вызова — в состояние syscall-exit-stop. Об изменении состояния процессов ядро оповещает strace, ожидающий событий в wait4.

strace всякий раз, обнаруживая трассируемый процесс в состоянии syscall-enter-stop, выясняет номер и параметры системного вызова, после чего применяет фильтры, которые на основе этой информации формируют решение о том, отображать ли этот системный вызов. Если системный вызов подлежит отображению, выполняется соответствующий парсер, который, согласно настройкам и семантике этого системного вызова, отображает его надлежащим образом. Обработав состояние syscall-enter-stop, strace даёт ядру запрос PTRACE_SYSCALL, после которого ядро продолжает выполнять приостановленный системный вызов до состояния syscall-exit-stop. Обнаружив трассируемый процесс в этом состоянии, strace при необходимости выясняет и отображает код возврата и, возможно, другие результаты работы системного вызова. Обработав состояние syscall-exit-stop, strace снова даёт ядру запрос PTRACE_SYSCALL, после которого трассируемый процесс продолжает работу до следующего системного вызова.

fault injection системных вызовов[править | править вики-текст]

ptrace API позволяет не только считывать номер, параметры и код возврата системного вызова, но и менять их. Например, путём замены номера системного вызова в состоянии syscall-enter-stop на происходит замена системного вызова на заведомо несуществующий, а замена кода возврата системного вызова в состоянии syscall-exit-stop приводит к установке произвольного кода возврата.

Реализованный в strace интерфейс позволяет осуществлять fault injection произвольного множества системных вызовов, как всех подряд, так и выборочно, например, только -й вызов системного вызова, каждый -й вызов и т.п. В сочетании с традиционным фильтром по имени файла можно осуществлять fault injection системных вызовов, прямо или косвенно оперирующих определёнными файлами.

Первые находки[править | править вики-текст]

Экспериментальные запуски strace в режиме syscall fault injection сразу выявили проблемы с обработкой ошибок в разных программах. Например, python3 не обрабатывает ошибку доступа к устройству /dev/urandom:

    $ strace -P /dev/urandom -e fault=open:1:ENOENT python3
    open("/dev/urandom", O_RDONLY|O_CLOEXEC) = -1 ENOENT (No such file or directory) (INJECTED)
    Fatal Python error: Failed to open /dev/urandom
    --- SIGSEGV {si_signo=SIGSEGV, si_code=SEGV_MAPERR, si_addr=0x50} ---
    +++ killed by SIGSEGV +++
    Segmentation fault

Еще один пример показывает, что динамический загрузчик не всегда проверяет код возврата системного вызова mprotect:

    $ strace -e mprotect -e fault=mprotect:1:EPERM pwd > /dev/null
    mprotect(0x7fabcd00f000, 2097152, PROT_NONE) = -1 EPERM (Operation not permitted) (INJECTED)
    mprotect(0x7fabcd20f000, 16384, PROT_READ) = 0
    mprotect(0x606000, 4096, PROT_READ)     = 0
    mprotect(0x7fabcd441000, 4096, PROT_READ) = 0
    +++ exited with 0 +++
    $ strace -e mprotect -e fault=mprotect:2:EPERM pwd > /dev/null
    mprotect(0x7fabcd00f000, 2097152, PROT_NONE) = 0
    mprotect(0x7fabcd20f000, 16384, PROT_READ) = -1 EPERM (Operation not permitted) (INJECTED)
    pwd: error while loading shared libraries: /lib64/libc.so.6: cannot apply additional memory
    protection after relocation: Operation not permitted
    +++ exited with 127 +++

Что дальше?[править | править вики-текст]

Продолжением и расширением функции syscall fault injection могла бы стать функция syscall success injection. Тот же приём, который был использован для реализации fault injection, годится и для создания видимости успешного завершения системного вызова. Основная сложность в реализации success injection — сохранение семантики системных вызовов, результатами работы которых является не только код возврата, но и, например, запись определённых адресов оперативной памяти.

Область применения strace syscall fault injection — не только расширение тестового покрытия и поиск ошибок. Например, с помощью этой функции непривилегированный пользователь может легко организовать временное блокирование отдельных системных вызовов и обращений к отдельным файлам у определённых процессов, не прибегая к написанию seccomp filters.

Примечания и отзывы[править | править вики-текст]

↑ Google Summer of Code: strace — summerofcode.withgoogle.com/organizations/5106770607341568
↑ strace syscall fault injection — brokenpi.pe/tools/strace-fault-injection

Can strace make you fail? (Дмитрий Левин, OSSDEVCONF-2016)!.jpg

Plays:363 Comments:0

[gsoc-1] Google Summer of Code: strace — summerofcode.withgoogle.com/organizations/5106770607341568

[nahim-2] strace syscall fault injection — brokenpi.pe/tools/strace-fault-injection

[1]

[2]