4.1. Стратегии тестирования
Целью тестирования является обнаружение ошибок в программе.
Тестирование программного обеспечения охватывает целый ряд видов деятельности, аналогичных последовательности процессов разработки программного обеспечения. В него входят:
- постановка задачи для теста,
- проектирование теста,
- написание тестов,
- тестирование тестов,
- выполнение тестов,
- изучение результатов тестирования.
Решающую роль играет проектирование тестов. Возможен целый ряд подходов к стратегии проектирования тестов. Чтобы ориентироваться в них, рассмотрим два крайних подхода. Первый состоит в том, что тесты проектируются на основе внешних спецификаций программ и модулей, либо спецификаций сопряжения программы или модуля. Программа при этом рассматривается как черный ящик (стратегия «черного ящика»). Суть такого подхода – проверить, соответствует ли программа внешним спецификациям. При этом логика модуля совершенно не принимается во внимание.
Второй подход основан на анализе логики программы (стратегия «белого ящика»). Суть подхода – в проверке каждого пути, каждой ветви алгоритма. При этом внешняя спецификация во внимание не принимается.
Альтернатива «черный ящик» – «белый ящик» является достаточно общей, что подтверждается ее применением не только при тестировании, но, например, в альтернативных направлениях исследований в области искусственного интеллекта (ИИ).
В этой области сторонники одной точки зрения («черный ящик») убеждены, что важно совпадение поведения искусственно созданных и естественных интеллектуальных систем, а внутренние механизмы формирования поведения разработчик ИИ вовсе не обязан копировать. Это направление ИИ называют машинным интеллектом.
Другая точка зрения («белый ящик») – изучение механизмов естественного мышления и анализ данных о способах формирования разумного поведения человека является основой построения ИИ. Это направление получило название искусственного разума.
Ярким представителем первого направления является «Deep Blue», которую «научили» игре в шахматы на уровне (а может быть и выше) мировых гроссмейстеров. Представителями второго направления являются нейрокомпьютеры.
Ни один из этих подходов не является оптимальным. Из анализа существа первого подхода ясно, что его реализация сводится к проверке всех возможных комбинаций значений на входе программы. Рассмотрим в качестве примера задачу тестирования тривиальной программы, получающей на входе три числа и вычисляющей их среднее арифметическое. Тестирование этой программы для всех значений входных данных невозможно, так как их бесконечное множество. Как правило, исчерпывающее тестирование для всех входных данных программы неосуществимо, поэтому ограничиваются меньшим. При этом исходят из максимальной отдачи теста по сравнению с затратами на его создание. Она измеряется вероятностью того, что тест выявит ошибки, если они имеются в программе. Затраты измеряются временем и стоимостью подготовки, выполнения и проверки результатов теста.
Проанализируем теперь второй подход к тестированию. На рис. 17 изображены возможные пути небольшого программного модуля. Квадратами представлены последовательные сегменты, а стрелками – передачи управления (с помощью развилок или циклов). Число путей в модуле имеет порядок (для сравнения, возраст вселенной в секундах оценивается как 4´). Но даже если предположить, что выполнены тесты для всех путей, можно утверждать, что модуль удовлетворительно не протестирован.
Очевидное основание этого утверждения состоит в том, что выполнение всех путей не гарантирует соответствия программы ее спецификациям. Допустим, если требовалось написать программу для вычисления кубического корня, а программа фактически вычисляет корень квадратный, то программа будет совершенно неправильной, даже если проверить все пути. Вторая проблема – отсутствующие пути. Если программа реализует спецификации не полностью (например, отсутствует такая специализированная функция, как проверка на отрицательное значение входных данных программы вычисления квадратного корня), никакое тестирование существующих путей не выявит такой ошибки. И, наконец, проблема зависимости результатов тестирования от входных данных. Путь может правильно выполняться для одних данных и неправильно для других. Например, если для определения равенства 3 чисел программируется выражение вида:
IF (A+B+C)/3=A,
то оно будет верным не для всех значений A, B и С (ошибка возникает в том случае, когда из двух значений В или С одно больше, а другое на столько же меньше А). Если концентрировать внимание только на тестировании путей, нет гарантии, что эта ошибка будет выявлена.
Таким образом, полное тестирование программы невозможно. Тест для любой программы будет обязательно неполным, то есть тестирование не гарантирует отсутствие всех ошибок. Стратегия проектирования тестов заключается в том, чтобы попытаться уменьшить эту неполноту насколько это возможно. При этом ключевым вопросом является следующий: какое подмножество всех возможных тестов имеет наивысшую вероятность обнаружения ошибок при ограниченных времени, трудовых затратах, стоимости, машинном времени и т.п.
Наихудшей из всех методологий является случайный набор тестов, так как он имеет малую вероятность быть оптимальным.
Рекомендуется следующая процедура разработки тестов:
- разрабатывать тесты, используя методы стратегии «черного ящика»;
- дополнительное тестирование, используя методы стратегии «белого ящика».