Шесть сигм: Этап анализа

Шесть сигм: Этап анализа

Философия "Шести сигм" опирается на статистические факты. Здесь нет места ошибкам, а значит, нет места догадкам и суждениям. Поэтому те несколько входов, которые были признаны критическими на предыдущих этапах определения и измерения, теперь должны быть подтверждены статистическим анализом.

Цель модуля анализа состоит из двух этапов:

  1. Подтвердить влияние критических входов на выход, который является критическим для качества.

  2. Убедиться, что критические входы зарегистрированы на уровне, пригодном для действий, т. е. имеется достаточно информации об этих входах, чтобы принять меры на более позднем этапе.

Подход, используемый на этапе анализа

До внедрения Шести сигм в бизнес общепринятой практикой было наличие бизнес-проблемы, а затем быстрое начало работы над ее решением. Однако в методологии Шести сигм подход ориентирован на процесс и основан на данных.

Подход заключается в том, чтобы сначала преобразовать бизнес-проблему в статистическую задачу. Данные, собранные на этапе измерений, затем используются для решения этой статистической проблемы и получения статистического заключения. Этот статистический вывод определяет соответствующий план действий, который затем реализуется под пристальным контролем.

Входные данные для фазы анализа

Фаза анализа получает исходные данные в виде идентификации нескольких критических входов для улучшаемого процесса. Например, если улучшается процесс обслуживания автомобилей, то критически важными исходными данными, которые могут попасть на этап анализа, могут быть техническая квалификация работников, место обслуживания, время, необходимое для обслуживания, и так далее. Эта информация выступает в качестве исходных данных. Однако в качестве исходных данных должен выступать не только этот список. Профессионалы Шести сигм могут лишь просматривать такие списки. Для каждого входа, который был классифицирован как критический, также должны быть доступны измерения, полученные в ходе выполнения процесса. Это позволит команде "Шесть сигм" статистически доказать, какие входы являются критическими.

Результаты фазы анализа

Именно тщательный методический подход, используемый "Шестью Сигмами" при выявлении проблем, делает ее более успешной, чем любой другой инструмент качества. Опора на факты - главная особенность фазы "Анализ", а также методологии "Шесть сигм".

Виды анализа на этапе анализа

Фаза анализа – одна из самых "страшных" фаз в методологии "Шесть сигм". Принято считать, что эта фаза включает в себя множество статистических анализов высокого уровня. Неудивительно, что большинство тренингов запланировано до фазы анализа. Члены команды Шести сигм хотят освежить свои знания, прежде чем приступать к работе и пачкать руки.

Однако на самом деле статистика занимает главное место. Статистический анализ – это лишь последний этап серии анализов. Трудно переоценить его значение, потому что методология Шести сигм фокусируется на проверяемых фактах, а статистика может эмпирически подтвердить утверждение и сделать из факта мнение. Ниже мы рассмотрим различные виды анализа, которые проводятся за кулисами.

Анализ карты процесса: Почти всегда фаза "Анализ" начинается с изучения подробной карты процесса. Карта процесса анализируется, и составляется полный список узких мест, а также видов деятельности, приводящих к образованию отходов. Это дает команде четкое представление о том, где на самом деле кроются их проблемы в рамках процесса.

Графический анализ: На следующем этапе обычно используются инструменты и методики, связанные с этапом анализа. Большинство этих инструментов позволяют получить графический результат. Следующим шагом в этом процессе является внимательное изучение графиков узких мест и отходов, определенных в результате анализа карты процесса. Это делается потому, что непосредственное проведение статистического анализа может оказаться дорогостоящим мероприятием, поскольку требует привлечения большого количества людей и сбора обширных данных.

Статистический анализ: Только после того, как появляется достаточное количество доказательств того, что команда Шести сигм использовала предварительный анализ для выявления важных проблем, проводится статистический анализ.

Пример: Команда проекта "Шесть сигм" пытается провести фазу анализа процесса. Даже если на предыдущем этапе были определены несколько важных входов, между данными могут существовать сотни взаимосвязей. Как проектная группа Шести сигм узнает, какие взаимосвязи являются значимыми и должны быть выдвинуты в качестве гипотезы? Ни у одной компании нет ресурсов, чтобы тратить их на проверку всех возможных гипотез.

В таких случаях на помощь приходит предварительный анализ. Команде Шести сигм требуется определенный опыт и здравый смысл, чтобы выявить проблемы бизнеса. Затем эти проблемы преобразуются в статистические задачи, и решение находится в соответствии с фактологическим характером методологии "Шесть сигм".

Что такое проверка гипотез?

Проверка гипотез – это один из статистических методов, используемых для подтверждения влияния нескольких критических входных данных на выходные. Проверка гипотез должна использоваться, когда входы измеряются дискретно. Выходы могут быть дискретными или непрерывными. Однако входы должны быть дискретными. Если входы непрерывны, то можно использовать корреляционное и регрессионное тестирование.

Логика нулевой и альтернативной гипотез

При проверке любой гипотезы всегда есть две гипотезы – нулевая и альтернативная. Проверка нулевой гипотезы показывает отсутствие связи между образцами, в то время как альтернативный тест допускает существование связи. Таким образом, при проверке гипотез рассматриваются обе возможности. Статистическим путем принимается решение о том, какая из двух гипотез верна.

Нулевая гипотеза

Само название подразумевает "ноль". Таким образом, нулевая гипотеза подразумевает отсутствие взаимосвязи между измеряемыми параметрами. Нулевая гипотеза утверждает, что в измеряемых выборках нет существенной разницы.

Например, возьмем выборку людей, обслуживающихся в отделении A банка, и клиентов, обслуживающихся в отделении B банка, и уровень обслуживания – измеряемый параметр. Нулевая гипотеза будет утверждать, что между уровнями обслуживания в филиале А и филиале Б нет статистически значимой разницы.

Аналогичным образом нулевая гипотеза может быть сформулирована для нескольких филиалов. Она может гласить, что нет статистически значимой разницы в уровнях обслуживания в филиалах A, B, C, D и E.

Альтернативная гипотеза

Альтернативная гипотеза по своему определению противоположна нулевой гипотезе. Мы никогда не выбираем альтернативную гипотезу. Когда мы отвергаем нулевую гипотезу, автоматически выбирается альтернативная гипотеза. Существуют различные типы гипотез, например:

Направленная: Направленная альтернативная гипотеза четко определяет тип связи между рассматриваемыми переменными. Например, в направленной альтернативной гипотезе будет чётко указано, что уровень обслуживания в филиале А выше, чем уровень обслуживания в филиале Б, т. е. филиал А > филиал Б. В ней также может использоваться знак "меньше, чем".

Ненаправленная: Ненаправленная гипотеза просто утверждает, что между измеряемыми выборками существует статистически значимая разница. Она не говорит нам, лучше ли уровень обслуживания в A или лучше в B. Она просто говорит нам, что они отличаются.

Важно понимать, в каком виде должна быть записана альтернативная гипотеза – направленном или ненаправленном. Это связано с тем, что статистические тесты, используемые на заднем плане, существенно меняются.

Правильная формулировка проблемы, возможно, играет самую важную роль для специалиста проекта "Шесть сигм" на этапе анализа. Это связано с тем, что существуют инструменты, которые могут автоматически решить проблему, но только после того, как она будет правильно сформулирована.

Выбор правильного теста гипотез

Проверка гипотез – очень подробная тема. Понимание того, как правильно проводить эти тесты, выходит за рамки этой статьи и даже самой методологии "Шесть сигм". Однако, поскольку предполагается, что команда проекта "Шесть сигм" будет применять эти тесты для выявления фактов, которые затем будут использоваться для принятия решений, базовое понимание важно.

Одно из самых основных решений, которое необходимо принять при проведении проверки гипотез, – какой тип проверки гипотез следует провести. В этой статье я расскажу о критериях, на которых должно основываться это решение.

Один хвост против двух хвостов: Прежде всего необходимо решить, будет ли тест однохвостым или двуххвостым. Статистические определения тестов с одним и двумя хвостами довольно сложны. Поэтому объяснение на примере должно послужить этой цели.

Предположим, что мы сравниваем различия между средним временем обработки в двух разных колл-центрах. Тест с двумя хвостами проверит, есть ли значительная статистическая разница в измеряемых выборках. Это означает, что если один из образцов значительно выше или значительно ниже другого, то разница будет доказана. Таким образом, в двухвостом тесте нас интересуют различия, возникающие с обеих сторон.

Однако в случае с тестом с одним хвостом нам сначала нужно решить, хотим ли мы провести сравнение с помощью теста с верхним хвостом или с нижним хвостом. В тесте с верхним хвостом проверяется, значительно ли один из образцов выше другого. Если образец имеет меньшее значение, будет выбрана нулевая гипотеза и различия не будут доказаны. Полная противоположность этому – тест с нижним хвостом, где нулевая гипотеза будет отвергнута только в том случае, если один из образцов заметно ниже другого.

Критерии принятия решений

Кроме того, есть три простых критерия принятия решения, на которых основывается выбор правильного теста гипотезы. Они следующие:

Количество тестируемых групп: Существуют различные тесты гипотез, если необходимо проверить статистическую разницу для трёх выборок и для двух выборок. Уточнение количества различных выборок будет первым шагом в выборе правильного теста.

Является ли Y дискретным или непрерывным: Существуют различные тесты гипотез для дискретных и непрерывных переменных.

Сравниваемый параметр популяции: Существуют различные тесты гипотез для средних, медианных, стандартных отклонений и даже параметров популяции. В зависимости от того, что именно оценивается на предмет различий, могут использоваться разные тесты.

Частые ошибки при проверке гипотез

Проверка гипотез – это статистический анализ. Он зависит от данных, которые были собраны на этапе измерения. Проверка также зависит от того, что несколько критических входных данных, возможно, были определены неверно. Элемент случайности все еще присутствует. Остается вероятность того, что может быть допущена ошибка и вывод, сделанный после проверки гипотезы, окажется недействительным. 

Метод проверки гипотез учитывает это. Поэтому специалистам проекта "Шесть сигм" приходится выбирать между двумя возможными типами ошибок, которые могут быть допущены. По сути, это компромисс: если вы пытаетесь защитить себя от одной ошибки, вы подвергаете себя риску другой. В некоторых ситуациях лучше быть подверженным одной ошибке, чем другой. Вот объяснение:

Два типа ошибок

Альфа-ошибка

Альфа-ошибка – это риск заявить, что существует определенный вход, который является частью нескольких жизненно важных входов, в то время как на самом деле это не так. Примером может служить утверждение, что расположение филиала A делает его обслуживание лучше, чем в филиале B, когда на самом деле расположение может вообще не быть важным фактором, определяющим обслуживание.

Этой ошибки можно избежать, увеличив уровень доверия к гипотезе. Но в этом случае есть риск возникновения бета-ошибки, т. е. пропуска жизненно важного фактора.

Бета-ошибка

Бета-ошибка – это риск утверждения, что существует определенный вход, который не является частью нескольких жизненно важных входов, в то время как на самом деле он есть. Примером может служить неупоминание местоположения как важного фактора обслуживания в филиале A, в то время как на самом деле именно местоположение может быть причиной отличного обслуживания.

Этой ошибки можно избежать, уменьшив уровень доверия к гипотезе. Однако в этом случае возникает риск ошибки Альфа, т. е. ошибочного рассмотрения входных данных как жизненно важных.

Выбор ошибки

Как Альфа, так и Бета-ошибки связаны друг с другом. Попытка избежать одной ошибки приводит к другой. Поэтому специалисты, практикующие "Шесть сигм", должны понимать цену совершения обеих ошибок и выбирать ту ошибку, которую они предпочтут совершить. Поскольку невозможно быть совершенными во всём, мы должны найти способ ошибаться реже.

P-значение при проверке гипотез – интерпретация статистического вывода

P-значение – это статистическое представление вероятности того, что нулевая гипотеза верна. Таким образом, P-значение – это вероятность того, что выходной результат (Y) не изменится в результате вариации, которую мы намеренно вводим во входной сигнал (X).

Пример: Если у нас есть нулевая гипотеза, утверждающая, что не существует статистически значимой связи между эффективностью рабочих на фабрике в Красноярске и на фабрике в Сызрани, то значение P указывает на вероятность этого утверждения.

Если мы скажем, что для проверки следующей гипотезы мы присваиваем P-значение 0,05. Это означает, что мы утверждаем, что в 95 случаях из 100 эффективность не будет отличаться. Поэтому мы допускаем, что в 5% случаев они могут быть разными. В этом случае нулевая гипотеза будет отвергнута, только если мы докажем, что различия в эффективности возникают, скажем, в 7% случаев.

Определите релевантное значение P

P-значение – важная часть проблемы гипотезы. Небольшое изменение P-значения может изменить то, какая гипотеза будет выбрана, а какая отвергнута. Поэтому выбор P-значения должен быть тщательным. Существуют различные типы ошибок, связанных с выбором неправильного значения P. Эти ошибки описаны далее. Руководство должно решить, какую ошибку оно может позволить себе совершить, прежде чем выбрать P-значение.

Связь между P-значением и доверительным интервалом

Значение P-Value и доверительный интервал взаимосвязаны. Фактически, если у вас есть значение одного из них, вы можете автоматически вывести значение другого. В формуле используется значение P = 1 - доверительный интервал. Поэтому для P-значения 0,05 доверительный интервал равен 0,95 или 95%.

Что НЕ означает вывод?

Статистические выводы нельзя воспринимать буквально. Необходимо тщательно разобраться в их интерпретации, прежде чем принимать решения, основанные на них. Например, выше мы заявили, что нулевая гипотеза верна в 95% случаев. Значит ли это, что если бы мы сразу провели 100 экспериментов, то нулевая гипотеза подтвердилась бы 95 раз или больше? На самом деле, нет.

Хотя в идеале именно так и должно происходить, весь предмет статистики основан на законе больших чисел. Это означает, что проверить правильность этих выводов можно только после 1000 испытаний. Когда число достаточно велико, 95% окажутся верными!