L'utilisation de sigma, également connue sous le nom d'écart-type, peut prêter à confusion. Cependant, c'est un excellent outil pour analyser n'importe quel ensemble de données. L'utilisation de limites de contrôle à deux sigma peut être bénéfique pour votre analyse en découpant les données dont vous n'avez pas besoin et en vous limitant aux données pertinentes dont vous disposez. Mieux encore, étant donné que la théorie derrière les limites de contrôle est basée sur l'écart type, les calculs sont très peu impliqués.
Déviation standard
Les mesures Sigma de tout type sont basées sur l’écart type d’une série de nombres. L'écart type est une mesure de la variabilité au sein d'un ensemble de chiffres. Un ensemble de données avec une petite différence entre les nombres aura un petit écart-type, tandis qu'un ensemble de données avec toutes sortes de nombres différents aura un écart-type plus élevé. L'écart type d'un ensemble de nombres est représenté par le caractère grec sigma, d'où proviennent les termes tels que deux-sigma, trois-sigma et six-sigma.
Distribution normale
L'utilisation de l'écart type dépend en grande partie d'une distribution normale, ce qui signifie que les nombres contenus dans l'ensemble de données sont relativement compressés. La plupart des chiffres se situent assez près de la moyenne, quelques données aberrantes faussant les données. Si la distribution d'un ensemble de données n'est pas normale, l'analyse à l'aide de l'écart type ne fonctionne pas. Toutefois, si le jeu de données entre dans la distribution normale, vous pouvez en apprendre beaucoup sur les données en utilisant l'écart type.
Deux-Sigma
La distribution normale montre comment les nombres vont tomber en fonction de l'écart type de l'ensemble de données. Les règles de la distribution normale dictent que 68% des nombres entrent dans un écart-type de la moyenne, également appelé moyenne de tous les nombres de l'ensemble de données. L'ajout d'écarts-types à l'équation signifie que plus de nombres sont inclus; En utilisant la distribution normale, 95% de toutes les données se situent à moins de deux écarts-types de la moyenne. Ce 95% est un intervalle de confiance très courant utilisé pour prouver des hypothèses, car il exclut les valeurs aberrantes et reste lié à la principale source de données.
Deux-Sigma en affaires
Bien que le double sigma donne un bon niveau de confiance pour l'analyse, ce n'est pas une bonne méthodologie pour la production. Si les limites de contrôle de tout processus de production se situent à moins de deux écarts types de la moyenne, ce processus connaît de graves problèmes. Il dit essentiellement que sur un million d'unités produites, plus de 300 000 seront défectueuses. C'est un moyen extrêmement inefficace de produire des biens. Produire à un taux même de trois sigma ramènerait le niveau de défaut à 66 000; Bien que cela ne soit pas parfait, il est près de 500% plus efficace que de produire à deux sigma.