Comment calculer la précision des données

Table des matières:

Anonim

La précision des données est l’une des considérations les plus importantes lors de la réalisation d’analyses scientifiques ou statistiques. Généralement confondue avec le concept tout aussi important d’exactitude, l’analogie du jeu de fléchettes élaborée par l’Université d’Hawaï montre bien la relation: des points de données précis atteignent les résultats escomptés, tandis que des points de résultats attendus. Selon le Dartmouth College, la précision est une mesure de la reproductibilité d'un ensemble de résultats. La précision dans les ensembles de données est un concept important même dans les projets liés à la technologie, comme l'ont montré Kenneth E. Foote et Donald J. Huebner de l'Université du Texas à Austin dans une analyse des systèmes d'information géographique. Le calcul de la précision est un exercice assez simple mais quelque peu subjectif.

Articles dont vous aurez besoin

  • Représentation graphique d'un ensemble de données

  • Informations sur les unités pertinentes exprimées dans les données

  • Marge d'erreur minimale admissible dans l'expérience

Développer une représentation visuelle des points de données tels qu'un nuage de points. Une représentation visuelle très simple consiste à tracer les valeurs des variables dépendantes et indépendantes correspondantes pour chaque point de données sur un système de coordonnées cartésien.

Évaluez les regroupements de points de données et recherchez des modèles. Des données précises se manifestent dans des grappes de points de données, indiquant que des variables d'entrée similaires sont en corrélation avec des variables de sortie similaires.

Appliquez des informations sur les unités de mesure utilisées pour collecter les données afin de déterminer l'espacement moyen entre les points de données. Une simple mesure de règle peut être utilisée pour déterminer la distance entre les points du graphique, puis convertie à l'aide d'une échelle commode et arbitraire qui correspond aux unités de mesure utilisées pour générer les points de données. Cela permettra de calculer la précision des points de données les uns par rapport aux autres en prenant la moyenne des distances.

Comparez la marge d'erreur minimale permise dans l'expérience et la précision moyenne des points de données pour déterminer la précision globale relative de l'expérience. Différents types d'expériences auront une tolérance d'erreur plus ou moins grande: un projet d'ingénierie nécessitera probablement une précision allant jusqu'à de très petites unités, tandis qu'une expérience sociale tolérera probablement davantage de variance.

Conseils

  • Essayez d'évaluer l'échelle des unités probables avant de créer la représentation graphique des points de données. Cela facilitera l’évaluation visuelle de la précision afin d’identifier les zones particulièrement précises ou imprécises.

    Des schémas clairs de données apparaissant sur une représentation visuelle sont très révélateurs de la précision et de la répétabilité d'une expérience. Une expérimentation continue devrait ajouter d'autres points de données dans des groupes précis proches de ceux déjà existants.

Attention

Ne confondez pas précision avec précision. Si l'objectif d'une expérience est d'obtenir une valeur de sortie moyenne égale à donnée pour toutes les entrées, et que ceci est obtenu avec des valeurs moyennes comprises entre -12 et 14, il est peu probable que cette mesure soit précise, bien qu'elle puisse être exacte. Une mesure précise pourrait aboutir à un regroupement de tous les points de données autour de 17, ce qui serait inexact, mais précis et donc prévisible.