chapitre 1: Introduction

1.  Origine


L'origine du mot "statistique" remonte au latin classique status (état) qui, par une série d'évolutions successives, aboutit au français statistique, attesté pour la première fois en 1771.

latin classique

status

Etat

stato

statista

(1633)

Homme d'Etat

italien

statistica

(1672)

latin moderne

statisticus

(1771)

français

statistique


C'est vers la même époque que statistik apparaît en allemand, alors que les anglophones utilisent l'expression political arithmetic jusqu'en 1798, date à laquelle le mot statistics fait son entrée dans cette langue.


2.  Statistique et statistiques


A l'origine, cette discipline concerne donc les affaires de l'Etat.

Actuellement, on distingue généralement les statistiques (au pluriel) de la statistique (au singulier)

Les statistiques concernent l'étude méthodique des faits sociaux qui définissent un Etat, par des procédés numériques (dénombrements, inventaires, recensements,...)

Parmi les premiers ouvrages ayant trait à cet aspect, on peut mentionner "Le Détail de la France", rédigé par Boisguilbert en 1697 et en 1722, "Description de la France",dû à Pigonal de la Force

Le second sens n'apparaît que vers 1830. C'est celui qui est abordé dans ce cours. Nous définirons la statistique comme un ensemble de techniques d'interprétation mathématique appliquées à des phénomènes (ex: faits sociaux) pour lesquels une étude exhaustive de tous les facteurs est impossible à cause de leur grand nombre ou de leur complexité On appellera:

  • individu un élément individuel considéré dans l'analyse statistique

  • population l'ensemble de tous les individus considérés

  • échantillon la partie de la population soumise au test

On peut encore scinder la statistique en deux grands domaines:

  • la statistique descriptive, qui s'intéresse à la collecte et à la mise en forme des données et à la détermination d'un certain nombre de grandeurs caractéristiques de la population

  • l'inférence statistique, dont le but est de tirer des conclusions sur la population à partir de l'étude d'un échantillon

3.  Historique


De tous temps, les chefs d'Etat ont souhaité déterminer la puissance des nations qu'ils dirigeaient à l'aide de recensements partiels ou complets (population, territoire, production,...)

Dès 3000 avant J.-C., on trouve mention de collectes d'observations sur les biens et les personnes en Mésopotamie.

En 1200 avant J.-C., des évaluations de productions agricoles sont effectuées en Chine.

Au début de notre Ere a lieu un dénombrement des richesses de l'Empire Romain, mentionné dans l'Evangile de Luc.

Au Moyen Age, des relevés sont exécutés sur l'ordre de Charlemagne puis de Guillaume le Conquérant. Dans les deux cas, le but est de se faire une idée plus précise des richesses du pays.

Au XVIIe siècle, pour éviter le recensement lourd et onéreux, William Petty (1623-1687) met au point une méthode de comptage de la population de Londres sur base des proportions moyennes entre:

  • les maisons

  • les feux par maison

  • la composition des familles

Au XIXe siècle, les recensements proprement dits reprennent de l'importance et, en 1853, a lieu à Bruxelles le 1er Congrès International de Statistique, sous l'impulsion d'Adolphe Quételet (1796-1874, astronome et mathématicien belge, un des fondateurs de la science statistique).
L'objectif de ce congrès est d'uniformiser les techniques de compilation des statistiques nationales, en vue de faciliter les comparaisons.

Au début du XXe siècle, un débat oppose les partisans des recensements (réalisés sur l'ensemble de la population) et des sondages (réalisés sur un échantillon représentatif de la population).

Les recensements ne sont pas toujours possibles, ni souhaitables. Dans certains cas, ils peuvent être trop chers (comme, par exemple, des enquêtes sur toute la population d'un pays). Ils peuvent aussi contenir des erreurs. Parfois, ils sont carrément aberrants (mesurer la solidité moyenne d'un type de voiture en lançant toutes les voitures de ce type contre un mur serait commercialement inacceptable).

Pour pallier à ces inconvénients, on a recours au sondage statistique, qui consiste à


déduire les propriétés de toute
une population à partir de
l'analyse d'un échantillon.


Il est capital que l'échantillon soit choisi et analysé de manière adéquate. En particulier, il faut que l'échantillon soit représentatif de la population. Une échantillon non représentatif est dit biaisé.

L'importance du choix de l'échantillon est illustrée par le cas des votes de paille.

Au début du XXe siècle, beaucoup de journaux américains réalisent des "votes de paille" en demandant leur avis par écrit à plusieurs millions de personnes quelques semaines avant les élections.

En 1936, le Literary Digest prédit, à l'aide d'un échantillon de 2.400.000 électeurs, la victoire du candidat républicain N. Landon.

George Gallup, grâce à un sondage sur 4000 personnes judicieusement choisies, prévoit la victoire du démocrate Franklin D. Roosevelt.

La victoire de ce dernier sonne le glas des votes de paille dont les échantillons sont souvent biaisés (les cartes du Literary Digest avaient été envoyées aux abonnés du téléphone et aux propriétaires de voitures; cet électorat aisé était plus favorable aux républicains).



Chapitre:       1       2       3       4       5       6       7