Event
David Haziza, Université de Montréal
Thursday, February 1, 2018 15:00to16:00
Room PK-5115 , Pavillon President-Kennedy, CA
Imputation multi-robuste pour le traitement de la non-réponse partielle pour des données d'enquête.
Dans les enquêtes, il est de coutume de distinguer la non-réponse totale de la non-réponse partielle. La première est caractérisée par une absence totale d’information sur une unité échantillonnée alors que la seconde correspond au cas où une partie des variables de l’enquête ne sont pas renseignées. Dans cette présentation, l’accent sera mis sur le traitement de la non-réponse partielle qui est habituellement traitée au moyen d’une imputation simple. Dans ce cas, une valeur manquante est remplacée par une seule valeur de remplacement, appelée valeur imputée, conduisant à la création d’un fichier de données complété. L’avantage de l’imputation simple comme méthode de traitement de la non-réponse partielle est double : (i) Elle conduit à la création d’un seul fichier de données complété, ce qui facilite le travail des utilisateurs de données. (ii) Les estimations ponctuelles après imputation peuvent être obtenues au moyen des procédures d’estimation usuelles utilisées dans un cas de données complètes. La validité des estimateurs ponctuels après imputation, appelés estimateurs imputés, dépend de la validité du modèle d’imputation sous-jacent, ce dernier étant un ensemble d’hypothèses à propos de la distribution de la variable à imputer. Si le modèle n’est pas bien spécifié, les estimateurs imputés peuvent être considérablement biaisés. On peut alors se protéger d’une mauvaise spécification du modèle au moyen de méthodes d’imputation multi-robuste qui comporte, comme cas particulier, les méthodes d’imputation doublement robustes. Dans cette présentation, ces méthodes seront discutées et je montrerai également comment estimer la variance des estimateurs imputés. Finalement, les résultats d’une étude par simulation seront présentés. Co-auteur: Sixia Chen (University of Oklahoma).