Impact de l'ignorance du plan d'échantillonnage dans la prédiction des résultats binaires en matière de santé par régression logistique : données probantes tirées de l'enquête démographique et sanitaire du Malawi sous
MaisonMaison > Blog > Impact de l'ignorance du plan d'échantillonnage dans la prédiction des résultats binaires en matière de santé par régression logistique : données probantes tirées de l'enquête démographique et sanitaire du Malawi sous

Impact de l'ignorance du plan d'échantillonnage dans la prédiction des résultats binaires en matière de santé par régression logistique : données probantes tirées de l'enquête démographique et sanitaire du Malawi sous

Jan 23, 2024

BMC Public Health volume 23, Numéro d'article : 1674 (2023) Citer cet article

1 Altmétrique

Détails des métriques

Les taux de natalité et de mortalité d’une population comptent parmi les statistiques vitales cruciales pour la planification des politiques socio-économiques de tout pays. Le taux de mortalité des moins de cinq ans étant l’un des indicateurs permettant de suivre l’état de santé d’une population, il nécessite une estimation régulière et précise. Les données des enquêtes nationales démographiques et sanitaires, facilement accessibles au public, sont devenues un moyen de répondre à la plupart des questions liées à la santé des populations africaines, en utilisant des méthodes statistiques pertinentes. Cependant, bon nombre de ces applications ont tendance à ignorer l’effet du plan d’enquête dans les estimations, malgré la disponibilité d’outils statistiques qui soutiennent les analyses. On sait peu de choses sur la quantité d’informations inexactes générées lors de la prévision des taux de mortalité des moins de cinq ans. Cette étude estime et compare les biais rencontrés lors de l'application de méthodes de régression logistique non pondérées et pondérées pour prédire le taux de mortalité des moins de cinq ans au Malawi à l'aide de données d'enquête à l'échelle nationale. Les données des enquêtes démographiques et sanitaires du Malawi de 2004, 2010 et 2015-16 ont été utilisées pour déterminer le biais. Les analyses ont été réalisées dans le logiciel R version 3.6.3 et Stata version 12.0. Un modèle de régression logistique incluant divers facteurs bio- et socio-démographiques concernant l'enfant, la mère et les ménages a été utilisé pour estimer le taux de mortalité des moins de cinq ans. Les résultats ont montré que l’exactitude de la prévision du taux national de mortalité des moins de cinq ans dépend de la pondération par grappe de la probabilité globale prévue de décès d’enfants, que le modèle soit pondéré ou non. La pondération du modèle a provoqué de légers changements positifs et négatifs dans diverses estimations à effets fixes, ce qui a diffusé le résultat de la pondération dans les probabilités de décès ajustées. À son tour, il n’y avait aucune différence entre le taux de mortalité global prévu obtenu à l’aide du modèle pondéré et celui obtenu dans le modèle non pondéré. Nous recommandons de prendre en compte les pondérations des grappes d’enquête lors du calcul de la probabilité globale prédite d’événements pour un résultat binaire en matière de santé. Cela peut être fait sans se soucier des poids lors de l'ajustement du modèle, dont le but est de prédire le paramètre de population.

Rapports d'examen par les pairs

Le taux de mortalité des enfants âgés de zéro à cinquante-neuf mois est un indicateur utile pour suivre les objectifs de santé nationaux et mondiaux [1, 16, 32]. Par conséquent, l’estimation du nombre total de décès observés dans la tranche d’âge des moins de cinq ans nécessite des techniques robustes et fiables, afin d’obtenir une approximation précise pour les décisions politiques [13, 16]. Il a été rapporté qu'il existe un faible enregistrement des systèmes vitaux et des taux élevés de sous-déclaration des décès dans les établissements de santé des pays d'Afrique subsaharienne [23, 28, 55]. La plupart des estimations du taux de mortalité des moins de cinq ans dans la région sont basées sur des informations recueillies à partir d'enquêtes nationales, telles que les données des enquêtes démographiques et sanitaires (EDS) [21, 22, 42, 46]. C’est ce qui nécessite le recours à des analyses statistiques basées sur le plan d’enquête, telles que les poids d’échantillonnage, pour obtenir des estimations précises [5, 19, 20, 40, 44, 53]. Un poids d'échantillon est l'inverse de la probabilité qu'un sujet soit inclus dans l'échantillon. Cela indique le nombre de sujets dans la population que représente chaque unité échantillonnée. Au cours de l'analyse de régression, le poids du sujet est introduit comme une fonctionnelle des covariables dans le modèle appliqué aux données d'enquête, pour compenser l'utilisation d'inclusions inégales dans l'échantillon, la non-réponse et le sous-couverture de la base d'échantillonnage [7, 11 , 36, 42, 50, 57].

Cependant, l’effet du plan d’enquête est ignoré dans la plupart des applications des méthodes de régression utilisées pour estimer le taux de mortalité des moins de cinq ans en Afrique subsaharienne, ce qui fausse potentiellement les estimations et les prévisions [18, 41, 43, 52]. Ce problème s’est également avéré vrai pour d’autres études analysant les résultats binaires en matière de santé en dehors de la mortalité. Par exemple, la présence ou l'absence de diabète [48], de diarrhée [33], de schistosomiase [14, 31] et de paludisme [29], entre autres maladies chez les patients. Cette tendance pourrait refléter l’absence d’études démontrant l’utilisation technique des plans d’enquête lors de l’application de méthodes de régression à des données binaires sur la santé. Cela pourrait également être dû au fait que la plupart des études examinées visaient à identifier les facteurs de risque des problèmes de santé concernés, plutôt que de prédire l'étendue de la condition physique elle-même, ce qui pourrait être atteint dans la population de quelque manière que ce soit [9, 17, 54]. Il existe peu de littérature sur le biais que l’on pourrait commettre si le taux national de mortalité des moins de cinq ans ou d’autres données binaires sur la santé étaient prédits à partir d’une vaste enquête nationale sans tenir compte de l’effet de plan. La présente étude estime donc le biais qu'un chercheur pourrait commettre lors de la prévision du taux de mortalité des moins de cinq ans à l'aide de méthodes de régression logistique pondérées et non pondérées. Un biais dans l’estimation du taux de mortalité des moins de cinq ans est l’écart entre le taux estimé au moyen d’échantillons aléatoires et le taux réel rapporté dans les observations de routine. On pourrait s’attendre à ce que la différence entre les deux valeurs soit nulle, auquel cas l’estimateur appliqué aux données d’enquête est dit sans biais [39]. La présente étude utilise trois ensembles de données récents d'enquêtes démographiques et sanitaires (EDS) au Malawi pour les années 2004, 2010 et 2015-16 et les taux de mortalité officiels des moins de cinq ans rapportés par les EDS respectives pour calculer le biais. Différentes tailles d'échantillon de chaque ensemble de données DHS sont utilisées, afin de tenir compte de l'effet de la taille de l'échantillon dans l'estimation du biais.