Accueil > R - Généralités > Nombre de sujets

Nombre de sujets

samedi 13 novembre 2021, par Philippe MICHEL

La première question à se poser & des calculs pas toujours si simples. Les équations de base & surtout les commandes R adaptées.

Le plus drôle dans ce genre de calculs c’est que toutes ces formules donnent des résultats très précis :« Il vous faut 258 sujets dans chaque bras » mais qu’elles se basent sur une approximation pifométrique de toute beauté : « Bof ! à vu de nez on va avoir une réduction du risque de 4 % à la louche... » C’est probablement pour ça que tout le monde bloque sur ces calculs de puissance en arrivant pas à intégrer dans une belle formule mathématique un chiffre sorti de l’air du temps. Je vais quand même faire ici un aide mémoire avec le maximum de formules pour tous les cas de figures que je connais. Plusieurs librairies existent dans R pour faire ce genre de calcul. Je vous conseille la librairie Hmisc sauf pour les comparaisons de moyennes où epicalc marche très bien.
\Delta représente l’écart estimé entre les deux groupes (C’est la fameuse variable pifométrique) Dans tous les exemples je prendrai un risque alpha à 5% & un risque béta à 20 % soit une puissance de 80 %. Les formules sont données, sauf indication contraire, pour un test bilatéral. Il est possible que l’application de la formule donnée en exemple ne donne pas exactement le même résultat que la fonction R. je donne la formule la plus classique voire scolaire contrairement aux développeurs R qui utilisent souvent des calculs beaucoup plus savants.

Comparaison de deux moyennes

Un cas simple pour commencer. On utilise la loi normale donc n>30. En dessous de ce seuil vous pouvez utiliser la loi de Student mais en estimant les ddl puis après le calcul on affine l’estimation des ddl etc.

**Effectifs équilibrés

n_a=n_b

n=2\frac{\sigma^2}{\Delta^2}(z_{1-\alpha/2}+z_{1-\beta})^2

**Effectifs déséquilibrés

n_a=\frac{k+1}{k}\frac{\sigma^2}{\Delta^2}(z_{1-\alpha/2}+z_{1-\beta})^2

n_a : nb de sujets dans le groupe a n_b=k.n_a

Pourcentages

Là aussi il y a plusieurs solutions. Je donne ici la plus classique qui n’est que l’utilisation basique du calcul d’un intervalle de confiance sur une loi de Bernoulli. une autre solution par exemple serait d’utiliser une loi normale après transformation angulaire.

**Effectifs équilibrés

n_a=n_b

n=\frac{\pi_a(1-\pi_a)+(\pi_b(1-\pi_b)}{\Delta^2}(z_{1-\alpha/2}+z_{1-\beta})^2

**Effectifs déséquilibrés

n=\frac{\pi_a(1-\pi_a)+\frac{(\pi_b(1-\pi_b)}{k}}{\Delta^2}(z_{1-\alpha/2}+z_{1-\beta})^2

n_a : nb de sujets dans le groupe a n_b=k.n_a Avec p1=0,5, p2=0,25, un rapport de 3 cas dans un groupe pour 1 dans l’autre, un risque alpha à 5% & béta à 20 % :
 bsamsize(0.5, 0.25, fraction=3, alpha=0.5, power=0.8)