Siano due popolazioni distinte X1 e X2
X1 = cretini
X2 = intelligenti*
che seguono la distribuzione bernoulliana, dunque
X1 ≈ bern (p1)
X2 ≈ bern (p2)
*
I criteri di suddivisione nei due gruppi andrebbero discussi in altra sede, ci limiteremo a precisare che si basano sui risultati di un test di millecinquecento crocette su svariati argomenti (dalla nomenclatura dei pokémon al battello ebbro), e sugli sviluppi di una discussione inerente i piaceri (cinetico e catastematico) da intavolarsi con un intellettuale dalle forti tendenze anticlericali.
Il topic durante tutto il corso della giornata e fino a notte fonda ha visto contrapporsi due fazioni, chi ritiene che i cretini siano avvezzi alla frequentazione delle discoteche e chi ripudia tale considerazione. Per fare maggiore chiarezza, sviluppiamo un test statistico:
Si estraggono dalle suddette popolazioni due campioni fra loro indipendenti (A e B, di ampiezza rispettivamente 380 e 460 unità) e si effettua tra di loro un sondaggio. I risultati sono i seguenti:
- Dei 380 cretini estratti, 278 frequentano abitualmente le discoteche. (W1 = 278).
- Dei 460 intelligenti estratti, i frequentanti sono 45. (W2 = 45)
Vogliamo stabilire se in generale la proporzione di cretini che frequentano la discoteca è superiore alla corrispondente proporzione di intelligenti. A tale scopo, effettuiamo una verifica d’ipotesi:
H0: p1 – p2 = 0
H1: p1 – p2 > 0
Dove H0 è detta ipotesi nulla, ovvero quella vera fino a prova contraria (che i cretini e gli intelligenti partecipino agli eventi in discoteca in pari proporzione); H1 è l’ipotesi alternativa, cioè quella da accettare quando H0 viene rifiutata (che i cretini siano in proporzione dei frequentatori molto più assidui)
Il nostro test statistico determina una Regione critica (o di rifiuto), la quale a sua volta stabilisce l’insieme dei valori che portano a rifiutare l’ipotesi nulla H0.
Occorre fissare un livello di significativà, o α. Trattasi della probabilità di commettere un errore di I specie, vale a dire l’accettazione di H0 quando H0 è falsa. Nel nostro caso vogliamo stare sul sicuro, quindi poniamo α = 0,01.
Riprendiamo i valori campionari e determiniamo la regione critica:
p1 = W1/n1 = 278/380 = 0,7316
p2 = W2/n2 = 45/460 = 0,0978
essendo entrambe le numerosità campionarie >50, ci avvaliamo del teorema centrale del limite e approssimiamo la distribuzione della nostra statistica test (D = p1 – p2) alla Normale:
p1 – p2 ≈ N[p1 – p2; p1(1-p1)/n1 + p2(1-p2)/n1]
sotto l’ipotesi H0, diventa
p1 – p2 ≈ N[0; p(1-p)/n1 + p(1-p)/n1]
(essendo p1 = p2 in ipotesi nulla)
standardizziamo e sostituiamo p con la media aritmetica fra le due proporzioni, pari a 0,3845 (i più volenterosi potranno svolgere autonomamente i calcoli). Giungiamo all’espressione
E’ una statistica, è utile al confronto fra H0 e H1 e ha distribuzione nota sotto H0.
Procediamo con lo sviluppo della regione critica:
ricordiamo che α = 0,01. Ergo, 1 – α = 0,99
Dalle tavole della normale standard, l’area sottesa alla curva in quel punto è pari a 2,326
La nostra statistica test, che ricordiamo essere
ha valore pari a 18.7990 (di nuovo, chi vuole esercitarsi coi calcoli è liberissimo di farlo).
La regione critica ci dice l’insieme dei valori che determinano il rifiuto dell’ipotesi nulla. Nel nostro caso, rifiutiamo H0 se il valore della statistica test è superiore a 2,326.
18,7990 > 2,326
Rifiutiamo pertanto l’ipotesi nulla.
Siamo costretti ad accettare l’ipotesi alternativa, e cioè che la proporzione di cretini che frequentano le discoteche è largamente superiore a quella degli intelligenti.