Handbook of Biological Statistics

topic Argomento precedente / Argomento successivo ⇒ Sommario

Usa la regressione logistica semplice quando hai una variabile nominale e una variabile di misura e vuoi sapere se la variazione nella variabile di misura causa la variazione nella variabile nominale.

Quando usarlo

Usa una semplice regressione logistica quando hai una variabile nominale con due valori (maschio / femmina,morto / vivo, ecc.) e una variabile di misura. La variabile nominale è la variabile dipendente e la variabile di misura è la variabile indipendente.

Sto separando la regressione logistica semplice, con una sola variabile indipendente, dalla regressione logistica multipla, che ha più di una variabile indipendente. Molte persone raggruppano tutta la regressione logistica, ma penso che sia utile trattare separatamente la regressione logistica semplice, perché è più semplice.

La regressione logistica semplice è analoga alla regressione lineare, tranne per il fatto che la variabile dipendente è nominale, non una misura. Un obiettivo è vedere se la probabilità di ottenere un particolare valore della variabile nominale è associata alla variabile di misura; l’altro obiettivo è prevedere la probabilità di ottenere un particolare valore della variabile nominale, data la variabile di misura.

granulometria
(mm)
Ragni
0.245 assenti
0.247 assenti
0.285 presente
0.299 presente
0.327 presente
0.347 present
0.356 absent
0.36 present
0.363 absent
0.364 present
0.398 absent
0.4 present
0.409 absent
0.421 present
0.432 absent
0.473 present
0.509 present
0.529 present
0.561 absent
0.569 absent
0.594 present
0.638 present
0.656 present
0.816 present
0.853 present
0.938 present
1.036 present
1.045 present

As an example of simple logistic regression, Suzuki et al. (2006) ha misurato la granulometria della sabbia su 28 spiagge in Giappone e ha osservato la presenza o l’assenza del ragno lupo scavatore Lycosa ishikariana su ogni spiaggia. La granulometria della sabbia è una variabile di misura e la presenza o l’assenza del ragno è una variabile nominale. La presenza o l’assenza del ragno è la variabile dipendente; se esiste una relazione tra le due variabili, sarebbe la granulometria della sabbia che influenza i ragni, non la presenza di ragni che influenzano la sabbia.

Un obiettivo di questo studio sarebbe quello di determinare se ci fosse una relazione tra la dimensione del granello di sabbia e la presenza o l’assenza della specie, nella speranza di capire di più sulla biologia dei ragni. Poiché questa specie è in pericolo, un altro obiettivo sarebbe trovare un’equazione che preveda la probabilità che una popolazione di ragni lupo sopravviva su una spiaggia con una particolare granulometria di sabbia, per aiutare a determinare quali spiagge reintrodurre il ragno.

Puoi anche analizzare i dati con una variabile nominale e una variabile di misura usando un anova unidirezionale o un t-test di uno studente, e la distinzione può essere sottile. Un indizio è che la regressione logistica consente di prevedere la probabilità della variabile nominale. Ad esempio, immagina di aver misurato il livello di colesterolo nel sangue di un gran numero di donne di 55 anni, poi seguite dieci anni dopo per vedere chi aveva avuto un attacco di cuore. Si potrebbe fare un due campioni t-test, confrontando i livelli di colesterolo delle donne che hanno avuto attacchi di cuore vs. quelli che non l’hanno fatto, e questo sarebbe un modo perfettamente ragionevole per testare l’ipotesi nulla che il livello di colesterolo non sia associato ad attacchi di cuore; se il test di ipotesi fosse tutto ciò che ti interessava, il t–test sarebbe probabilmente migliore della regressione logistica meno familiare. Tuttavia, se si volesse prevedere la probabilità che una donna di 55 anni con un particolare livello di colesterolo abbia un attacco di cuore nei prossimi dieci anni, in modo che i medici possano dire ai loro pazienti “Se riduci il colesterolo di 40 punti, ridurrai il rischio di infarto di X%”, dovresti usare la regressione logistica.

Sorridente drago di Komodo
Un drago di Komodo, Varanus komodoensis.

un’Altra situazione che richiede di regressione logistica, piuttosto che un’anova o t–test, è quando si determinano i valori della variabile di misura, mentre i valori della variabile nominale sono liberi di variare. Ad esempio, diciamo che stai studiando l’effetto della temperatura di incubazione sulla determinazione del sesso nei draghi di Komodo. Si allevano 10 uova a 30 ° C, 30 uova a 32°C, 12 uova a 34°C, ecc., quindi determinare il sesso dei piccoli. Sarebbe sciocco per confrontare la media temperature di incubazione tra maschio e femmina cuccioli, e prova la differenza con un’anova o t–test, perché la temperatura di incubazione non dipende dal sesso della prole; di aver impostato la temperatura di incubazione, e se c’è un rapporto, è che il sesso della prole dipende dalla temperatura.

Quando ci sono più osservazioni della variabile nominale per ogni valore della variabile di misura, come nell’esempio di Komodo dragon, vedrai spesso i dati analizzati usando la regressione lineare, con le proporzioni trattate come una seconda variabile di misura. Spesso le proporzioni sono arc-sinusoidali trasformate, perché ciò rende le distribuzioni delle proporzioni più normali. Questo non è orribile, ma non è strettamente corretto. Un problema è che la regressione lineare tratta tutte le proporzioni allo stesso modo, anche se sono basate su dimensioni del campione molto diverse. Se 6 su 10 uova di drago di Komodo allevate a 30 °C fossero femmine e 15 su 30 uova allevate a 32°C fossero femmine, il 60% femmina a 30°C e il 50% a 32°C otterrebbero lo stesso peso in una regressione lineare, il che è inappropriato. La regressione logistica analizza ogni osservazione (in questo esempio, il sesso di ogni drago di Komodo) separatamente, quindi i 30 draghi a 32°C avrebbero 3 volte il peso dei 10 draghi a 30°C.

Mentre la regressione logistica con due valori della variabile nominale (regressione logistica binaria) è di gran lunga la più comune, puoi anche fare regressione logistica con più di due valori della variabile nominale, chiamata regressione logistica multinomiale. Non ho intenzione di coprire qui a tutti. Spiacente.

Puoi anche fare una semplice regressione logistica con variabili nominali sia per le variabili indipendenti che per quelle dipendenti, ma ad essere onesti, non capisco il vantaggio di questo rispetto a un chi-quadrato o G–test di indipendenza.

Ipotesi nulla

L’ipotesi nulla statistica è che la probabilità di un particolare valore della variabile nominale non sia associata al valore della variabile di misura; in altre parole, la linea che descrive la relazione tra la variabile di misura e la probabilità della variabile nominale ha una pendenza pari a zero.

Come funziona il test

La regressione logistica semplice trova l’equazione che meglio predice il valore della variabile Y per ogni valore della variabile X. Ciò che rende la regressione logistica diversa dalla regressione lineare è che non si misura direttamente la variabile Y; è invece la probabilità di ottenere un particolare valore di una variabile nominale. Per l’esempio spider, i valori della variabile nominale sono “ragni presenti” e ” ragni assenti.”La variabile Y utilizzata nella regressione logistica sarebbe quindi la probabilità che i ragni siano presenti su una spiaggia. Questa probabilità potrebbe assumere valori da 0 a 1. L’intervallo limitato di questa probabilità presenterebbe problemi se usato direttamente in una regressione, quindi le probabilità, Y/(1-Y), viene usato al suo posto. (Se la probabilità di ragni su una spiaggia è 0,25, le probabilità di avere ragni sono 0.25/(1-0.25)=1/3. In gioco d’azzardo termini, questo sarebbe espresso come “3 a 1 probabilità contro avere ragni su una spiaggia.”) Prendendo il logaritmo naturale della probabilità rende la variabile più adatto per una regressione, in modo che il risultato di una regressione logistica è un’equazione che assomiglia a questo:

ln=a+bX

trovare la pendenza (b) e l’intercetta (a), miglior montaggio equazione in una regressione logistica, utilizzando la massima verosimiglianza metodo, piuttosto che il metodo dei minimi quadrati si utilizza per la regressione lineare. La massima verosimiglianza è una tecnica ad alta intensità di computer; l’idea di base è che trova i valori dei parametri in base ai quali è più probabile ottenere i risultati osservati.

Per il ragno esempio, l’equazione è

ln=-1.6476+5.1215(granulometria)

Riorganizzare risolvere per Y (la probabilità di ragni su una spiaggia) produce

Y=e−1.6476+5.1215(granulometria)/(1+e−1.6476+5.1215(granulometria))

dove e è la radice naturale registri. Quindi, se andaste in spiaggia e voleste prevedere la probabilità che i ragni vivessero lì, potreste misurare la granulometria della sabbia, inserirla nell’equazione e ottenere una stima di Y, la probabilità che i ragni siano sulla spiaggia.

Esistono diversi modi per stimare il valore P. Il Wald chi-square è abbastanza popolare, ma può produrre risultati imprecisi con campioni di piccole dimensioni. Il metodo del rapporto di verosimiglianza potrebbe essere migliore. Utilizza la differenza tra la probabilità di ottenere i risultati osservati sotto il modello logistico e la probabilità di ottenere i risultati osservati in un modello senza relazione tra le variabili indipendenti e dipendenti. Ti consiglio di utilizzare il metodo del rapporto di verosimiglianza; assicurati di specificare quale metodo hai usato quando riferisci i tuoi risultati.

Per l’esempio di spider, il valore P utilizzando il metodo del rapporto di verosimiglianza è 0.033, quindi si rifiuterebbe l’ipotesi nulla. Il valore P per il metodo Wald è 0.088, che non è abbastanza significativo.

Ipotesi

La regressione logistica semplice presuppone che le osservazioni siano indipendenti; in altre parole, che un’osservazione non influenzi un’altra. Nell’esempio del drago di Komodo, se tutte le uova a 30°C fossero deposte da una madre, e tutte le uova a 32°C fossero deposte da una madre diversa, ciò renderebbe le osservazioni non indipendenti. Se progetti bene il tuo esperimento, non avrai problemi con questa ipotesi.

La regressione logistica semplice presuppone che la relazione tra il log naturale del rapporto di probabilità e la variabile di misura sia lineare. Potresti essere in grado di risolvere questo problema con una trasformazione della variabile di misurazione, ma se la relazione sembra una U o una U capovolta, una trasformazione non funzionerà. Ad esempio, Suzuki et al. (2006) ha trovato una probabilità crescente di ragni con granulometria crescente, ma sono sicuro che se guardassero spiagge con sabbia ancora più grande (in altre parole, ghiaia), la probabilità di ragni tornerebbe indietro. In tal caso non si potrebbe fare una semplice regressione logistica; probabilmente si vorrebbe fare una regressione logistica multipla con un’equazione che include entrambi i termini X e X2, invece.

La regressione logistica semplice non presuppone che la variabile di misura sia normalmente distribuita.

Esempi

Un anfipode
Un crostaceo anfipode, Megalorchestia californiana.

McDonald (1985) ha contato le frequenze alleliche nel locus mannosio-6-fosfato isomerasi (Mpi) nella megalorchestia californiana dei crostacei anfipodi, che vive sulle spiagge sabbiose della costa pacifica del Nord America. C’erano due alleli comuni, Mpi90 e Mpi100. La latitudine di ogni punto di raccolta, il numero di ciascun allele, e la percentuale di Mpi100 allele, sono riportati di seguito:

Posizione Latitudine Mpi90 Mpi100 p, Mpi100
Port Townsend, WA 48.1 47 139 0.748
Neskowin, O 45.2 177 241 0.577
Siuslaw R., O 44 1087 1183 0.521
Umpqua R., O 43.7 187 175 0.483
Coos Bay, OR 43.5 397 671 0.628
San Francisco, CA 37.8 40 14 0.259
Carmel, CA 36.6 39 17 0.304
Santa Barbara, CA 34.3 30 0 0

Allele (Mpi90 or Mpi100) is the nominal variable, and latitude is the measurement variable. Se la domanda biologica fosse “Luoghi diversi hanno frequenze allele diverse?”, ignoreresti la latitudine e faresti un chi-quadrato o un G-test di indipendenza; qui la domanda biologica è ” Le frequenze allele sono associate alla latitudine?”

Si noti che anche se la proporzione dell’allele Mpi100 sembra aumentare con l’aumentare della latitudine, le dimensioni del campione per le aree settentrionali e meridionali sono piuttosto piccole; fare una regressione lineare della frequenza dell’allele rispetto alla latitudine darebbe loro lo stesso peso ai campioni molto più grandi dell’Oregon, il che sarebbe inappropriato. Facendo una regressione logistica, il risultato è chi2 = 83.3, 1 d.f., P=7×10-20. L’equazione della relazione è

ln (Y/(1-Y))=-7.6469+0.1786 (latitudine),

dove Y è la probabilità prevista di ottenere un allele Mpi100. Risolvendo questo per Y dà

Y = e-7.6469+0.1786(latitudine)/(1+e−7.6469+0.1786 (latitudine)).

Questa linea di regressione logistica è mostrata sul grafico; si noti che ha una forma a S delicata. Tutte le equazioni di regressione logistica hanno una forma a S, anche se potrebbe non essere ovvio se si esamina un intervallo ristretto di valori.

Grafico di regressione logistica Frequenze dell’allele Mpi rispetto alla latitudine nell’amphipode Megalorchestia californiana. Le barre di errore sono intervalli di confidenza del 95%; la linea nera spessa è la linea di regressione logistica.

Rappresentazione grafica dei risultati

Se si hanno più osservazioni per ogni valore della variabile di misura, come nell’esempio di amphipod sopra, è possibile tracciare un grafico a dispersione con la variabile di misura sull’asse X e le proporzioni sull’asse Y. Potresti voler inserire intervalli di confidenza del 95% sui punti; questo dà un’indicazione visiva di quali punti contribuiscono maggiormente alla regressione (quelli con dimensioni del campione più grandi hanno intervalli di confidenza più piccoli).

Non esiste un modo automatico nei fogli di calcolo per aggiungere la linea di regressione logistica. Ecco come ho ottenuto sul grafico dei dati amphipod. Per prima cosa, ho messo le latitudini nella colonna A e le proporzioni nella colonna B. Quindi, usando il comando Fill: Series, ho aggiunto i numeri 30, 30.1, 30.2, 5 50 alle celle da A10 a A210. Nella colonna C ho inserito l’equazione per la linea di regressione logistica; in formato Excel, è

=exp(-7.6469+0.1786*(A10))/(1+exp(-7.6469+0.1786*(A10)))

per la riga 10. L’ho copiato nelle celle da C11 a C210. Poi, quando ho disegnato un grafico dei numeri nelle colonne A, B e C, ho dato i numeri nella colonna B simboli ma nessuna linea, e i numeri nella colonna C hanno ottenuto una linea ma nessun simbolo.

Stoneroller centrale
Stoneroller centrale, Campostoma anomalum.

Se si ha una sola osservazione della variabile nominale per ogni valore della variabile di misura, come nell’esempio spider, sarebbe sciocco disegnare un grafico a dispersione, poiché ogni punto del grafico sarebbe a 0 o 1 sull’asse Y. Se si dispone di molti punti dati, è possibile dividere i valori di misurazione in intervalli e tracciare la proporzione per ciascun intervallo su un grafico a barre. Ecco i dati del Maryland Biological Stream Survey su 2180 siti di campionamento in Maryland streams. La variabile di misura è la concentrazione di ossigeno disciolto e la variabile nominale è la presenza o l’assenza dello stoneroller centrale, Campostoma anomalum. Se si utilizza un grafico a barre per illustrare una regressione logistica, è necessario spiegare che il raggruppamento era solo per scopi euristici e la regressione logistica è stata eseguita sui dati grezzi e non raggruppati.

Grafico a barre di regressione logistica
Proporzione di flussi con stonerollers centrali rispetto all’ossigeno disciolto. Gli intervalli di ossigeno disciolto sono stati impostati per avere un numero approssimativamente uguale di siti di flusso. La linea nera spessa è la linea di regressione logistica; si basa sui dati grezzi, non sui dati raggruppati in intervalli.
Grafico a barre di regressione logistica
Proporzione di flussi con stonerollers centrali rispetto all’ossigeno disciolto. Gli intervalli di ossigeno disciolto sono stati impostati per avere un numero approssimativamente uguale di siti di flusso. La linea nera spessa è la linea di regressione logistica; si basa sui dati grezzi, non sui dati raggruppati in intervalli.

Test simili

È possibile eseguire la regressione logistica con una variabile dipendente che ha più di due valori, nota come regressione logistica multinomiale, politomica o policotomica. Non mi occupo di questo.

Usa la regressione logistica multipla quando la variabile dipendente è nominale e c’è più di una variabile indipendente. È analogo alla regressione lineare multipla e si applicano tutti gli stessi avvertimenti.

Usa la regressione lineare quando la variabile Y è una variabile di misura.

Quando c’è solo una variabile di misura e una variabile nominale, è possibile utilizzare anova unidirezionale o un t-test per confrontare i mezzi della variabile di misura tra i due gruppi. Concettualmente, la differenza è se si pensa che la variazione nella variabile nominale causi una variazione nella variabile di misura (utilizzare un test t) o che la variazione nella variabile di misura causi una variazione nella probabilità della variabile nominale (utilizzare la regressione logistica). Dovresti anche considerare a chi stai presentando i tuoi risultati e come utilizzeranno le informazioni. Ad esempio, Tallamy et al. (2003) ha esaminato il comportamento di accoppiamento nei coleotteri maculati del cetriolo (Diabrotica undecimpunctata). Coleotteri maschi accarezzare la femmina con la loro antenna, e Tallamy et al. volevo sapere se i maschi più veloci avevano un migliore successo di accoppiamento. Hanno confrontato il tasso di carezza medio di 21 maschi riusciti (50,9 colpi al minuto) e 16 maschi non riusciti (33,8 colpi al minuto) con un test t a due campioni e hanno trovato un risultato significativo (P<0.0001). Questo è un risultato semplice e chiaro, e risponde alla domanda, “Sono coleotteri cetriolo maculato femmina più probabilità di accoppiarsi con i maschi che ictus più veloce?”Tallamy et al. (2003), potrebbe avere analizzato questi dati utilizzando la regressione logistica; è più difficile e meno familiare tecnica statistica che potrebbe confondere alcuni dei loro lettori, ma oltre a rispondere alla domanda sì/no se accarezzando la velocità è legata all’accoppiamento di successo, si potrebbe avere usato la regressione logistica per predire quanto aumento accoppiamento successo un coleottero vorresti ottenere come è aumentato accarezzando la velocità. Questo potrebbe essere utile ulteriori informazioni (soprattutto se sei un coleottero cetriolo maschio).

Come fare il test

Foglio di calcolo

Ho scritto un foglio di calcolo per fare una semplice regressione logistica. È possibile inserire i dati in forma riassuntiva (ad esempio, dicendo che a 30°C c’erano 7 draghi di Komodo maschi e 3 femmine) o in forma non riassuntiva (ad esempio, inserendo ciascun drago di Komodo separatamente, con “0” per un maschio e “1” per una femmina). Utilizza il metodo del rapporto di verosimiglianza per calcolare il valore P. Il foglio di calcolo utilizza lo strumento “Risolutore” in Excel. Se non vedi il Risolutore elencato nel menu Strumenti, vai a Componenti aggiuntivi nel menu Strumenti e installa Risolutore.

Il foglio di calcolo è divertente da giocare, ma non sono abbastanza sicuro di consigliarti di usarlo per risultati pubblicabili.

Pagina Web

C’è una pagina web molto bella che farà la regressione logistica, con il rapporto di verosimiglianza chi-quadrato. È possibile inserire i dati in forma riassunta o forma non riassunta, con i valori separati da schede (che si otterrà se si copia e incolla da un foglio di calcolo) o virgole. Si dovrebbe inserire i dati amphipod come questo:

 48.1,47,139 45.2,177,241 44.0,1087,1183 43.7,187,175 43.5,397,671 37.8,40,14 36.6,39,17 34.3,30,0

R

Il compagno R di Salvatore Mangiafico ha un programma R di esempio per una semplice regressione logistica.

SAS

Usa PROC LOGISTIC per una semplice regressione logistica. Esistono due forme dell’istruzione MODEL. Quando si hanno più osservazioni per ogni valore della variabile di misurazione, il set di dati può avere la variabile di misurazione, il numero di “successi” (questo può essere il valore della variabile nominale) e il totale (per cui potrebbe essere necessario creare una nuova variabile, come mostrato qui). Ecco un esempio utilizzando i dati amphipod:

DATA amphipods; INPUT location $ latitude mpi90 mpi100; total=mpi90+mpi100; DATALINES;Port_Townsend,_WA 48.1 47 139 Neskowin,_OR 45.2 177 241Siuslaw_R.,_OR 44.0 1087 1183Umpqua_R.,_OR 43.7 187 175Coos_Bay,_OR 43.5 397 671San_Francisco,_CA 37.8 40 14Carmel,_CA 36.6 39 17Santa_Barbara,_CA 34.3 30 0;PROC LOGISTIC DATA=amphipods; MODEL mpi100/total=latitude;RUN;

Si noti che si crea la nuova variabile TOTALE nel passaggio DATI aggiungendo il numero di alleli Mpi90 e Mpi100. L’istruzione MODEL utilizza il numero di alleli Mpi100 sul totale come variabile dipendente. Il valore P sarebbe lo stesso se si utilizzasse Mpi90; i parametri dell’equazione sarebbero diversi.

C’è un sacco di output da PROC LOGISTIC che non ti serve. Il programma fornisce tre diversi valori P; il valore del rapporto di verosimiglianza P è il più comunemente usato:

 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSqLikelihood Ratio 83.3007 1 <.0001 P valueScore 80.5733 1 <.0001Wald 72.0755 1 <.0001

I coefficienti dell’equazione logistica sono indicate alla voce “stima”:

 Analysis of Maximum Likelihood Estimates Standard WaldParameter DF Estimate Error Chi-Square Pr > ChiSqIntercept 1 -7.6469 0.9249 68.3605 <.0001latitude 1 0.1786 0.0210 72.0755 <.0001

l’Utilizzo di questi coefficienti, la massima probabilità equazione per la quota di Mpi100 gli alleli a una particolare latitudine è

Y=e−7.6469+0.1786(latitudine)/(1+e−7.6469+0.1786(latitudine))

è anche possibile utilizzare i dati in cui ogni linea è una sola osservazione. In tal caso, è possibile utilizzare parole o numeri per la variabile dipendente. In questo esempio, i dati sono l’altezza (in pollici) degli studenti del 2004 della mia classe, insieme al loro insetto preferito (raggruppato in coleotteri contro tutto il resto, dove “tutto il resto” include i ragni, che un biologo dovrebbe davvero sapere che non sono insetti):

DATA insect; INPUT height insect $ @@; DATALINES;62 beetle 66 other 61 beetle 67 other 62 other76 other 66 other 70 beetle 67 other 66 other70 other 70 other 77 beetle 76 other 72 beetle76 beetle 72 other 70 other 65 other 63 other63 other 70 other 72 other 70 beetle 74 other ;PROC LOGISTIC DATA=insect; MODEL insect=height;RUN;

Il formato dei risultati è lo stesso per entrambe le forme dell’istruzione MODEL. In questo caso, il modello sarebbe la probabilità di coleottero, perché è alfabeticamente prima; per modellare la probabilità di ALTRO, si aggiungerebbe un EVENTO dopo la variabile nominale nell’istruzione MODEL, rendendolo “MODEL insect (EVENT=’other’)=height;”

Analisi di potenza

È possibile utilizzare G*Power per stimare la dimensione del campione necessaria per una semplice regressione logistica. Scegliere “test z” in Famiglia di test e “Regressione logistica” in Test statistico. Imposta il numero di code (di solito due), alfa (di solito 0,05) e potenza (spesso 0,8 o 0,9). Per una regressione logistica semplice, impostare” X distribution ” su Normal,” R2 other X “su 0,” X parm μ “su 0 e” X parm σ ” su 1.

L’ultima cosa da impostare è la dimensione dell’effetto. Questo è il rapporto di probabilità della differenza che speri di trovare tra le probabilità di Y quando X è uguale alla media X e le probabilità di Y quando X è uguale alla media X più una deviazione standard. È possibile fare clic sul pulsante “Determina” per calcolare questo.

Ad esempio, supponiamo di voler studiare la relazione tra la dimensione delle particelle di sabbia e le presenze o l’assenza di coleotteri tigre. Si imposta alfa a 0,05 e potenza a 0,90. Ci si aspetta, sulla base di ricerche precedenti, che il 30% delle spiagge che guarderai avrà coleotteri tigre, quindi si imposta “Pr(Y=1|X=1) H0” a 0,30. Anche sulla base di ricerche precedenti, ci si aspetta una granulometria media di sabbia .6 mm con una deviazione standard di 0,2 mm. La dimensione dell’effetto (la deviazione minima dall’ipotesi nulla che speri di vedere) è che man mano che la granulometria della sabbia aumenta di una deviazione standard, da 0,6 mm a 0,8 mm, la percentuale di spiagge con coleotteri tigre passerà da 0,30 a 0,40. Fai clic sul pulsante “Determina” e inserisci 0.40 per “Pr (Y=1|X=1) H1” e 0.30 per “Pr (Y=1|X=1) H0″, quindi premere ” Calcola e trasferisci alla finestra principale.”Riempirà il rapporto di probabilità(1.555 per il nostro esempio) e il “Pr (Y=1|X=1) H0”. Il risultato in questo caso è 206, il che significa che il tuo esperimento richiederà di viaggiare in 206 spiagge calde e belle.

Immagine di amphipod dalla home page di Vikram Iyengar.

McDonald, J. H. 1985. Variazione dimensionale e geografica in due loci enzimatici nella Megalorchestia californiana (Amphipoda: Talitridae). Eredità 54: 359-366.

Suzuki, S., N. Tsurusaki, e Y. Kodama. 2006. Distribuzione di un ragno in via di estinzione Lycosa ishikariana nella costa di San’in di Honshu, Giappone (Araneae: Lycosidae). Acta Arachnologica 55: 79-86.

Tallamy, D. W., M. B. Darlington, J. D. Pesek, e B. E. Powell. 2003. Il corteggiamento copulatorio segnala la qualità genetica maschile nei coleotteri di cetriolo. Atti della Royal Society di Londra B 270: 77-82.

topic Argomento precedente/Argomento successivo ⇒ Sommario

Questa pagina è stata aggiornata il 20 luglio 2015. Il suo indirizzo è http://www.biostathandbook.com/logistic.html. Può essere citato come:
McDonald, J. H. 2014. Manuale di Statistica Biologica (3a ed.). Sparky Casa Editrice, Baltimora, Maryland. Questa pagina web contiene il contenuto delle pagine 238-246 nella versione stampata.
©2014 di John H. McDonald. Probabilmente puoi fare quello che vuoi con questo contenuto; vedi la pagina delle autorizzazioni per i dettagli.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.