odds ratio-Bias logistiseen regressiomallinnukseen ja otoskokoon

. Otoskoon kasvaessa estimoidut kertoimet lähestyvät asymptoottisesti populaation arvoa (Kuva 1). Fit on parempi jatkuville muuttujille (R2 = 0,963) kuin diskreetille (R2 = 0,836). Tämä merkitsee diskreettien muuttujien logististen regressioestimaattien suurempaa vaihtelua. Sekä jatkuvan että diskreetin altistusmuuttujilla asymptoottinen bias konvergoituu nollaan otoskoon kasvaessa, mutta konvergenssin intensiteetti vaihtelee. Myös näytteenottotiheysfunktio on melko vinossa pienemmissä otoksissa ja lähestyy symmetristä jakaumaa otoskoon kasvaessa (Kuva. 2). Vääristynyt näytteenottojakauma johtaa useammin ääriarvoihin, joiden osuus pienenee otoskokojen kasvaessa (kuva 3).

Taulukko 1 empiirinen estimointi logististen Regressiokertoimien Asymptoottisen harhan suuruudesta.
Kuva 1
kuvio1

Kerroinarviot ja sen otoskoosta riippuva systemaattinen harha logistisissa regressioestimaateissa. Poikkeama todellisesta perusjoukon arvosta (2 vastaavasti -0,9 tässä tapauksessa) edustaa regressioestimaattien analyyttisesti indusoitua vinoumaa.

Figure 2
figure2

Sampling distribution of logistic regression coefficient estimates at different sample sizes.

Figure 3
figure3

Increasing sample size not only reduces the analytically induced bias in regression estimates but protects against extreme value estimates.

näin voimme päätellä, että tutkimukset, joissa käytetään logistista regressiota analyyttisenä välineenä altistusmuuttujien assosiaation tutkimiseksi ja tulokset yliarvioivat vaikutusta tutkimuksissa, joissa näytteiden koko on pieni tai kohtalainen. Tämän analyyttisesti johdetun harhan suuruus riippuu otoksen koosta ja tietorakenteesta. Pieni otoskoko indusoitu bias on systemaattinen, bias pois null. Regressiokerroin arvioi siirtymät pois nollasta, kerroinsuhteet yhdestä. Tämä analyyttinen vinouma on tunnustettu tilastollinen ilmiö,mutta se on osittain tuntematon harjoittajien keskuudessa ja osittain sivuutettu. Tietämättömyyttä perustellaan sillä oletuksella, että harha on paljon pienempi kuin estimaatin keskivirhe . Yhdenmukaiset estimaattorit voivat olla puolueellisia äärellisissä otoksissa, ja tarvitaan korjaavia toimenpiteitä. Varovaisuus on kuitenkin suositeltavaa, koska bias korjaus saattaa paisuttaa varianssi ja keskimääräinen neliövirhe estimaatin . Kirjallisuudessa on esitetty useita korjaavia toimenpiteitä, kuten bias-korjattu arvio tai jackknife . Bootstrapping, erityisesti quadratic bootstrap-menetelmä, on osoittautunut toteuttamiskelpoiseksi korjaavaksi toimenpiteeksi . Jewell ehdottaa vaihtoehtoja maksimitodennäköisyyden estimaattorille, mutta päättelee, että hienoinen tarkkuus ei välttämättä ole lisääntyneen monimutkaisuuden arvoinen . Biasikorjatut maksimitodennäköisyysarviot voidaan saada täydentävän painotetun regression avulla tai sopivalla pistefunktion muunnoksella . Asianmukainen ja hyvin suunniteltu näytteenottostrategia voi parantaa arvion pienen näytteen suorituskykyä .

samasta aihealueesta tehdyillä tutkimuksilla, joissa otoskoot vaihtelevat, on vaihtelevia vaikutusarvioita, kun taas pienissä otostutkimuksissa tai tutkimuksissa, joissa tiedot ovat erittäin osittaisia. Pienissä tai jopa kohtalaisen suurissa otoskooissa niiden jakaumat ovat hyvin vääristyneitä ja kerroinsuhteet yliarvioituja. Täällä emme voi antaa tiukkoja ohjeita siitä, kuinka suuri riittävä otos olisi tämä on pitkälti tutkimuskohtainen. Long toteaa, että on riskialtista käyttää maksimitodennäköisyysarvioita alle 100 näytteissä, kun taas yli 500 näytteiden pitäisi olla riittäviä. Kuitenkin tämä vaihtelee suuresti tietorakenteen kädessä. Tutkimukset, joissa tulokset ovat hyvin yleisiä tai erittäin harvinaisia, vaativat yleensä suurempia näytteitä. Altistusmuuttujien lukumäärä ja niiden ominaisuudet vaikuttavat voimakkaasti vaadittuun otoskokoon. Erillisriskit edellyttävät yleensä suurempia otoskokoja kuin jatkuvat vastuut. Hyvin korreloivat altistukset tarvitsevat myös suurempia otoksia.

Small study effect, ilmiö, jossa pienet tutkimukset raportoivat suurempia vaikutuksia kuin suuret tutkimukset, on toistuvasti kuvattu . ”Positiivisten tutkimusten” valikoiva julkaisu saattaa osittain selittää tätä ilmiötä. Olemme kuitenkin havainnollistaneet, että kerroinsuhteet yliarvioidaan pienissä otoksissa logististen regressiomallien luontaisten ominaisuuksien vuoksi. Yksittäisessä tutkimuksessa tällä harhalla ei välttämättä ole merkitystä tulosten tulkinnan kannalta, koska se on paljon pienempi kuin estimaatin keskivirhe. Mutta jos joukko pieniä tutkimuksia systemaattisesti yliarvioidulla vaikutuskoolla yhdistetään ottamatta huomioon tätä vaikutusta, saatamme tulkita väärin kirjallisuudessa esitettyjä todisteita vaikutuksesta, kun todellisuudessa sellaista ei ole olemassa.

Vastaa

Sähköpostiosoitettasi ei julkaista.