Bias in odds ratios by logistic regression modelling and sample size

Table 1 summarizes the estimated empirical bias in estimated regression coefficients. Com o aumento do tamanho da amostra, os coeficientes estimados aproximam-se assintoticamente do valor da população (Figura 1). O ajuste é melhor para variáveis contínuas (R2 = 0.963) do que para variáveis discretas (R2 = 0.836). Isso se traduz em uma maior variabilidade nas estimativas de regressão logística para variáveis discretas. Para ambas as variáveis de exposição contínua e discreta, o viés assintótico converge para zero à medida que o tamanho da amostra aumenta, mas a intensidade de convergência difere. Além disso, a função de densidade de amostragem é bastante distorcida em amostras menores e aproxima-se de uma distribuição simétrica com o aumento do tamanho da amostra (figura. 2). A distribuição distorcida da amostragem resulta mais frequentemente em estimativas de valores extremos, cuja proporção diminui com o aumento da dimensão das amostras (Figura 3).

Table 1 Empirical Estimation of the Magnitude of the Asymptotic Bias of Logistic Regression Coefficients.
Figura 1
figura 1

estimativas do Coeficiente e o seu tamanho de amostra de dependentes de erro sistemático na regressão logística estimativas. O desvio em relação ao valor da população real (2, respectivamente, -0,9 neste caso) representa o viés analiticamente induzido nas estimativas de regressão.

Figure 2
figure2

Sampling distribution of logistic regression coefficient estimates at different sample sizes.

Figure 3
figure3

Increasing sample size not only reduces the analytically induced bias in regression estimates but protects against extreme value estimates.

Assim, podemos concluir que os estudos empregando regressão logística como ferramenta analítica para o estudo de associação de variáveis de exposição e o resultado superestimar o efeito em estudos de pequena a moderada amostras de tamanho. A magnitude deste viés analiticamente derivado depende do tamanho da amostra e da estrutura de dados. O pequeno tamanho da amostra induzido viés é um sistemático, viés longe de null. As estimativas do coeficiente de regressão afastam-se de zero, as probabilidades de um. Este viés analítico é um fenômeno estatístico reconhecido, mas em parte é Desconhecido entre os praticantes e parcialmente ignorado. A justificação para a ignorância está na suposição de que o viés é muito menor do que o erro padrão da estimativa . Estimadores consistentes podem ser tendenciosos em amostras finitas e medidas corretivas são necessárias. No entanto, aconselha-se precaução, uma vez que a correcção de viés pode inflacionar a variância e o erro quadrático médio de uma estimativa . Várias medidas corretivas têm sido sugeridas na literatura; como a estimativa de correção de viés ou o jackknife . Bootstrapping, especialmente o método quadratic bootstrap, provou ser uma medida corretiva viável . Jewell propõe alternativas ao estimador de máxima probabilidade, mas conclui que o ligeiro ganho em precisão pode não valer a maior complexidade . As estimativas da probabilidade máxima corrigida pelo viés podem ser obtidas com a ajuda de regressão ponderada suplementar ou por modificação adequada da função de pontuação . Uma estratégia de amostragem adequada e bem projetada pode melhorar o pequeno desempenho da amostra da estimativa .os estudos realizados sobre o mesmo tema com diferentes tamanhos de amostra terão estimativas de efeito variável com estimativas mais pronunciadas em pequenos estudos de amostra, ou estudos com dados altamente estratificados. Em pequenos ou mesmo em tamanhos moderadamente grandes de amostras, suas distribuições são altamente distorcidas e as razões de probabilidade são superestimadas. Aqui nós não podemos dar diretrizes rígidas sobre o quão grande uma amostra adequada deve ser este é em grande parte estudo específico. Long afirma que é arriscado utilizar estimativas de probabilidade máxima em amostras com menos de 100, ao passo que as amostras com mais de 500 devem ser adequadas. No entanto, isso varia muito com a estrutura de dados na mão. Os estudos com resultados muito comuns ou extremamente raros requerem geralmente amostras maiores. O número de variáveis de exposição e as suas características influenciam fortemente a dimensão da amostra exigida. As exposições discretas exigem geralmente maiores dimensões da amostra do que as exposições contínuas. Exposições altamente correlacionadas precisam de amostras maiores também.efeito de pequeno estudo, o fenómeno dos pequenos estudos que relatam efeitos maiores do que os grandes estudos, tem sido repetidamente descrito . Uma publicação selectiva de” estudos positivos ” pode explicar parcialmente este fenómeno. Temos, no entanto, ilustrado que as razões de probabilidade são sobrestimadas em pequenas amostras devido às propriedades inerentes dos modelos de regressão logística. Este viés pode em um único estudo não ter qualquer relevância para a interpretação dos resultados, uma vez que é muito menor do que o erro padrão da estimativa. Mas se um número de pequenos estudos com tamanhos de efeito sistematicamente sobrestimados forem reunidos sem considerar este efeito, podemos interpretar mal a evidência na literatura para um efeito quando na realidade tal não existe.

Deixe uma resposta

O seu endereço de email não será publicado.