19 Análise de Dados Categóricos

19.1 Pacotes necessários

pacman::p_load(coin,
               DescTools,
               dplyr,
               flextable,
               ggplot2, 
               gmodels,
               nhstplot,
               readxl,
               rstatix,
               summarytools)

19.2 Qui-Quadrado

Dois testes de hipótese são proeminentes na pesquisa na área da saúde. Um é o teste t de duas amostras, que é usado para testar a igualdade de duas médias populacionais independentes. O segundo é o teste qui-quadrado (denotado por $\chi^{2}$). O teste é denominado teste qui-quadrado porque usa a distribuição qui-quadrado ou $\chi^{2}$.

19.2.1 Distribuição qui-quadrado

Se uma variável X é normalmente distribuída, então a variável $X^{2}$ tem uma distribuição qui-quadrado (1). A distribuição qui-quadrado com k categorias é a distribuição de uma soma dos quadrados de k variáveis aleatórias independentes com distribuição normal. O número de categorias determina o número de graus de liberdade. O formato da distribuição qui-quadrado depende desses graus de liberdade. Em geral, ela é assimétrica com apenas valores positivos, iniciando em zero. A assimetria diminui à medida que aumentam os graus de liberdade. Para cada grau de liberdade tem-se curvas de distribuição diferentes.

curve(dchisq(x, df = 5), from = 0, to = 60, col = "royalblue", lwd =2, bty = "n")
curve(dchisq(x, df = 10), from = 0, to = 60, col = "red", lwd =2, add = T)
curve(dchisq(x, df = 15), from = 0, to = 40, col = "orange", lwd =2, add = T)
curve(dchisq(x, df = 20), from = 0, to = 40, col = "cyan", lwd =2, add = T)
curve(dchisq(x, df = 30), from = 0, to = 60, col = "green3", lwd =2, add = T)
box(bty = "l")
legend (legend=c ("gl = 05", "gl = 10", "gl = 15", "gl = 20", "gl = 30"), 
        fill = c ("royalblue", "red", "orange", "cyan", "green3"), 
        bty="n", 
        cex = 1,
        x ="right")

Figura 19.1: Distribuição do Qui-Quadrado

A distribuição $\chi^{2}$ converge para a distribuição normal à medida que os graus de liberdade aumentam, de acordo com o teorema do limite central, entretanto esta convergência é lenta (Figura 19.1).

A distribuição qui-quadrado tem duas aplicações comuns: primeiro, como um teste para saber se duas variáveis categóricas são independentes ou não (Teste de independência ou associação); segundo, o teste de qualidade do ajuste do qui-quadrado (Teste de aderência ou ajuste) que é usado para comparar uma determinada distribuição com uma distribuição conhecida.

19.2.2 Lógica da estatística do qui-quadrado

O cálculo da estatística $\chi^{2}$ é baseado nas frequências existentes nas células da tabela de contingência. Em primeiro lugar, calcula-se as frequências que se espera em cada célula caso a hipótese nula seja verdadeira (frequências esperadas). Em segundo lugar, usando a equação geral, o teste mede o grau de discrepância entre o conjunto de frequências observadas (O) e o conjunto de frequências esperadas (E).

\[\chi^{2}= \sum \left [\frac{\left (O_{i} - E_{i} \right )^2}{E_{i}} \right]\]

Se $O_{i}$ é muito semelhante ao $E_{i}$, então o $\chi^{2}$ é baixo; se $O_{i}$ é muito diferente em relação ao $E_{i}$, então o $\chi^{2}$ é alto.

As frequências observadas são o número de sujeitos ou objetos na amostra que se enquadram nas várias categorias da variável de interesse. As frequências esperadas são o número de sujeitos ou objetos na amostra que seria esperado observar se hipótese nula fosse verdadeira.

\[E = \frac{total\ coluna\ \times total\ linha }{total\ geral}\]

Por exemplo, suponha os dados da Tabela 19.1,

Tabela 19.1: Distribuição de Acidentes Automobilísticos por Gênero

Sexo	Com Acidentes	Sem Acidentes	Total de Pessoas
Homens	16	44	60
Mulheres	4	36	40
Total	20	80	100

o número de acidentes esperados para os homens

total_c <- df$Acidentes[3]
total_l <- df$Total[1]
total_geral <- df$Total[3]
esperado <- (total_c*total_l)/total_geral
esperado

[1] 12

é igual a 12, entretanto ocorreram 16. Houve uma diferença. Essa diferença é calculada para todas as células e é o importante no cálculo do qui-quadrado. Após o cálculo, acrescentando os valores esperados à Tabela 19.1, tem-se a Tabela 19.2 que é usada no cálculo do qui-quadrado.

Tabela 19.2: Distribuição de Acidentes Automobilísticos por Gênero

Sexo	Com Acidentes	Sem Acidentes	Total de Pessoas
Homens	12	48	60
Mulheres	8	32	40
Total	20	80	100

Para o cálculo do $\chi^2$, como se está comparando proporções em uma tabela contingência $2\times2$ (ou seja, duas linhas e duas colunas), deve-se aplicar uma correção na fórmula, mostrada acima, para ajustar o viés de continuidade. Esta correção, denominada de correção de Yates, consiste em subtrair 0,5 do valor absoluto da diferença entre a frequência observada e a esperada em cada célula da tabela, antes de elevar ao quadrado e dividir pela frequência esperada.

\[\chi^{2}= \sum \left [\frac{\left |(O_{i} - E_{i}|-0,5 \right )^2}{E_{i}} \right]\]

Substituindo os dados na fórmula do qui-quadrado, tem-se:

\[\chi^{2}= \left [\frac{\left (|16 - 12 \right |-0.5)^2}{12} \right]+ \left [\frac{\left (|44 - 48 \right |-0.5)^2}{48} \right]+\left [\frac{\left (|4 - 8 \right |-0.5)^2}{8} \right]+\left [\frac{\left (|36 - 32 \right|-0.5)^2}{32} \right]\]

\[\chi^{2}=1,021 + 0,255 + 1,531 +0,383 = 3,19\]

A correção de Yates reduz o valor do qui-quadrado (sem a correção o valor do qui-quadrado seria 4,17) e torna o teste mais conservador, reduzindo a probabilidade de rejeitar a hipótese nula quando ela é verdadeira.

Indicação da correção de Yates

A correção é recomendada em tabelas de contingência $2\times2$ ou quando o tamanho da amostra é pequeno (menor que 40) ou quando há pelo menos uma célula com frequência esperada menor que 5.

19.2.2.1 Restrições ao qui-quadrado

Regra Geral

O teste pode ser usado, se a frequência observada em cada célula for maior ou igual a 5 e a frequência esperada for maior ou igual a 5.

Tabela 2 $\times$ 2 (gl = 1)

Como mostrado no exemplo acima, neste caso, é recomendada a Correção de Continuidade de Yates, mesmo quando o n for grande.

Tabela l $\times$ c

O teste pode ser usado se o número de células com frequência esperada inferior a 5 for menor do que 20% do total das células e nenhuma frequência esperada é igual a zero.

n pequeno

Neste caso, é preconizado o Teste Exato de Fisher.

19.2.2.2 Valor crítico do qui-quadrado

A estatística de teste (que em certo sentido é a diferença entre as frequências observadas e esperadas) deve ser comparada a um valor crítico para determinar se a diferença é grande ou pequena. Não se pode dizer se uma estatística de teste é grande ou pequena sem colocá-la em perspectiva com o valor crítico. Se a estatística de teste estiver acima do valor crítico, significa que a probabilidade de observar tal diferença entre as frequências observadas e esperadas é improvável.

O valor crítico pode ser encontrado na tabela estatística da distribuição Qui-quadrado e depende do nível de significância, denotado $\alpha$, e dos graus de liberdade, denotado $gl$. O nível de significância geralmente é igual a 5%. Os graus de liberdade para um teste de Qui-quadrado de independência são encontrados da seguinte forma:

\[gl = (numero \ de \ linhas - 1) \ \times \ (numero \ de \ colunas - 1)\]

Em uma tabela de contingência 2 $\times$ 2, como a Tabela 19.1, tem $gl = (2 - 1) \times (2 - 1) = 1$. Basta agora obter o valor crítico com a função qchisq():

alpha <-  0.05
gl = 1
qchisq (1-alpha, gl)

[1] 3.841459

Esse valor é comparado com o $\chi^{2}_{calculado}$ para um nível de significância de 5%. Se ele é maior, rejeita-se se a $H_{0}$; caso contrário, não se rejeita. Para obter o valor P, pode-se usar a função pchisq(), onde, como argumento, coloca-se o valor do $\chi^{2}_{calculado}$, os graus de liberdade e acrescenta-se lower.tail = FALSE para obter a probabilidade da cauda superior, uma vez que a distribuição do qui-quadrado é positiva.

O valor crítico é igual a 3,84 e, no exemplo, o $\chi^{2}_{calculado}$ é igual a 3,19, logo a valor p é igual a:

pchisq (3.19, 1, lower.tail = FALSE)

[1] 0.07409001

Dessa forma, conclui-se ,com uma confiança de 95%, que não se rejeita $H_{0}$, ou seja, a proporção acidentes nos homens é igual a proporção de acidentes nas mulheres ($\chi^{2} (1) = 3,19;P=0,074$). Observe na Figura 19.2 que o $\chi^{2}_{calculado}$ localiza-se a esquerda da linha vertical, da área vermelha de rejeição da $H_{0}$. Atente, que se não fosse feita a correção de Yates, a conclusão seria diferente, pois o $\chi^{2}_{calculado}$ seria igual a 4,17 e estaria um pouco cima do $\chi^{2}_{crítico}$, na área de rejeição da $H_{0}$. Com a correção de Yates o valor P é igual a 0,074, sem a correção de continuidade igual a 0,041, isto configura o que se chama de valor P marginal e, nesses casos, deve-se ter muito cuidado na conclusão, pois existe risco de erro tipo II, não rejeitar uma $H_{0}$ quando ela é falsa.

plotchisqtest(chisq = 3.84, 
              df = 1,
              colorleft = "aliceblue",
              colorright = "red",
              ylabel = "Densidade de probabilidade")

Figura 19.2: Distribuição do qui-quadrado, gl = 1, alpha = 0,05

O gráfico foi criado com a função plotchisqteste() do pacote nhstplot, pacote simples e conveniente para representar graficamente os testes de significância de hipótese nula mais comuns, como testes F, testes t e testes z (2).

19.2.3 Qui-Quadrado de Independência ou Associação

19.2.3.1 Dados usados no exemplo

O exemplo da Tabela 19.1, usado para mostrar a lógica do qui-quadrado, é um teste de independência ou associação. Ali, foi mostrado que não existe uma associação estatisticamente significativa (p > 0,05) entre acidentes automobilísticos e o sexo.
Como exercício, serão usados outros dados que necessitam mais manipulação, como treinamento do qui-quadrado de associação e do próprio R.

Cenário

A pergunta a ser respondida com os dados será

19.2.3.1.1 Leitura e transformação dos dados

Os dados serão provenientes do banco de dados dadosMater.xlsx. bastante usado neste livro ¹ . A partir do diretório, será feita a leitura da seguinte maneira:

¹ Ver Seção 5.6.

dados <- read_excel ("dados/dadosMater.xlsx")

Adicione a este arquivo uma variável denominada baixoPeso, usando a função mutate() do pacote dplyr e a função ifelse (), da base do R:

dados <- dados |> mutate(baixoPeso = ifelse(pesoRN < 2500, "1", "2"))

Onde 1 = sim e 2 = não, ou seja, com peso de nascimento < 2500g e $\ge$ 2500g.

O próximo passo é selecionar, deste arquivo, apenas esta variável criada e a variável fumo, porque o objetivo da análise será verificar se existe associação entre tabagismo na gestação e baixo peso ao nascer (< 2500g). Para isso, usa-se a função select() do pacote dplyr:

dados <- dados |> select (fumo, baixoPeso)

A seguir, será extraída uma amostra deste banco de dados com n = 300, usando a função slice_sample() do pacote dplyr. A função set.seed() apenas garante que os dados selecionados aleatoriamente se mantenham os mesmos em outros sorteios (veja Seção 9.7.2):

set.seed(123)
dados <- slice_sample(dados, n=300)
str(dados)

tibble [300 × 2] (S3: tbl_df/tbl/data.frame)
 $ fumo     : num [1:300] 2 2 1 2 2 2 1 2 2 2 ...
 $ baixoPeso: chr [1:300] "2" "2" "1" "2" ...

Todos esses passos poderiam ser feitos em um só comando, precedido pela semente (set.seed(123)), usando o operador pipe |>:

set.seed(123)
dados <- read_excel ("dados/dadosMater.xlsx") |> 
  mutate(baixoPeso = ifelse(pesoRN < 2500, "1", "2")) |> 
  select (fumo, baixoPeso) |> 
  slice_sample(n=300)

Tem-se, agora, um conjunto de dados com duas colunas: fumo, como uma variável numérica e baixoPeso, como caractere. Ambas devem ser transformadas em fator e, onde os rótulos são 1 e 2, passam para “sim” e “não” e mantendo a ordem “sim” e “não”.

dados$fumo <- factor(dados$fumo,
                     levels = c(1, 2),
                     labels = c("sim", "não"))

dados$baixoPeso <- factor(dados$baixoPeso,
                          levels = c(1, 2),
                          labels = c("sim", "não"))
str (dados)

tibble [300 × 2] (S3: tbl_df/tbl/data.frame)
 $ fumo     : Factor w/ 2 levels "sim","não": 2 2 1 2 2 2 1 2 2 2 ...
 $ baixoPeso: Factor w/ 2 levels "sim","não": 2 2 1 2 1 2 2 2 2 2 ...

19.2.3.1.2 Construção da Tabela

Antes de construir a Tabela 19.3, será verificado a distribuição de baixo peso de acordo com o tabagismo materno, usando a função with() e, dentro dela, a função table(), seguida da função addmargins():

tab <- with(data = dados, table(fumo, baixoPeso))
addmargins(tab)

     baixoPeso
fumo  sim não Sum
  sim  18  51  69
  não  22 209 231
  Sum  40 260 300

Assim, tem-se

Tabela 19.3: Baixo peso* ao nascer e tabagismo

Tabagismo	Baixo Peso	Sem Baixo Peso	Total
Sim	18	51	69
Não	22	209	260
Total	40	260	300
* Baixo Peso = peso ao nascer < 2500g

Observação

Uma tabela é constituída por linhas e colunas. Para se extrair valores da tabela, usa-se os colchetes, após o nome da tabela. O primeiro valor dentro dos colchetes é referente ao número da linha; o segundo, separado pela virgula, é referente ao número da coluna. Então, tab[1,1] se refere ao valor que está na primeira linha e primeira coluna:

tab[1,1]

[1] 18

A proporção de baixo peso por categoria de tabagismo (nº de casos/total da linha):

fumantes <-  tab[1,1]/(tab[1,1] + tab[1,2])
fumantes

[1] 0.2608696

não.fumantes <- tab[2,1]/(tab[2,1]+ tab[2,2])
não.fumantes

[1] 0.0952381

19.2.3.1.3 Visualização gráfica

Um gráfico de barras empilhadas, construído com o ggplot() do pacote ggplot2 (ver Seção 8.3), será usado para visualizar os dados:

  ggplot(dados) +
  aes (x = fumo, fill = baixoPeso) +
  geom_bar (color = "black") +
  scale_fill_manual(values = c("gray", "aliceblue")) +
  labs (title = NULL,  
        x = "Tabagismo",
        y = "Frequência") +
  annotate("text", x="sim", y=62, label= "26,1%") + 
  annotate("text", x = "não", y=223, label = "9,5%") +
  theme_classic () +
  theme (text = element_text (size = 12)) +
  labs(fill = "Peso ao nascer < 2500g")

Figura 19.3: Gráfico de barras empilhadas: tabagismo vs baixo peso ao nascer

Observa-se, Figura 19.3, que 26,1% das gestantes fumantes geram bebês com baixo peso, enquanto que entre as não fumantes este percentual cai três vezes, indo para 9,5%. É uma diferença grande! Aqui, quase se tem certeza que ela é significativa, mesmo sem cálculos!

19.2.3.2 Hipóteses estatísticas

$H_{0}$: a proporção de baixo peso é igual nos dois grupo (fumantes e não fumantes); não há associação entre as variáveis.

$H_{1}$: a proporção de baixo peso é diferente nos dois grupo (fumantes e não fumantes); existe associação entre as variáveis.

19.2.3.3 Cálculo do Qui-quadrado de Pearson no R

Para este exemplo, o $\chi^{2}$ irá verificar se existe uma associação entre as variáveis fumo e baixoPeso, assumindo um $\alpha = 0,05$ que equivale a um valor crítico de 3,84 com um grau de liberdade, em uma tabela $2 \times 2$. A função chisq_test() do pacote rstatix libera o qui-quadrado, usando os seguintes argumentos:

x $\to$ vetor numérico ou matriz. Tanto x como y podem ser fatores;
y $\to$ vetor numérico. Ignorado quando se x é uma matriz;
correct $\to$ TRUE é o padrão. Indica se deve ser aplicada a correção de continuidade ao calcular a estatística de teste para tabelas 2 por 2 ²;
… $\to$ para outros argumentos consulte a ajuda do RStudio.

² Quando não se está trabalhando com uma tabela $2 \times 2$ e a regra geral for obedecida e o n for grande, pode-se usar o qui-quadrado de Pearson sem correção.

Para executar a função chisq_test(), basta colocar como argumento as variáveis fumo e baixoPeso ou construir antes uma tabela de contingência com a função table() e depois colocá-la como argumento. Como tabela tab já existe:

teste <- rstatix::chisq_test(tab)
teste

# A tibble: 1 × 6
      n statistic        p    df method          p.signif
* <int>     <dbl>    <dbl> <int> <chr>           <chr>   
1   300      11.2 0.000809     1 Chi-square test ***

A saída do teste exibe tudo que é necessário. O $\chi^{2}$ = 11.2 com um valor muito maior que o valor crítico de 3,84, mostrando que a diferença é estatisticamente significativa (P = 8.09^{-4}). Essas e outras estatísticas podem ser obtidas, usando o objeto teste seguido do sinal $. Por exemplo, para o valor p:

teste$p

[1] 0.000809

Nota

Se um aviso como Chi-squared approximation may be incorrect (Aproximação qui-quadrado pode estar incorreta) aparecer, significa que as menores frequências esperadas são inferiores a 5. Para evitar esse problema, é possível usar uma das seguintes opções:

reunir alguns níveis (especialmente aqueles com um pequeno número de observações) para aumentar o número de observações nos subgrupos, ou
usar o teste exato de Fisher.

19.2.3.3.1 Outras maneiras de calcular o qui-quadrado no R

No pacote gmodels (3), existe uma função muito interessante, a função CrossTable() que que imprime, além de uma tabela de frequência com as proporções, exibe vários testes, como o teste $\chi^2$, o teste exato de Fisher e o teste de McNemar com e sem correção de continuidade. Consulte a ajuda para melhor estudar esta elegante função! Neste momento, será explorado apenas o qui-quadrado e os valores esperados com três dígitos:

CrossTable (tab,
            digits = 3,
            prop.chisq = FALSE,
            prop.t = FALSE,
            chisq = TRUE,
            expected = TRUE)


 
   Cell Contents
|-------------------------|
|                       N |
|              Expected N |
|           N / Row Total |
|           N / Col Total |
|-------------------------|

 
Total Observations in Table:  300 

 
             | baixoPeso 
        fumo |       sim |       não | Row Total | 
-------------|-----------|-----------|-----------|
         sim |        18 |        51 |        69 | 
             |     9.200 |    59.800 |           | 
             |     0.261 |     0.739 |     0.230 | 
             |     0.450 |     0.196 |           | 
-------------|-----------|-----------|-----------|
         não |        22 |       209 |       231 | 
             |    30.800 |   200.200 |           | 
             |     0.095 |     0.905 |     0.770 | 
             |     0.550 |     0.804 |           | 
-------------|-----------|-----------|-----------|
Column Total |        40 |       260 |       300 | 
             |     0.133 |     0.867 |           | 
-------------|-----------|-----------|-----------|

 
Statistics for All Table Factors


Pearson's Chi-squared test 
------------------------------------------------------------
Chi^2 =  12.61347     d.f. =  1     p =  0.0003829762 

Pearson's Chi-squared test with Yates' continuity correction 
------------------------------------------------------------
Chi^2 =  11.22084     d.f. =  1     p =  0.0008088369

Observe que a saída mostra em cada célula da tabela, o número de casos, o número esperado, a percentagem por linha (nº de casos/total da linha) e a percentagem por coluna (nº de casos/total da coluna). Por último, exibe o qui-quadrado de Pearson com e sem correção de continuidade de Yates.

19.2.3.4 Conclusão e relato dos resultados

Usando a correção de continuidade de Yates, pois é uma tabela $2\times2$, vê-se que o valor p é menor que o nível de significância de 5% e, consequentemente, rejeita-se a hipótese nula e conclui-se que existe uma associação significativa entre tabagismo na gestação e o baixo peso ao nascimento ($\chi^{2}_{com \ correção \ de \ Yates} (1)$ = 11.2; P = 0,00081).

Além disso, no relato dos resultados pode-se apresentar uma tabela ou em um gráfico.

19.2.3.4.1 Tabela

Para a construção da tabela, pode-se usar a função ctable() do pacote summarytools(4) para obter uma tabela com todos os dados a serem exibidos. O argumento prop = "r" exibe os percentuais das linhas (“c”, nas colunas). Na realidade, são maneiras diferente de se obter o mesmo resultado.

ctable(dados$fumo, dados$baixoPeso,
       prop = "r", 
       chisq = TRUE, 
       headings = FALSE,
       OR = TRUE)

Error in if (tmp_name %in% colnames(obj)) {: the condition has length > 1

Error in if (tmp_name %in% colnames(obj)) {: the condition has length > 1


------------ ----------------- ------------ ------------- --------------
               dados$baixoPeso          sim           não          Total
  dados$fumo                                                            
         sim                     18 (26.1%)    51 (73.9%)    69 (100.0%)
         não                     22 ( 9.5%)   209 (90.5%)   231 (100.0%)
       Total                     40 (13.3%)   260 (86.7%)   300 (100.0%)
------------ ----------------- ------------ ------------- --------------

----------------------------
 Chi.squared   df   p.value 
------------- ---- ---------
   11.2208     1     8e-04  
----------------------------

----------------------------------
 Odds Ratio   Lo - 95%   Hi - 95% 
------------ ---------- ----------
    3.35        1.67       6.71   
----------------------------------

Ou seja, os bebês que se expuseram ao fator de risco (fumo) têm uma chance 3,35 (IC95% : 1,67-6,71) vezes maior de apresentar peso < 2500g ao nascer, nessa amostra.

Além desses resultados, a tabela final pode conter (e isto é recomendado!) os intervalos de confiança para cada uma das proporções de fumantes e não fumantes. Para isso a função BinomCI() cumpre um papel suficiente (veja Seção 12.6.1).

Então, a proporção de baixo peso entre as fumantes é:

BinomCI(18, 69,
        conf.level = 0.95,
        method = "clopper-pearson")

           est    lwr.ci    upr.ci
[1,] 0.2608696 0.1625161 0.3805962

E, entre as não fumantes é:

BinomCI(22, 231,
        conf.level = 0.95,
        method = "clopper-pearson")

           est     lwr.ci    upr.ci
[1,] 0.0952381 0.06065157 0.1406387

Finalmente, esses dados podem ser colocados em uma tabela, como a Tabela 19.4:

Tabela 19.4: Efeito do tabagismo materno no peso ao nascer

Peso ao nascer	Fumantes	Não fumantes	Valor P*
Baixo Peso	18/69	22/231	0.00081
IC95%	16,3-38,1	6,1-14,1
* Qui-quadrado de Pearson com correção

19.2.3.4.2 Gráfico

Uma boa apresentação gráfica complementa o relatório dos resultados. Pode-se fazer isso com gráfico de barras empilhadas (Figura 19.3), acompanhado dos percentuais e do tipo de teste realizado, usando a função get_test_label() que necessita do teste calculado com a função chisq_test() do pacote rstatix, apresentado antes. O gráfico assume o aspecto da Figura 19.4:

ggplot(dados) +
    aes (x = fumo, fill = baixoPeso) +
    geom_bar (color = "black") +
    scale_fill_manual(values = c("gray", "gray95")) +
    labs (title = NULL,
          subtitle = get_test_label (teste, detailed = TRUE),
          x = "Tabagismo",
          y = "Frequência") +
    annotate("text", x="sim", y=62, label= "24,6% (15,0-36,5)") + 
    annotate("text", x = "não", y=223, label = "8,2% (5,0-12,5)") +
    theme_classic () +
    theme (text = element_text (size = 12)) +
    labs(fill = "Peso ao nascer < 2500g")

Figura 19.4: Gráfico de barras empilhadas: tabagismo vs baixo peso ao nascer

19.2.4 Qui-Quadrado de Aderência ou do Melhor Ajuste

O teste de qualidade de ajuste do qui-quadrado (chi-square goodness of fit) é usado para comparar a distribuição observada com uma distribuição esperada, em uma situação em que se tem duas ou mais categorias em dados discretos. Em outras palavras, ele compara várias proporções observadas com as probabilidades esperadas (5).

19.2.4.1 Dados usados no exemplo

Cenário

Há uma dúvida se o número de pacientes que procura uma determinada Unidade de Pronto Atendimento (UPA) é aproximadamente o mesmo em todos os dias da semana. Esta é uma informação importante sob o ponto de vista administrativo. Para se atingir este objetivo registrou-se o número de pacientes que procurou a UPA por dia da semana.

O número de atendimentos nos sete dias (de segunda-feira à domingo) da semana está representada pela frequência observada, freq_obs:

freq_obs <- c(20, 17, 22, 21, 26, 33, 36)
freq_obs

[1] 20 17 22 21 26 33 36

O total de atendimentos durante uma semana é igual a:

soma <- sum(freq_obs)
soma

[1] 175

Assim, a frequência esperada diária é igual a soma total dos atendimentos dividido pelo número observações (no caso, dias da semana), representada por k:

k = 7
freq_esp <- soma/k
freq_esp

[1] 25

Com esses valores , pode-se criar um vetor, p, com as proporções dos atendimentos diários esperados:

p <- rep(freq_esp/soma, 7)
p

[1] 0.1428571 0.1428571 0.1428571 0.1428571 0.1428571 0.1428571 0.1428571

19.2.4.2 Hipóteses estatísticas

$H_{0}$: a distribuição das frequências observadas (O) é igual a distribuição de frequências esperadas (E).

$H_{1}$: a distribuição das frequências observadas (O) não é igual a distribuição de frequências esperadas (E)

19.2.4.3 Cálculo da estatística do teste

Assumindo um $\alpha = 0,05$. Os graus de liberdade são calculados como o número de células (k) menos 1: $gl = (k - 1)$. O $\chi^{2}_{crítico}$ pode ser encontrado usando:

alpha = 0.05
k = 7
gl = k - 1
qchisq (1 - alpha, gl)

[1] 12.59159

Em outras palavras, se o $\chi^{2}_{calculado}$ > $\chi^{2}_{crítico}$, rejeita-se a $H_{0}$. Na Figura 19.5, o resultado tem que ficar à direita da linha vertical vermelha para que a hipótese nula seja rejeitada. Se cair fora da área de rejeição, à esquerda da linha vertical vermelha, aceita-se a hipóteses nula.

plotchisqtest(chisq = 12.6, 
              df = 6,
              colorleft = "aliceblue",
              colorright = "red",
              ylabel = "Densidade de probabilidade",
              colorcut = "red")

Figura 19.5: Distribuição do qui-quadrado, gl = 6, alpha = 0,05

A estatística do teste pode ser encontrada, usando a função chisq.test():

teste1 <- rstatix::chisq_test (x = freq_obs, y = NULL, p = p)
teste1

# A tibble: 1 × 6
      n statistic     p    df method          p.signif
* <int>     <dbl> <dbl> <dbl> <chr>           <chr>   
1     7        12 0.062     6 Chi-square test ns

19.2.4.4 Conclusão

Observando-se a saída do teste do qui-quadrado, verifica-se que o $\chi^{2}_{calculado}$ < $\chi^{2}_{crítico}$, portanto, não se rejeita a $H_{0}$ e conclui-se que, nesta amostra, com uma confiança de 95%, que a frequência observada de pacientes à UPA é igual a esperada (P = 0.062). Lembrando que, neste caso, como se tem um valor P limitrofe, marginal, existe a possibilidade de se estar aceitando uma $H_{0}$ falsa e cometendo um erro tipo II. Seria recomendado, aumentar o tamanho amostral em uma nova coleta, usando estes dados como um piloto para o cálculo amostral.

19.2.5 Qui-quadrado de Pearson para tabelas extensas

Este teste é utilizado quando o número de grupos, k, é superior a 2.

19.2.5.1 Dados usados como exemplo

Cenário

Em um hospital pediátrico, 144 recém-nascidos foram submetidos a diferentes procedimentos cirúrgicos (abdominal, cardíaco ou outro). Os cirurgiões estavam preocupados em saber se há uma tendência de maior taxa de infecção entre os neonatos que permanecem mais tempo hospitalizados.

O banco de dados dadosCirurgia.xlsx que pode ser encontrado aqui. Salve o mesmo no seu diretório de trabalho. As variáveis disponíveis no banco de dados são:

id $\to$ identificação do neonato;
sexo $\to$ sexo do recém-nascido, fem e masc;
peso $\to$ peso do neonato em gramas;
tempohosp $\to$ tempo de hospitalização em dias;
infec $\to$ presença de infecção secundária: sim e não;
cirurgia $\to$ tipo de cirurgia: abdominal, cardíaca, outra.

A variável tempo de hospitalização (tempohosp) é contínua e assimétrica. Para ser usada aqui, será categorizada por quartis. A variável infec (presença de infecção) é uma variável dicotômica (sim, não).

19.2.5.1.1 Leitura e transformação dos dados

A leitura dos dados pode ser feita com:

cirurgia <- read_excel ("dados/dadosCirurgia.xlsx")
str(cirurgia)

tibble [144 × 7] (S3: tbl_df/tbl/data.frame)
 $ id       : num [1:144] 1 2 3 4 5 6 7 8 9 10 ...
 $ sexo     : chr [1:144] "masc" "masc" "masc" "masc" ...
 $ peso     : num [1:144] 2020 1850 2540 1150 2900 ...
 $ ig       : num [1:144] 36 30 38 31 36 37 38 39 38 39 ...
 $ tempohosp: num [1:144] 37 37 37 46 37 36 30 18 25 14 ...
 $ infec    : chr [1:144] "não" "não" "sim" "sim" ...
 $ cirurgia : chr [1:144] "abdominal" "abdominal" "abdominal" "outra" ...

Os dados foram atribuídos a um objeto denominado de cirurgia. Característicamente, a variável tempohosp (tempo de hospitalização) é assimétrica (Figura 19.6):

cirurgia |> ggplot() +
    geom_histogram(aes(x = tempohosp,
                       y = after_stat(density)), 
                   fill = "tomato",
                   bins = 20,
                   col=alpha("gray40",0.5)) +
  geom_function(fun=dnorm,
                args=list(mean=mean(cirurgia$tempohosp, na.rm = T),
                          sd= sd(cirurgia$tempohosp, na.rm = T)), 
                col='dodgerblue4',
                lwd=1,
                lty=2) + 
  labs(x='Tempo de hospitalização (dias)',    
       y='Densidade de probabilidade') +
  theme_bw()

Figura 19.6: Distribuição da variável tempo de hospitalização

A variável tempohosp será categorizada em quartis. O resumo da mesma, usando a função summary(), fornece orientação para esse procedimento com o retorno do 1º quartil, mediana e 3º quartil:

summary (cirurgia$tempohosp)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00   20.75   27.50   37.42   42.00  245.00

A categorização da variável tempohosp, que será realizada, usando a função cut(), consulte a Seção 7.2.3.3 para detalhes de construção de uma tabela de frequência:

cirurgia$tempo <- cut(cirurgia$tempohosp, 
                      breaks = c(1, 20.75, 27.50, 42.00, 245),
                      labels = c("<= 21","22-28", "29-42",">42"),
                      right = FALSE, 
                      include.lowest = TRUE)

tab1 <- table (cirurgia$tempo)
tab1


<= 21 22-28 29-42   >42 
   36    36    35    37

Por exemplo, 36 recém-nascidos permaneceram 21 dias ou menos no pós-operatório e 37 recém-nascidos ficaram internados mais do que 42 dias.

Agora, a variável cirurgia$infec será colocada como um fator:

cirurgia$infec <- factor(cirurgia$infec, levels = c("sim", "não"))
table(cirurgia$infec)


sim não 
 56  88

A nova variável tempo será cruzada com a variável infec em uma tabela:

tab2 <- with(data = cirurgia, table(tempo, infec))
addmargins(tab2)

       infec
tempo   sim não Sum
  <= 21   9  27  36
  22-28  11  25  36
  29-42  14  21  35
  >42    22  15  37
  Sum    56  88 144

Ou seja, a proporção de recém-nascidos que se infectaram no pós-operatório foi 56/144 = 0,39 ou 39%. Se for calculada a proporção para cada um dos quartis do tempo de hospitalização, através da função ctable() do pacote summarytools, observa-se que a proporção de neonatos infectados no pós-operatório aumenta com o tempo de hospitalização:

19.2.5.2 Hipóteses estatísticas

$H_{0}$: A presença de infecção não altera o tempo de hospitalização.

$H_{1}$: A presença de infecção altera o tempo de hospitalização.

19.2.5.3 Cálculo da estatística do teste

O teste estatístico pode ser calculado, usando o argumento chisq = TRUE na função ctable():

summarytools::ctable(cirurgia$tempo, cirurgia$infec,
                      prop = "r",
                      chisq = TRUE,
                      headings = FALSE)


------- ------- ------------ ------------ --------------
          infec          sim          não          Total
  tempo                                                 
  <= 21            9 (25.0%)   27 (75.0%)    36 (100.0%)
  22-28           11 (30.6%)   25 (69.4%)    36 (100.0%)
  29-42           14 (40.0%)   21 (60.0%)    35 (100.0%)
    >42           22 (59.5%)   15 (40.5%)    37 (100.0%)
  Total           56 (38.9%)   88 (61.1%)   144 (100.0%)
------- ------- ------------ ------------ --------------

----------------------------
 Chi.squared   df   p.value 
------------- ---- ---------
   10.5801     3    0.0142  
----------------------------

19.2.5.4 Conclusão

A partir desses resultados, pode-se inferir que a menor taxa de infecção ocorre no grupo do primeiro quartil e é significativamente diferente em relação a taxa de infecção do maior quartil, mas sem indicação para os grupos intermediários. É útil fazer o teste de tendência linear (Linear-by-linear Association). Para isso, pode-se usar a função lbl_test () do pacote coin.

coin::lbl_test (cirurgia$tempo ~ cirurgia$infec)


    Asymptotic Linear-by-Linear Association Test

data:  cirurgia$tempo (ordered) by cirurgia$infec (sim, não)
Z = 3.1231, p-value = 0.001789
alternative hypothesis: two.sided

Este teste indica uma tendência significativa para a presença de infecção à medida que aumenta o tempo de hospitalização (P = 0,0018).

19.3 Teste exato de Fisher

O teste do qui-quadrado não é um método apropriado de análise se a amostra é pequena. Por exemplo, se n for menor que 20 ou se n estiver entre 20 e 40 e uma das frequências esperadas for menor que 5, o teste do qui-quadrado deve ser evitado. Nesta situação, é recomendado o teste exato de Fisher.

19.3.1 Dados usados como exemplo

Cenário

Um estudo estabeleceu como objetivo verificar se a asma não controlada é um fator de risco para a procura da emergência. Foram acompanhados 16 escolares asmáticos durante um ano com relação ao número de visitas à emergência de acordo com o controle da sua asma.

19.3.1.1 Entrando com os dados

Em primeiro lugar, serão criadas duas variáveis:

emerg <- c (1,1,2,2,2,2,2,1,1,1,1,1,1,1,1,2)
controle <- c (1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2)

A seguir, usando essas variáveis, será construído um dataframe que será atribuído ao objeto dadosAsma:

dadosAsma <- data.frame(emerg, controle)

19.3.1.2 Transformação dos dados

Ambas as variáveis são numéricas e serão transformadas em fatores, considerando para a variável emerg, 1 = “consultou” e 2 = “não consultou”, e, para a variável controle, 1 = “asma controlada” e 2 = “asma não controlada”. É importante manter a ordem:

dadosAsma$emerg <- factor (dadosAsma$emerg,
                           levels = c (1,2),
                           labels = c ('consultou', 'não consultou'))
dadosAsma$controle <- factor (dadosAsma$controle, 
                          levels = c (1,2),
                          labels = c ('asma controlada', 'não controlada'))
str(dadosAsma)

'data.frame':   16 obs. of  2 variables:
 $ emerg   : Factor w/ 2 levels "consultou","não consultou": 1 1 2 2 2 2 2 1 1 1 ...
 $ controle: Factor w/ 2 levels "asma controlada",..: 1 1 1 1 1 1 1 2 2 2 ...

19.3.1.3 Construção da tabela

Para o cálculo da estatística do teste, é necessário uma tabela $2\times2$ (Tabela 19.5), obtida com os dados acima:

tab3 <- with(data = dadosAsma, table(controle, emerg))

Tabela 19.5: Consulta à emergência e controle da asma (tab3)

	Visita à Emergência
Controle	Sim	Não	Total
Asma controlada	2	5	7
Não controlada	8	1	9
Total	10	6	16

19.3.2 Hipóteses estatísticas

$H_0$: as variáveis são independentes, não há relação entre as duas variáveis categóricas.

$H_1$: as variáveis são dependentes, existe uma relação entre as duas variáveis categóricas.

19.3.3 Cálculo da estatística do teste

O teste exato de Fisher é usado quando há pelo menos uma célula na tabela de contingência das frequências esperadas abaixo de 5. Para recuperar as frequências esperadas, use a função chisq.test(), do R base, junto com $expected:

teste2 <- chisq.test(tab3)

Warning in chisq.test(tab3): Aproximação do qui-quadrado pode estar incorreta

A saída do teste imprime um aviso de que o qui-quadrado pode estar incorreto. Há necessidade, devido a presença de três células com valores abaixo de 5, de se usar o teste de Fisher. este pode ser obtido através da função fisher_test(), do pacote rstatix, colocando uma tabela $2\times2$ como argumento, tab3:

rstatix::fisher_test (tab3, detailed = TRUE)

# A tibble: 1 × 8
      n estimate     p conf.low conf.high method            alternative p.signif
* <int>    <dbl> <dbl>    <dbl>     <dbl> <chr>             <chr>       <chr>   
1    16   0.0646 0.035 0.000953     0.991 Fisher's Exact t… two.sided   *

19.3.4 Conclusão

O valor $P=0,035$ é menor que o nível de significância de 5%, previamente estabelecido, e, portanto, deve-se rejeitar a hipótese nula. No contexto, rejeitar a hipótese nula para o teste exato de independência de Fisher significa que há uma associação significativa entre as duas variáveis categóricas (controle da asma e visitas à emergência).

19.4 Teste de McNemar

É um teste estatístico não paramétrico aplicável nos estudos tipo “antes-e-depois” em que cada indivíduo é utilizado como seu próprio controle e a medida é efetuada em escala nominal. O teste de McNemar é usado para determinar se há uma diferença estatisticamente significativa nas proporções entre os dados emparelhados.

As medidas coletadas nesses tipos de projetos de estudo não são independentes e, portanto, os testes do Qui-quadrado não podem ser usados porque os pressupostos serão violados.

O teste de McNemar é usado para avaliar se há uma mudança significativa nas proporções ao longo do tempo para dados emparelhados ou se há uma diferença significativa nas proporções entre casos e controles. O resultado de interesse é a mudança dentro da pessoa (ou diferenças dentro do par) e não há variáveis explicativas.

O teste é calculado examinando o número de respostas que são concordantes para positivo (sim em ambas as ocasiões) e negativo (não em ambas as ocasiões) e o número de pares disconcordantes (sim e não, ou não e sim). Os pares concordantes não fornecem informações sobre as diferenças e não são usados na avaliação. Em vez disso, deve-se concentrar nos pares discordantes, que podem ser divididos em dois tipos: um par discordante do tipo sim – não e um par discordante tipo não – sim (6).

19.4.1 Pressupostos do teste de McNemar

Os pressupostos para o teste de McNemar são:

A variável desfecho é binária, dicotômica;
Cada participante é representado na tabela apenas uma vez;
A diferença entre as proporções emparelhadas é o resultado de interesse;
O teste de McNemar pode não ser confiável se houver contagens baixas nas células “discordantes”. Existe recomendação de que a soma dessas células seja $\ge 20$ (7).

19.4.2 Dados usados como exemplo

Cenário

Em uma universidade, um professor de bioestatística comparou as atitudes de 200 estudantes de Medicina em relação à confiança que eles depositam na análise estatística antes e depois da conclusão da disciplina. A pergunta feita foi: Confiam na análise estatística utilizada nos periódicos médicos?

As respostas obtidas estão na Tabela 19.6:

Tabela 19.6: Confiança na análise estatística após término da disciplina

	Pós-teste
Pré-Teste	Sim	Não	Total
Sim	20 (a)	8 (b)	28
Não	22 (c)	150 (d)	172
Total	42	158	200

19.4.3 Hipóteses estatísticas

Considerando as caselas a, b, c e d da Tabela 19.6, a hipótese nula de homogeneidade marginal indica que as duas probabilidades marginais para cada resultado são as mesmas, isto é,

\[p_{a} + p_{b} = p_{a} + p_{c}\] e

\[p_{c} + p_{d} = p_{b} + p_{d}\]

Assim, a hipótese nula e a hipótese alternativa são:

$H_{0}$: a proporção de alunos que respondem sim no pré-teste e no pós-teste é a mesma.

$H_{1}$: a proporção de alunos que respondem sim no pré-teste e no pós-teste não é a mesma.

19.4.4 Lógica do teste

O teste estatístico de McNemar, com correção de continuidade, é obtido utilizando a equação:

\[\chi^{2} = \frac {\left (\left |b - c \right |- 1 \right )^{2}}{b + c}\]

Sob a hipótese nula, com um número suficientemente grande de discordantes (células b e c), o $\chi^{2}$ tem uma distribuição qui-quadrado com um grau de liberdade. Se o resultado é significativo, isto é, fornece evidências suficientes para rejeitar a hipótese nula, significa que as proporções marginais são significativamente diferentes umas das outras.

Substituindo os dados da Tabela na Equação, tem-se:

a <- 20
b <- 8
c <- 22
d <- 150
chi <- ((abs(b - c) - 1)^2)/(b + c)
chi

[1] 5.633333

Assumindo um $\alpha = 0,05$, pode-se obter valor crítico para o $\chi^{2}$ para gl = 1, usando a função qchisq(), do pacote stats:

alpha = 0.05
qchisq(1 - alpha, 1)

[1] 3.841459

Desta maneira, rejeita-se a $H_{0}$, pois o $\chi_{calculado}^{2} > \chi_{crítico}^{2}$. O valor P pode ser conseguido com a função pchisq():

pchisq (5.633, 1, lower.tail = FALSE)

[1] 0.01762544

19.4.5 Cálculo do teste de McNemar

Carregar o arquivo dadosBioestatistica.xlsx, que pode ser encontrado aqui. Este conjunto de dados contem os dados da Tabela 19.6.

dados <- readxl::read_excel("dados/dadosBioestatistica.xlsx")

Construir uma tabela de contingência

dados$preteste <- factor(dados$preteste, levels = c("sim", "não"))
dados$posteste <- factor(dados$posteste, levels = c("sim", "não"))
tab4 <- table(dados$preteste, dados$posteste, 
            dnn = c("Pré-teste", "Pós-teste"))
tab4

         Pós-teste
Pré-teste sim não
      sim  20   8
      não  22 150

Agora, pode-se calcular o teste de McNemar³ com a função mcnemar_test() do pacote rstatix:

³ É possível também obter o teste de McNemar de outras formas, como, por exemplo, usando a função CrossTable() do pacote gmodels.

rstatix::mcnemar_test (tab4, 
                       correct = TRUE)

# A tibble: 1 × 6
      n statistic    df      p p.signif method      
* <int>     <dbl> <dbl>  <dbl> <chr>    <chr>       
1   200      5.63     1 0.0176 *        McNemar test

O resultado do teste de McNemar com correção de continuidade é exatamente igual ao calculado manualmente.

19.4.6 Conclusão

Houve uma modificação estatisticamente significativa na opinião dos alunos após o curso de Bioestatística em relação à confiança nas análises estatísticas (86% no pré-teste de respostas não x 79% no pós-teste, $\chi^{2} = 5,63, gl = 1, P = 0,018$). Alguns alunos (14) mudaram de opinião em relação a sua confiança nas análises estatísticas dos periódicos médicos.

Referências

Altman DG. Comparing groups: categorical data. Em: Practical Statistics for Medical Research. London: Chapman & Hall/CRC; 1991. p. 244–7.

Myszkowski N. nhstplot package [Internet]. RDocumentation. 2020. Disponível em: https://rdocumentation.org/packages/nhstplot/versions/1.1.0

Warnes GR, Bolker B, et al. Gmodels: Various R programming tools for model fitting [Internet]. CRAN R Project. 2022. Disponível em: https://rdrr.io/cran/gmodels/

Comtois D. summarytools: Tools to Quickly and Neatly Summarize Data [Internet]. CRAN R Project. 2022. Disponível em: https://github.com/dcomtois/summarytools

Daniel WW, Cross CL. The chi-square distribution and analysis of frequencies. Em: Practical Statistics for Medical Research. Hoboken, NJ: John Wiley & Sons, Inc; 2013. p. 604–19.

Eliasziw M, Donner A. Application of the McNemar test to non-independent matched pair data. Statistics in medicine. 1991;10(12):1981–91.

Rosner B. Hypothesis Testing: Categorical Data. Em: Fundamentals of Biostatistics. Seventh Edition. Boston: Cengage; 2011. p. 377.

# Análise de Dados Categóricos ## Pacotes necessários ```{r} #| message: false #| warning: false pacman::p_load(coin, DescTools, dplyr, flextable, ggplot2, gmodels, nhstplot, readxl, rstatix, summarytools) ``` ## Qui-Quadrado {#sec-qui} Dois testes de hipótese são proeminentes na pesquisa na área da saúde. Um é o teste *t* de duas amostras, que é usado para testar a igualdade de duas médias populacionais independentes. O segundo é o teste qui-quadrado (denotado por $\chi^{2}$). O teste é denominado teste qui-quadrado porque usa a distribuição qui-quadrado ou $\chi^{2}$. ### Distribuição qui-quadrado Se uma variável *X* é normalmente distribuída, então a variável $X^{2}$ tem uma distribuição qui-quadrado [@altman1991chisquared]. A distribuição qui-quadrado com *k* categorias é a distribuição de uma soma dos quadrados de *k* variáveis aleatórias independentes com distribuição normal. O número de categorias determina o número de graus de liberdade. O formato da distribuição qui-quadrado depende desses graus de liberdade. Em geral, ela é assimétrica com apenas valores positivos, iniciando em zero. A assimetria diminui à medida que aumentam os graus de liberdade. Para cada grau de liberdade tem-se curvas de distribuição diferentes. ```{r} #| label: fig-chi #| message: false #| warning: false #| out-height: "70%" #| out-width: "70%" #| fig-align: "center" #| fig-cap: "Distribuição do Qui-Quadrado" curve(dchisq(x, df = 5), from = 0, to = 60, col = "royalblue", lwd =2, bty = "n") curve(dchisq(x, df = 10), from = 0, to = 60, col = "red", lwd =2, add = T) curve(dchisq(x, df = 15), from = 0, to = 40, col = "orange", lwd =2, add = T) curve(dchisq(x, df = 20), from = 0, to = 40, col = "cyan", lwd =2, add = T) curve(dchisq(x, df = 30), from = 0, to = 60, col = "green3", lwd =2, add = T) box(bty = "l") legend (legend=c ("gl = 05", "gl = 10", "gl = 15", "gl = 20", "gl = 30"), fill = c ("royalblue", "red", "orange", "cyan", "green3"), bty="n", cex = 1, x ="right") ``` A distribuição $\chi^{2}$ converge para a distribuição normal à medida que os graus de liberdade aumentam, de acordo com o teorema do limite central, entretanto esta convergência é lenta (@fig-chi). A distribuição qui-quadrado tem duas aplicações comuns: primeiro, como um teste para saber se duas variáveis categóricas são independentes ou não (**Teste de independência ou associação**); segundo, o teste de qualidade do ajuste do qui-quadrado (**Teste de aderência ou ajuste**) que é usado para comparar uma determinada distribuição com uma distribuição conhecida. ### Lógica da estatística do qui-quadrado O cálculo da estatística $\chi^{2}$ é baseado nas frequências existentes nas células da tabela de contingência. Em primeiro lugar, calcula-se as frequências que se espera em cada célula caso a hipótese nula seja verdadeira (**frequências esperadas**). Em segundo lugar, usando a equação geral, o teste mede o grau de discrepância entre o conjunto de **frequências observadas** (O) e o conjunto de **frequências esperadas** (E). $$\chi^{2}= \sum \left [\frac{\left (O_{i} - E_{i} \right )^2}{E_{i}} \right]$$ Se $O_{i}$ é muito semelhante ao $E_{i}$, então o $\chi^{2}$ é baixo; se $O_{i}$ é muito diferente em relação ao $E_{i}$, então o $\chi^{2}$ é alto. As *frequências observadas* são o número de sujeitos ou objetos na amostra que se enquadram nas várias categorias da variável de interesse. As *frequências esperadas* são o número de sujeitos ou objetos na amostra que seria esperado observar se hipótese nula fosse verdadeira. $$E = \frac{total\ coluna\ \times total\ linha }{total\ geral}$$ Por exemplo, suponha os dados da @tbl-tab2x2, ```{r} #| label: tbl-tab2x2 #| echo: false #| message: false #| warning: false #| tbl-cap: "Distribuição de Acidentes Automobilísticos por Gênero" Sexo <-c("Homens", "Mulheres", "Total") Acidentes <- c(16, 4, 20) Sem_acidentes <- c(44, 36, 80) Total <- c(60, 40, 100) df <- data.frame(Sexo, Acidentes, Sem_acidentes, Total) my_flextable <- flextable(df) |> set_header_labels( Sexo = "Sexo", Acidentes = "Com Acidentes", Sem_acidentes = "Sem Acidentes", Total = "Total de Pessoas" ) |> autofit() |> theme_booktabs() |> align(align = "center", part = "all") |> bold(part = "header") |> bold(i = ~ Sexo == "Total", part = "body") |> hline(i = 2, part = "body", border = fp_border_default(color = "black", width = 1.5)) my_flextable ``` o número de acidentes esperados para os homens ```{r} total_c <- df$Acidentes[3] total_l <- df$Total[1] total_geral <- df$Total[3] esperado <- (total_c*total_l)/total_geral esperado ``` é igual a `r esperado`, entretanto ocorreram `r df$Acidentes[1]`. Houve uma **diferença**. Essa diferença é calculada para todas as células e é o importante no cálculo do qui-quadrado. Após o cálculo, acrescentando os valores esperados à @tbl-tab2x2, tem-se a @tbl-ntab2x2 que é usada no cálculo do qui-quadrado. ```{r} #| label: tbl-ntab2x2 #| echo: false #| message: false #| warning: false #| tbl-cap: "Distribuição de Acidentes Automobilísticos por Gênero" Sexo <-c("Homens", "Mulheres", "Total") Acidentes <- c(12, 8, 20) Sem_acidentes <- c(48, 32, 80) Total <- c(60, 40, 100) df <- data.frame(Sexo, Acidentes, Sem_acidentes, Total) my_flextable <- flextable(df) |> set_header_labels( Sexo = "Sexo", Acidentes = "Com Acidentes", Sem_acidentes = "Sem Acidentes", Total = "Total de Pessoas" ) |> autofit() |> theme_booktabs() |> align(align = "center", part = "all") |> bold(part = "header") |> bold(i = ~ Sexo == "Total", part = "body") |> hline(i = 2, part = "body", border = fp_border_default(color = "black", width = 1.5)) my_flextable ``` Para o cálculo do $\chi^2$, como se está comparando proporções em uma tabela contingência $2\times2$ (ou seja, duas linhas e duas colunas), deve-se aplicar uma correção na fórmula, mostrada acima, para ajustar o viés de continuidade. Esta correção, denominada de *correção de Yates*, consiste em subtrair 0,5 do valor absoluto da diferença entre a frequência observada e a esperada em cada célula da tabela, antes de elevar ao quadrado e dividir pela frequência esperada. $$\chi^{2}= \sum \left [\frac{\left |(O_{i} - E_{i}|-0,5 \right )^2}{E_{i}} \right]$$ Substituindo os dados na fórmula do qui-quadrado, tem-se: $$\chi^{2}= \left [\frac{\left (|16 - 12 \right |-0.5)^2}{12} \right]+ \left [\frac{\left (|44 - 48 \right |-0.5)^2}{48} \right]+\left [\frac{\left (|4 - 8 \right |-0.5)^2}{8} \right]+\left [\frac{\left (|36 - 32 \right|-0.5)^2}{32} \right]$$ $$\chi^{2}=1,021 + 0,255 + 1,531 +0,383 = 3,19$$ A correção de Yates reduz o valor do qui-quadrado (sem a correção o valor do qui-quadrado seria 4,17) e torna o teste mais conservador, reduzindo a probabilidade de rejeitar a hipótese nula quando ela é verdadeira. ::: callout-important ## Indicação da correção de Yates A correção é recomendada em tabelas de contingência $2\times2$ ou quando o tamanho da amostra é pequeno (menor que 40) ou quando há pelo menos uma célula com frequência esperada menor que 5. ::: #### Restrições ao qui-quadrado 1. [Regra Geral]{.underline} O teste pode ser usado, se a frequência observada em cada célula for maior ou igual a 5 e a frequência esperada for maior ou igual a 5. 2. [Tabela 2 $\times$ 2 (gl = 1)]{.underline} Como mostrado no exemplo acima, neste caso, é recomendada a *Correção de Continuidade de Yates*, mesmo quando o n for grande. 3. [Tabela l $\times$ c]{.underline} O teste pode ser usado se o número de células com frequência esperada inferior a 5 for menor do que 20% do total das células e nenhuma frequência esperada é igual a zero. 4. [n pequeno]{.underline} Neste caso, é preconizado o *Teste Exato de Fisher*. #### Valor crítico do qui-quadrado A estatística de teste (que em certo sentido é a diferença entre as frequências observadas e esperadas) deve ser comparada a um valor crítico para determinar se a diferença é grande ou pequena. Não se pode dizer se uma estatística de teste é grande ou pequena sem colocá-la em perspectiva com o valor crítico. Se a estatística de teste estiver acima do valor crítico, significa que a probabilidade de observar tal diferença entre as frequências observadas e esperadas é improvável. O valor crítico pode ser encontrado na tabela estatística da distribuição Qui-quadrado e depende do nível de significância, denotado $\alpha$, e dos graus de liberdade, denotado $gl$. O nível de significância geralmente é igual a 5%. Os graus de liberdade para um teste de Qui-quadrado de independência são encontrados da seguinte forma: $$gl = (numero \ de \ linhas - 1) \ \times \ (numero \ de \ colunas - 1)$$ Em uma tabela de contingência 2 $\times$ 2, como a @tbl-tab2x2, tem $gl = (2 - 1) \times (2 - 1) = 1$. Basta agora obter o valor crítico com a função `qchisq()`: ```{r} alpha <- 0.05 gl = 1 qchisq (1-alpha, gl) ``` Esse valor é comparado com o $\chi^{2}_{calculado}$ para um nível de significância de 5%. Se ele é maior, rejeita-se se a $H_{0}$; caso contrário, não se rejeita. Para obter o valor *P*, pode-se usar a função `pchisq()`, onde, como argumento, coloca-se o valor do $\chi^{2}_{calculado}$, os graus de liberdade e acrescenta-se `lower.tail = FALSE` para obter a probabilidade da cauda superior, uma vez que a distribuição do qui-quadrado é positiva. O valor crítico é igual a 3,84 e, no exemplo, o $\chi^{2}_{calculado}$ é igual a 3,19, logo a valor *p* é igual a: ```{r} pchisq (3.19, 1, lower.tail = FALSE) ``` Dessa forma, conclui-se ,com uma confiança de 95%, que não se rejeita $H_{0}$, ou seja, a proporção acidentes nos homens é igual a proporção de acidentes nas mulheres ($\chi^{2} (1) = 3,19;P=0,074$). Observe na @fig-chi384 que o $\chi^{2}_{calculado}$ localiza-se a esquerda da linha vertical, da área vermelha de rejeição da $H_{0}$. Atente, que se não fosse feita a correção de Yates, a conclusão seria diferente, pois o $\chi^{2}_{calculado}$ seria igual a 4,17 e estaria um pouco cima do $\chi^{2}_{crítico}$, na área de rejeição da $H_{0}$. Com a correção de Yates o valor *P* é igual a 0,074, sem a correção de continuidade igual a 0,041, isto configura o que se chama de *valor P marginal* e, nesses casos, deve-se ter muito cuidado na conclusão, pois existe risco de erro tipo II, não rejeitar uma $H_{0}$ quando ela é falsa. ```{r} #| label: fig-chi384 #| echo: true #| message: false #| warning: false #| fig-align: "center" #| out-height: "70%" #| out-width: "70%" #| fig-cap: "Distribuição do qui-quadrado, gl = 1, alpha = 0,05" plotchisqtest(chisq = 3.84, df = 1, colorleft = "aliceblue", colorright = "red", ylabel = "Densidade de probabilidade") ``` O gráfico foi criado com a função `plotchisqteste()` do pacote `nhstplot`, pacote simples e conveniente para representar graficamente os testes de significância de hipótese nula mais comuns, como testes *F*, testes *t* e testes *z* [@myszkowski2020nhstplot]. ### Qui-Quadrado de Independência ou Associação #### Dados usados no exemplo O exemplo da @tbl-tab2x2, usado para mostrar a lógica do qui-quadrado, é um teste de independência ou associação. Ali, foi mostrado que não existe uma associação estatisticamente significativa (*p* \> 0,05) entre acidentes automobilísticos e o sexo.\ Como exercício, serão usados outros dados que necessitam mais manipulação, como treinamento do qui-quadrado de associação e do próprio R. ::: callout-note ## Cenário A pergunta a ser respondida com os dados será ::: ##### Leitura e transformação dos dados Os dados serão provenientes do banco de dados `dadosMater.xlsx`. bastante usado neste livro [^19-dadoscategoricos-1] . A partir do diretório, será feita a leitura da seguinte maneira: [^19-dadoscategoricos-1]: Ver @sec-dadosMater. ```{r} dados <- read_excel ("dados/dadosMater.xlsx") ``` Adicione a este arquivo uma variável denominada `baixoPeso`, usando a função `mutate()` do pacote `dplyr` e a função `ifelse ()`, da base do R: ```{r} dados <- dados |> mutate(baixoPeso = ifelse(pesoRN < 2500, "1", "2")) ``` Onde `1 = sim` e `2 = não`, ou seja, com peso de nascimento \< 2500g e $\ge$ 2500g. O próximo passo é selecionar, deste arquivo, apenas esta variável criada e a variável `fumo`, porque o objetivo da análise será verificar se existe associação entre tabagismo na gestação e baixo peso ao nascer (\< 2500g). Para isso, usa-se a função `select()` do pacote `dplyr`: ```{r} dados <- dados |> select (fumo, baixoPeso) ``` A seguir, será extraída uma amostra deste banco de dados com n = 300, usando a função `slice_sample()` do pacote `dplyr`. A função `set.seed()` apenas garante que os dados selecionados aleatoriamente se mantenham os mesmos em outros sorteios (veja @sec-dnp): ```{r} set.seed(123) dados <- slice_sample(dados, n=300) str(dados) ``` Todos esses passos poderiam ser feitos em um só comando, precedido pela semente (`set.seed(123)`), usando o operador pipe `|>`: ```{r} #| echo: true #| eval: false set.seed(123) dados <- read_excel ("dados/dadosMater.xlsx") |> mutate(baixoPeso = ifelse(pesoRN < 2500, "1", "2")) |> select (fumo, baixoPeso) |> slice_sample(n=300) ``` Tem-se, agora, um conjunto de dados com duas colunas: `fumo`, como uma variável numérica e `baixoPeso`, como caractere. Ambas devem ser transformadas em fator e, onde os rótulos são 1 e 2, passam para "sim" e "não" e mantendo a ordem "sim" e "não". ```{r} dados$fumo <- factor(dados$fumo, levels = c(1, 2), labels = c("sim", "não")) dados$baixoPeso <- factor(dados$baixoPeso, levels = c(1, 2), labels = c("sim", "não")) str (dados) ``` ##### Construção da Tabela Antes de construir a @tbl-tab2x2fumo, será verificado a distribuição de baixo peso de acordo com o tabagismo materno, usando a função `with()` e, dentro dela, a função `table()`, seguida da função `addmargins()`: ```{r} tab <- with(data = dados, table(fumo, baixoPeso)) addmargins(tab) ``` Assim, tem-se ```{r} #| label: tbl-tab2x2fumo #| echo: false #| message: false #| warning: false #| tbl-cap: "Baixo peso* ao nascer e tabagismo" fumo <-c("Sim", "Não", "Total") baixoPeso <- c(18, 22, 40) sem_bp <- c(51, 209, 260) Total <- c(69, 260, 300) df <- data.frame(fumo, baixoPeso, sem_bp, Total) minha_tab <- flextable(df) |> set_header_labels( fumo = "Tabagismo", baixoPeso = "Baixo Peso", sem_bp = "Sem Baixo Peso", Total = "Total") |> autofit() |> add_footer_lines(value = "* Baixo Peso = peso ao nascer < 2500g") |> align(align = "left", part = "footer") |> fontsize(size = 9, part = "footer") |> theme_booktabs() |> align(align = "center", part = "header") |> align(align = "center", part = "body") |> bold(part = "header") |> bold(i = ~ fumo == "Total", part = "body") |> hline(i = 2, part = "body", border = fp_border_default(color = "black", width = 1.3)) minha_tab ``` ::: callout-tip ## Observação Uma tabela é constituída por linhas e colunas. Para se extrair valores da tabela, usa-se os colchetes, após o nome da tabela. O primeiro valor dentro dos colchetes é referente ao **número da linha**; o segundo, separado pela virgula, é referente ao **número da coluna**. Então, `tab[1,1]` se refere ao valor que está na primeira linha e primeira coluna: ::: ```{r} tab[1,1] ``` A proporção de baixo peso por categoria de tabagismo (nº de casos/total da linha): ```{r} fumantes <- tab[1,1]/(tab[1,1] + tab[1,2]) fumantes não.fumantes <- tab[2,1]/(tab[2,1]+ tab[2,2]) não.fumantes ``` ##### Visualização gráfica Um gráfico de barras empilhadas, construído com o `ggplot()` do pacote `ggplot2` (ver @sec-ggplot2), será usado para visualizar os dados: ```{r} #| label: fig-fumobp #| echo: true #| message: false #| warning: false #| fig-align: "center" #| out-height: "70%" #| out-width: "70%" #| fig-cap: "Gráfico de barras empilhadas: tabagismo vs baixo peso ao nascer" ggplot(dados) + aes (x = fumo, fill = baixoPeso) + geom_bar (color = "black") + scale_fill_manual(values = c("gray", "aliceblue")) + labs (title = NULL, x = "Tabagismo", y = "Frequência") + annotate("text", x="sim", y=62, label= "26,1%") + annotate("text", x = "não", y=223, label = "9,5%") + theme_classic () + theme (text = element_text (size = 12)) + labs(fill = "Peso ao nascer < 2500g") ``` Observa-se, @fig-fumobp, que 26,1% das gestantes fumantes geram bebês com baixo peso, enquanto que entre as não fumantes este percentual cai três vezes, indo para 9,5%. É uma diferença grande! Aqui, quase se tem certeza que ela é significativa, mesmo sem cálculos! #### Hipóteses estatísticas > $H_{0}$: a proporção de baixo peso é igual nos dois grupo (fumantes e não fumantes); não há associação entre as variáveis. > $H_{1}$: a proporção de baixo peso é diferente nos dois grupo (fumantes e não fumantes); existe associação entre as variáveis. #### Cálculo do Qui-quadrado de Pearson no R Para este exemplo, o $\chi^{2}$ irá verificar se existe uma associação entre as variáveis `fumo` e `baixoPeso`, assumindo um $\alpha = 0,05$ que equivale a um valor crítico de 3,84 com um grau de liberdade, em uma tabela $2 \times 2$. A função `chisq_test()` do pacote `rstatix` libera o qui-quadrado, usando os seguintes argumentos: - **x** $\to$ vetor numérico ou matriz. Tanto x como y podem ser fatores; - **y** $\to$ vetor numérico. Ignorado quando se x é uma matriz; - correct $\to$ TRUE é o padrão. Indica se deve ser aplicada a correção de continuidade ao calcular a estatística de teste para tabelas 2 por 2 [^19-dadoscategoricos-2]; - **...** $\to$ para outros argumentos consulte a ajuda do *RStudio*. [^19-dadoscategoricos-2]: Quando não se está trabalhando com uma tabela $2 \times 2$ e a regra geral for obedecida e o n for grande, pode-se usar o qui-quadrado de Pearson sem correção. Para executar a função `chisq_test()`, basta colocar como argumento as variáveis `fumo` e `baixoPeso` ou construir antes uma tabela de contingência com a função `table()` e depois colocá-la como argumento. Como tabela `tab` já existe: ```{r} teste <- rstatix::chisq_test(tab) teste ``` A saída do teste exibe tudo que é necessário. O $\chi^{2}$ = `r round(teste$statistic,1)` com um valor muito maior que o valor crítico de 3,84, mostrando que a diferença é estatisticamente significativa (*P* = `r teste$p`). Essas e outras estatísticas podem ser obtidas, usando o objeto `teste` seguido do sinal `$`. Por exemplo, para o valor *p*: ```{r} teste$p ``` ::: callout-caution ## Nota Se um aviso como [Chi-squared approximation may be incorrect]{style="color:red"} (*Aproximação qui-quadrado pode estar incorreta*) aparecer, significa que as menores frequências esperadas são inferiores a 5. Para evitar esse problema, é possível usar uma das seguintes opções: - reunir alguns níveis (especialmente aqueles com um pequeno número de observações) para aumentar o número de observações nos subgrupos, ou - usar o teste exato de Fisher. ::: ##### Outras maneiras de calcular o qui-quadrado no R No pacote `gmodels` [@warnes2022gmodels], existe uma função muito interessante, a função `CrossTable()` que que imprime, além de uma tabela de frequência com as proporções, exibe vários testes, como o teste $\chi^2$, o teste exato de Fisher e o teste de McNemar com e sem correção de continuidade. Consulte a ajuda para melhor estudar esta elegante função! Neste momento, será explorado apenas o qui-quadrado e os valores esperados com três dígitos: ```{r} CrossTable (tab, digits = 3, prop.chisq = FALSE, prop.t = FALSE, chisq = TRUE, expected = TRUE) ``` Observe que a saída mostra em cada célula da tabela, o número de casos, o número esperado, a percentagem por linha (nº de casos/total da linha) e a percentagem por coluna (nº de casos/total da coluna). Por último, exibe o qui-quadrado de Pearson com e sem correção de continuidade de Yates. #### Conclusão e relato dos resultados Usando a correção de continuidade de Yates, pois é uma tabela $2\times2$, vê-se que o valor *p* é menor que o nível de significância de 5% e, consequentemente, rejeita-se a hipótese nula e conclui-se que existe uma associação significativa entre tabagismo na gestação e o baixo peso ao nascimento ($\chi^{2}_{com \ correção \ de \ Yates} (1)$ = 11.2; *P* = 0,00081). Além disso, no relato dos resultados pode-se apresentar uma tabela ou em um gráfico. ##### Tabela Para a construção da tabela, pode-se usar a função `ctable()` do pacote `summarytools`[@comtois2022summarytools] para obter uma tabela com todos os dados a serem exibidos. O argumento `prop = "r"` exibe os percentuais das linhas ("c", nas colunas). Na realidade, são maneiras diferente de se obter o mesmo resultado. ```{r} #| message: false #| warning: false ctable(dados$fumo, dados$baixoPeso, prop = "r", chisq = TRUE, headings = FALSE, OR = TRUE) ``` Ou seja, os bebês que se expuseram ao fator de risco (fumo) têm uma chance 3,35 (IC95% : 1,67-6,71) vezes maior de apresentar peso \< 2500g ao nascer, nessa amostra. Além desses resultados, a tabela final pode conter (e isto é recomendado!) os intervalos de confiança para cada uma das proporções de fumantes e não fumantes. Para isso a função `BinomCI()` cumpre um papel suficiente (veja @sec-ICproporcao). Então, a proporção de baixo peso entre as fumantes é: ```{r} BinomCI(18, 69, conf.level = 0.95, method = "clopper-pearson") ``` E, entre as não fumantes é: ```{r} BinomCI(22, 231, conf.level = 0.95, method = "clopper-pearson") ``` Finalmente, esses dados podem ser colocados em uma tabela, como a @tbl-tabres: ```{r} #| label: tbl-tabres #| echo: false #| message: false #| warning: false #| tbl-cap: "Efeito do tabagismo materno no peso ao nascer" Peso_nasc = c("Baixo Peso", "IC95%") Fumantes = c("18/69", "16,3-38,1") Nao_fumantes = c("22/231", "6,1-14,1") P = c(0.00081, "") df <- data.frame(Peso_nasc, Fumantes, Nao_fumantes, P) minha_tab <- flextable(df) |> set_header_labels( Peso_nasc = "Peso ao nascer", Fumantes = "Fumantes", Nao_fumantes = "Não fumantes", P = "Valor P*") |> autofit() |> add_footer_lines(value = "* Qui-quadrado de Pearson com correção") |> align(align = "left", part = "footer") |> fontsize(size = 9, part = "footer") |> theme_booktabs() |> align(align = "center", part = "header") |> align(align = "center", part = "body") |> bold(part = "header") minha_tab ``` ##### Gráfico Uma boa apresentação gráfica complementa o relatório dos resultados. Pode-se fazer isso com gráfico de barras empilhadas (@fig-fumobp), acompanhado dos percentuais e do tipo de teste realizado, usando a função `get_test_label()` que necessita do teste calculado com a função `chisq_test()` do pacote `rstatix`, apresentado antes. O gráfico assume o aspecto da @fig-fumobp1: ```{r} #| label: fig-fumobp1 #| echo: true #| message: false #| warning: false #| fig-align: "center" #| out-height: "70%" #| out-width: "70%" #| fig-cap: "Gráfico de barras empilhadas: tabagismo vs baixo peso ao nascer" ggplot(dados) + aes (x = fumo, fill = baixoPeso) + geom_bar (color = "black") + scale_fill_manual(values = c("gray", "gray95")) + labs (title = NULL, subtitle = get_test_label (teste, detailed = TRUE), x = "Tabagismo", y = "Frequência") + annotate("text", x="sim", y=62, label= "24,6% (15,0-36,5)") + annotate("text", x = "não", y=223, label = "8,2% (5,0-12,5)") + theme_classic () + theme (text = element_text (size = 12)) + labs(fill = "Peso ao nascer < 2500g") ``` ### Qui-Quadrado de Aderência ou do Melhor Ajuste O teste de qualidade de ajuste do qui-quadrado (*chi-square goodness of fit*) é usado para comparar a distribuição observada com uma distribuição esperada, em uma situação em que se tem duas ou mais categorias em dados discretos. Em outras palavras, ele compara várias proporções observadas com as probabilidades esperadas [@daniel2013chisquare]. #### Dados usados no exemplo ::: callout-note ## Cenário Há uma dúvida se o número de pacientes que procura uma determinada Unidade de Pronto Atendimento (UPA) é aproximadamente o mesmo em todos os dias da semana. Esta é uma informação importante sob o ponto de vista administrativo. Para se atingir este objetivo registrou-se o número de pacientes que procurou a UPA por dia da semana. ::: O número de atendimentos nos sete dias (de segunda-feira à domingo) da semana está representada pela *frequência observada*, `freq_obs`: ```{r} freq_obs <- c(20, 17, 22, 21, 26, 33, 36) freq_obs ``` O total de atendimentos durante uma semana é igual a: ```{r} soma <- sum(freq_obs) soma ``` Assim, a frequência esperada diária é igual a soma total dos atendimentos dividido pelo número observações (no caso, dias da semana), representada por `k`: ```{r} k = 7 freq_esp <- soma/k freq_esp ``` Com esses valores , pode-se criar um vetor, `p`, com as proporções dos atendimentos diários esperados: ```{r} p <- rep(freq_esp/soma, 7) p ``` #### Hipóteses estatísticas > $H_{0}$: a distribuição das frequências observadas (O) é igual a distribuição de frequências esperadas (E). > $H_{1}$: a distribuição das frequências observadas (O) não é igual a distribuição de frequências esperadas (E) #### Cálculo da estatística do teste Assumindo um $\alpha = 0,05$. Os graus de liberdade são calculados como o número de células (*k*) menos 1: $gl = (k - 1)$. O $\chi^{2}_{crítico}$ pode ser encontrado usando: ```{r} alpha = 0.05 k = 7 gl = k - 1 qchisq (1 - alpha, gl) ``` Em outras palavras, se o $\chi^{2}_{calculado}$ \> $\chi^{2}_{crítico}$, rejeita-se a $H_{0}$. Na @fig-chi126, o resultado tem que ficar à direita da linha vertical vermelha para que a hipótese nula seja rejeitada. Se cair fora da área de rejeição, à esquerda da linha vertical vermelha, aceita-se a hipóteses nula. ```{r} #| label: fig-chi126 #| echo: true #| message: false #| warning: false #| out-height: "70%" #| out-width: "70%" #| fig-align: "center" #| fig-cap: "Distribuição do qui-quadrado, gl = 6, alpha = 0,05" plotchisqtest(chisq = 12.6, df = 6, colorleft = "aliceblue", colorright = "red", ylabel = "Densidade de probabilidade", colorcut = "red") ``` A estatística do teste pode ser encontrada, usando a função `chisq.test()`: ```{r} teste1 <- rstatix::chisq_test (x = freq_obs, y = NULL, p = p) teste1 ``` #### Conclusão Observando-se a saída do teste do qui-quadrado, verifica-se que o $\chi^{2}_{calculado}$ \< $\chi^{2}_{crítico}$, portanto, não se rejeita a $H_{0}$ e conclui-se que, nesta amostra, com uma confiança de 95%, que a frequência observada de pacientes à UPA é igual a esperada (*P* = `r teste1$p`). Lembrando que, neste caso, como se tem um valor *P* limitrofe, marginal, existe a possibilidade de se estar aceitando uma $H_{0}$ falsa e cometendo um erro tipo II. Seria recomendado, aumentar o tamanho amostral em uma nova coleta, usando estes dados como um piloto para o cálculo amostral. ### Qui-quadrado de Pearson para tabelas extensas {#sec-tabextensas} Este teste é utilizado quando o número de grupos, k, é superior a 2. #### Dados usados como exemplo {#sec-dadosCirurgia} ::: callout-note ## Cenário Em um hospital pediátrico, 144 recém-nascidos foram submetidos a diferentes procedimentos cirúrgicos (abdominal, cardíaco ou outro). Os cirurgiões estavam preocupados em saber se há uma tendência de maior taxa de infecção entre os neonatos que permanecem mais tempo hospitalizados. ::: O banco de dados `dadosCirurgia.xlsx` que pode ser encontrado [**aqui**](https://github.com/petronioliveira/Arquivos/blob/main/dadosCirurgia.xlsx). Salve o mesmo no seu diretório de trabalho. As variáveis disponíveis no banco de dados são: - **id** $\to$ identificação do neonato; - **sexo** $\to$ sexo do recém-nascido, `fem` e `masc`; - **peso** $\to$ peso do neonato em gramas; - **tempohosp** $\to$ tempo de hospitalização em dias; - **infec** $\to$ presença de infecção secundária: sim e não; - **cirurgia** $\to$ tipo de cirurgia: abdominal, cardíaca, outra. A variável tempo de hospitalização (`tempohosp`) é contínua e assimétrica. Para ser usada aqui, será categorizada por quartis. A variável `infec` (presença de infecção) é uma variável dicotômica (`sim`, `não`). ##### Leitura e transformação dos dados A leitura dos dados pode ser feita com: ```{r} cirurgia <- read_excel ("dados/dadosCirurgia.xlsx") str(cirurgia) ``` Os dados foram atribuídos a um objeto denominado de `cirurgia`. Característicamente, a variável `tempohosp` (tempo de hospitalização) é assimétrica (@fig-tempohosp): ```{r} #| label: fig-tempohosp #| message: false #| warning: false #| fig-align: "center" #| out-height: "70%" #| out-width: "70%" #| fig-cap: "Distribuição da variável tempo de hospitalização" cirurgia |> ggplot() + geom_histogram(aes(x = tempohosp, y = after_stat(density)), fill = "tomato", bins = 20, col=alpha("gray40",0.5)) + geom_function(fun=dnorm, args=list(mean=mean(cirurgia$tempohosp, na.rm = T), sd= sd(cirurgia$tempohosp, na.rm = T)), col='dodgerblue4', lwd=1, lty=2) + labs(x='Tempo de hospitalização (dias)', y='Densidade de probabilidade') + theme_bw() ``` A variável `tempohosp` será categorizada em quartis. O resumo da mesma, usando a função `summary()`, fornece orientação para esse procedimento com o retorno do 1º quartil, mediana e 3º quartil: ```{r} summary (cirurgia$tempohosp) ``` A categorização da variável `tempohosp`, que será realizada, usando a função `cut()`, consulte a @sec-freq para detalhes de construção de uma tabela de frequência: ```{r} cirurgia$tempo <- cut(cirurgia$tempohosp, breaks = c(1, 20.75, 27.50, 42.00, 245), labels = c("<= 21","22-28", "29-42",">42"), right = FALSE, include.lowest = TRUE) tab1 <- table (cirurgia$tempo) tab1 ``` Por exemplo, 36 recém-nascidos permaneceram 21 dias ou menos no pós-operatório e 37 recém-nascidos ficaram internados mais do que 42 dias. Agora, a variável `cirurgia$infec` será colocada como um fator: ```{r} cirurgia$infec <- factor(cirurgia$infec, levels = c("sim", "não")) table(cirurgia$infec) ``` A nova variável `tempo` será cruzada com a variável `infec` em uma tabela: ```{r} tab2 <- with(data = cirurgia, table(tempo, infec)) addmargins(tab2) ``` Ou seja, a proporção de recém-nascidos que se infectaram no pós-operatório foi 56/144 = 0,39 ou 39%. Se for calculada a proporção para cada um dos quartis do tempo de hospitalização, através da função `ctable()` do pacote `summarytools`, observa-se que a proporção de neonatos infectados no pós-operatório aumenta com o tempo de hospitalização: ```{r} #| echo: false #| message: false tab3 <- summarytools::ctable(cirurgia$tempo, cirurgia$infec, prop = "r", headings = FALSE) ``` #### Hipóteses estatísticas > $H_{0}$: A presença de infecção não altera o tempo de hospitalização. > $H_{1}$: A presença de infecção altera o tempo de hospitalização. #### Cálculo da estatística do teste O teste estatístico pode ser calculado, usando o argumento `chisq = TRUE` na função `ctable()`: ```{r} summarytools::ctable(cirurgia$tempo, cirurgia$infec, prop = "r", chisq = TRUE, headings = FALSE) ``` #### Conclusão A partir desses resultados, pode-se inferir que a menor taxa de infecção ocorre no grupo do primeiro quartil e é significativamente diferente em relação a taxa de infecção do maior quartil, mas sem indicação para os grupos intermediários. É útil fazer o teste de tendência linear (*Linear-by-linear Association*). Para isso, pode-se usar a função `lbl_test ()` do pacote `coin`. ```{r} coin::lbl_test (cirurgia$tempo ~ cirurgia$infec) ``` Este teste indica uma tendência significativa para a presença de infecção à medida que aumenta o tempo de hospitalização (*P* = 0,0018). ## Teste exato de Fisher O teste do qui-quadrado não é um método apropriado de análise se a amostra é pequena. Por exemplo, se *n* for menor que 20 ou se *n* estiver entre 20 e 40 e uma das frequências esperadas for menor que 5, o teste do qui-quadrado deve ser evitado. Nesta situação, é recomendado o **teste exato de Fisher**. ### Dados usados como exemplo ::: callout-note ## Cenário Um estudo estabeleceu como objetivo verificar se a asma não controlada é um fator de risco para a procura da emergência. Foram acompanhados 16 escolares asmáticos durante um ano com relação ao número de visitas à emergência de acordo com o controle da sua asma. ::: #### Entrando com os dados Em primeiro lugar, serão criadas duas variáveis: ```{r} emerg <- c (1,1,2,2,2,2,2,1,1,1,1,1,1,1,1,2) controle <- c (1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2) ``` A seguir, usando essas variáveis, será construído um dataframe que será atribuído ao objeto `dadosAsma`: ```{r} dadosAsma <- data.frame(emerg, controle) ``` #### Transformação dos dados Ambas as variáveis são numéricas e serão transformadas em fatores, considerando para a variável `emerg`, 1 = "consultou" e 2 = "não consultou", e, para a variável controle, 1 = "asma controlada" e 2 = "asma não controlada". É importante manter a ordem: ```{r} dadosAsma$emerg <- factor (dadosAsma$emerg, levels = c (1,2), labels = c ('consultou', 'não consultou')) dadosAsma$controle <- factor (dadosAsma$controle, levels = c (1,2), labels = c ('asma controlada', 'não controlada')) str(dadosAsma) ``` #### Construção da tabela Para o cálculo da estatística do teste, é necessário uma tabela $2\times2$ (@tbl-rafisher), obtida com os dados acima: ```{r} #| echo: true #| results: "hide" tab3 <- with(data = dadosAsma, table(controle, emerg)) ``` ```{r} #| label: tbl-rafisher #| echo: false #| message: false #| warning: false #| tbl-cap: "Consulta à emergência e controle da asma (tab3)" Controle = c("Asma controlada", "Não controlada", "Total") Emerg_sim = c(2, 8, 10) Emerg_nao = c(5, 1, 6) Total = c(7, 9, 16) df <- data.frame(Controle, Emerg_sim, Emerg_nao, Total) minha_tab <- flextable(df) |> set_header_labels( Controle = "Controle", Emerg_sim = "Sim", Emerg_nao = "Não", Total = "Total") |> autofit() |> add_header_row(values = c("", "Visita à Emergência", ""), colwidths = c(1, 2, 1)) |> theme_booktabs() |> width(j = 1, width = 2) |> width(j = 2:4, width = 1.2) |> align(align = "center", part = "header") |> align(align = "center", part = "body") |> align(j = 1, align = "left", part = "body") |> bold(part = "header") |> bold(j = 1, part = "body") |> hline(i = 2, part = "body", border = fp_border_default(color = "black", width = 1.3)) minha_tab ``` ### Hipóteses estatísticas > $H_0$: as variáveis são independentes, não há relação entre as duas variáveis categóricas. > $H_1$: as variáveis são dependentes, existe uma relação entre as duas variáveis categóricas. </font> ### Cálculo da estatística do teste O teste exato de Fisher é usado quando há pelo menos uma célula na tabela de contingência das frequências esperadas abaixo de 5. Para recuperar as frequências esperadas, use a função `chisq.test()`, do *R* base, junto com `$expected`: ```{r} teste2 <- chisq.test(tab3) ``` A saída do teste imprime um aviso de que o qui-quadrado pode estar incorreto. Há necessidade, devido a presença de três células com valores abaixo de 5, de se usar o teste de Fisher. este pode ser obtido através da função `fisher_test()`, do pacote `rstatix`, colocando uma tabela $2\times2$ como argumento, `tab3`: ```{r} rstatix::fisher_test (tab3, detailed = TRUE) ``` ### Conclusão O valor $P=0,035$ é menor que o nível de significância de 5%, previamente estabelecido, e, portanto, deve-se rejeitar a hipótese nula. No contexto, rejeitar a hipótese nula para o teste exato de independência de Fisher significa que há uma associação significativa entre as duas variáveis categóricas (controle da asma e visitas à emergência). ## Teste de McNemar É um teste estatístico não paramétrico aplicável nos estudos tipo “antes-e-depois” em que cada indivíduo é utilizado como seu próprio controle e a medida é efetuada em escala nominal. O *teste de McNemar* é usado para determinar se há uma diferença estatisticamente significativa nas proporções entre os dados emparelhados. As medidas coletadas nesses tipos de projetos de estudo não são independentes e, portanto, os testes do Qui-quadrado não podem ser usados porque os pressupostos serão violados. O teste de McNemar é usado para avaliar se há uma mudança significativa nas proporções ao longo do tempo para dados emparelhados ou se há uma diferença significativa nas proporções entre casos e controles. O resultado de interesse é a mudança dentro da pessoa (ou diferenças dentro do par) e não há variáveis explicativas. O teste é calculado examinando o número de respostas que são *concordantes* para positivo (sim em ambas as ocasiões) e negativo (não em ambas as ocasiões) e o número de pares *disconcordantes* (sim e não, ou não e sim). Os pares concordantes não fornecem informações sobre as diferenças e não são usados na avaliação. Em vez disso, deve-se concentrar nos pares discordantes, que podem ser divididos em dois tipos: um par discordante do tipo *sim – não* e um par discordante tipo *não – sim* [@eliasziw1991application]. ### Pressupostos do teste de McNemar Os pressupostos para o teste de McNemar são: 1. A variável desfecho é binária, dicotômica; 2. Cada participante é representado na tabela apenas uma vez; 3. A diferença entre as proporções emparelhadas é o resultado de interesse; 4. O teste de McNemar pode não ser confiável se houver contagens baixas nas células "discordantes". Existe recomendação de que a soma dessas células seja $\ge 20$ [@rosner2011mcnemar]. ### Dados usados como exemplo ::: callout-note ## Cenário Em uma universidade, um professor de bioestatística comparou as atitudes de 200 estudantes de Medicina em relação à confiança que eles depositam na análise estatística antes e depois da conclusão da disciplina. A pergunta feita foi: Confiam na análise estatística utilizada nos periódicos médicos? ::: As respostas obtidas estão na @tbl-tabmcnemar: ```{r} #| label: tbl-tabmcnemar #| echo: FALSE #| message: FALSE #| warning: FALSE #| tbl-cap: "Confiança na análise estatística após término da disciplina" pre <-c("Sim", "Não", "Total") pos_sim <- c("20 (a)", "22 (c)", "42") pos_nao <- c("8 (b)", "150 (d)", "158") total <- c(28, 172, 200) df <- data.frame(pre, pos_sim, pos_nao, total) minha_tab <- flextable(df) |> autofit() |> set_header_labels( pre = "Pré-Teste", pos_sim = "Sim", pos_nao = "Não", total = "Total") |> autofit() |> add_header_row(values = c("", "Pós-teste", ""), colwidths = c(1, 2, 1)) |> theme_booktabs() |> width(j = 1, width = 1.2) |> width(j = 2:4, width = 1.2) |> align(align = "center", part = "header") |> align(align = "center", part = "body") |> bold(part = "header") |> bold(j = 1, part = "body") |> hline(i = 2, part = "body", border = fp_border_default(color = "black", width = 1.5)) minha_tab ``` ### Hipóteses estatísticas Considerando as caselas *a*, *b*, *c* e *d* da @tbl-tabmcnemar, a hipótese nula de homogeneidade marginal indica que as duas probabilidades marginais para cada resultado são as mesmas, isto é, $$p_{a} + p_{b} = p_{a} + p_{c}$$ e $$p_{c} + p_{d} = p_{b} + p_{d}$$ Assim, a hipótese nula e a hipótese alternativa são: > $H_{0}$: a proporção de alunos que respondem `sim` no pré-teste e no pós-teste é a mesma. > $H_{1}$: a proporção de alunos que respondem `sim` no pré-teste e no pós-teste não é a mesma. </font> ### Lógica do teste O teste estatístico de McNemar, com correção de continuidade, é obtido utilizando a equação: $$\chi^{2} = \frac {\left (\left |b - c \right |- 1 \right )^{2}}{b + c}$$ Sob a hipótese nula, com um número suficientemente grande de discordantes (células *b* e *c*), o $\chi^{2}$ tem uma distribuição qui-quadrado com um grau de liberdade. Se o resultado é significativo, isto é, fornece evidências suficientes para rejeitar a hipótese nula, significa que as proporções marginais são significativamente diferentes umas das outras. Substituindo os dados da Tabela na Equação, tem-se: ```{r} a <- 20 b <- 8 c <- 22 d <- 150 chi <- ((abs(b - c) - 1)^2)/(b + c) chi ``` Assumindo um $\alpha = 0,05$, pode-se obter valor crítico para o $\chi^{2}$ para gl = 1, usando a função `qchisq()`, do pacote `stats`: ```{r} alpha = 0.05 qchisq(1 - alpha, 1) ``` Desta maneira, rejeita-se a $H_{0}$, pois o $\chi_{calculado}^{2} > \chi_{crítico}^{2}$. O valor *P* pode ser conseguido com a função `pchisq()`: ```{r} pchisq (5.633, 1, lower.tail = FALSE) ``` ### Cálculo do teste de McNemar Carregar o arquivo `dadosBioestatistica.xlsx`, que pode ser encontrado [**aqui**](https://github.com/petronioliveira/Arquivos/blob/main/dadosBioestatistica.xlsx). Este conjunto de dados contem os dados da @tbl-tabmcnemar. ```{r} dados <- readxl::read_excel("dados/dadosBioestatistica.xlsx") ``` Construir uma tabela de contingência ```{r} dados$preteste <- factor(dados$preteste, levels = c("sim", "não")) dados$posteste <- factor(dados$posteste, levels = c("sim", "não")) tab4 <- table(dados$preteste, dados$posteste, dnn = c("Pré-teste", "Pós-teste")) tab4 ``` Agora, pode-se calcular o teste de McNemar[^19-dadoscategoricos-3] com a função `mcnemar_test()` do pacote `rstatix`: [^19-dadoscategoricos-3]: É possível também obter o teste de McNemar de outras formas, como, por exemplo, usando a função `CrossTable()` do pacote `gmodels`. ```{r} rstatix::mcnemar_test (tab4, correct = TRUE) ``` O resultado do teste de McNemar com correção de continuidade é exatamente igual ao calculado manualmente. ### Conclusão Houve uma modificação estatisticamente significativa na opinião dos alunos após o curso de Bioestatística em relação à confiança nas análises estatísticas (86% no pré-teste de respostas `não` x 79% no pós-teste, $\chi^{2} = 5,63, gl = 1, P = 0,018$). Alguns alunos (14) mudaram de opinião em relação a sua confiança nas análises estatísticas dos periódicos médicos.