Teste do qui-quadrado (χ²): o que é e como é usado nas estatísticas

Na estatística, existem vários testes para analisar a relação entre as variáveis. Variáveis ​​nominais são aquelas que permitem relações de igualdade e desigualdade, como gênero.

Neste artigo conheceremos um dos testes para analisar a independência entre variáveis ​​dummy ou superiores: o teste do qui-quadrado, pelo contraste das hipóteses (Testes de adequação).


    O que é o teste do qui-quadrado?

    O teste do qui-quadrado, também chamado de Ji-quadrado (Χ2), Parte dos testes pertence à estatística descritiva, especificamente à estatística descritiva aplicada ao estudo de duas variáveis. Por sua vez, a estatística descritiva se concentra na extração de informações sobre a amostra. Em contraste, as estatísticas inferenciais extraem informações sobre a população.

    O nome do teste é típico da distribuição qui-quadrado da probabilidade em que se baseia. isso é foi desenvolvido em 1900 por Karl Pearson.

    O teste do qui-quadrado é um dos mais conhecidos e utilizados para analisar variáveis ​​nominais ou qualitativas, ou seja, para determinar a existência ou não de independência entre duas variáveis. O fato de duas variáveis ​​serem independentes significa que não estão relacionadas e, portanto, uma não depende da outra, nem vice-versa.

    Assim, com o estudo da independência, também é iniciado um método para verificar se as frequências observadas em cada categoria são compatíveis com a independência entre as duas variáveis.

    Como é obtida a independência entre as variáveis?

    Para avaliar a independência entre as variáveis, são calculados os valores que indicariam a independência absoluta, denominados “frequências esperadas”, compare-os com as frequências de amostra.

    Como de costume, a hipótese nula (H0) indica que as duas variáveis ​​são independentes, enquanto a hipótese alternativa (H1) indica que as variáveis ​​possuem algum grau de associação ou relacionamento.

    Correlação entre variáveis

    Assim, como outros testes com o mesmo propósito, o teste do qui-quadrado permite ver a significância da correlação entre duas variáveis ​​de nível nominal ou superior (Por exemplo, podemos aplicá-lo se quisermos saber se existe uma relação entre sexo [ser hombre o mujer] e a presença de ansiedade [sí o no])

    Para determinar este tipo de relação, existe uma tabela de frequências a consultar (também para outros testes como o coeficiente de Yule Q).

    Se as frequências empíricas e as frequências teóricas ou esperadas coincidem, então não há relação entre as variáveis, ou seja, elas são independentes. Por outro lado, se coincidirem, não são independentes (existe uma relação entre as variáveis, por exemplo, entre X e Y).

    considerações

    O teste do qui-quadrado, ao contrário de outros testes, não impõe restrições sobre o número de categorias por variável, e o número de linhas e o número de colunas nas tabelas não precisam corresponder.

    Porém, deve ser aplicado em estudos baseados em amostras independentes, e quando todos os valores esperados forem maiores que 5. Conforme já mencionado, os valores esperados são aqueles que indicam independência absoluta entre as duas variáveis.

    Além disso, para usar o teste do qui-quadrado, o nível de medição deve ser nominal ou superior. Não tem limite superior, ou seja, não permite saber a intensidade da correlação. Em outras palavras, o qui-quadrado assume valores entre 0 e infinito.

    Por outro lado, se a amostra aumenta, o valor do qui-quadrado aumenta, mas deve-se ter cuidado na sua interpretação, pois isso não significa que haja mais correlação.

    Distribuição qui-quadrado

    O teste do qui-quadrado usa uma aproximação da distribuição qui-quadrado para avaliar a probabilidade de um desvio igual ou maior que aquele entre os dados e as frequências esperadas sob a hipótese nula.

    A precisão desta avaliação dependerá do fato de os valores esperados não serem muito baixos e, em menor medida, do contraste entre eles não ser muito alto.

    Correção de iate

    A correção de Yates é uma fórmula matemática aplicada com tabelas 2×2 e com uma pequena frequência teórica (Menos de 10), para corrigir quaisquer erros no teste do qui-quadrado.

    Normalmente a correção de Yates ou também a “correção de continuidade” é aplicada. quando uma variável discreta se aproxima de uma distribuição contínua.

    Testes de hipóteses

    Além disso, o teste do qui-quadrado pertence à chamada qualidade de ajuste ou testes de contraste, Que objetivam decidir se a hipótese de que uma dada amostra provém de uma população com uma distribuição de probabilidade totalmente especificada na hipótese nula pode ser aceita.

    Os contrastes são baseados na comparação das frequências observadas (frequências empíricas) na amostra com aquelas que poderiam ser esperadas (frequências teóricas ou esperadas) se a hipótese nula fosse verdadeira. Curtiu isso, a hipótese nula é rejeitada se houver uma diferença significativa entre as frequências observadas e esperadas.

    cirurgia

    Como vimos, o teste do qui-quadrado é usado com dados pertencentes a uma escala nominal ou superior. A partir do qui-quadrado, é estabelecida uma hipótese nula que assume uma distribuição de probabilidade especificada como o modelo matemático da população que gerou a amostra.

    Assim que tivermos a hipótese, precisamos realizar o contraste, e para isso temos os dados em uma tabela de frequência. A frequência absoluta observada ou empírica é indicada para cada valor ou faixa de valores. Então, supondo que a hipótese nula seja verdadeira, para cada valor ou intervalo de valores, a frequência absoluta que poderia ser esperada ou esperada é calculada.

    interpretação

    A estatística qui-quadrado terá um valor igual a 0 se houver uma correspondência perfeita entre as frequências observadas e esperadas; por outro lado, a estatística terá um grande valor se houver uma grande diferença entre essas frequênciasFinalmente, a hipótese nula deve ser rejeitada.

    Referências bibliográficas:

    • Lubin, P. Macià, A. Rubio de Lerma, P. (2005). Psicologia matemática I e II. Madrid: UNED.
    • Pardo, A. San Martín, R. (2006). Análise de dados em psicologia II. Madrid: pirâmide.

    Deixe um comentário