Monthly Archives: Abril 2013

Associação entre uma variável nominal e uma variável ordinal

A análise de associação pretende verificar relações entre variáveis na amostra.

Pretende-se analisar a relação do género com a variável percepção da qualidade de vida. Sabemos que o género é uma variável nominal com duas categorias de resposta: masculino; feminino. Quanto à qualidade de vida, trata-se duma variável ordinal que compreende três categorias de resposta: alta, média, baixa.

Pretendemos verificar se a percepção da qualidade de vida está relacionada com o género. Neste caso, utilizamos o teste do Qui-quadrado, realizando um cruzamento entre as variáveis, como indicado na imagem abaixo..

associação_NO1

É aberta uma janela onde se escolhem as variáveis género e percepção da qualidade de vida e, carregando em Statistics, escolhe-se Chi Square e carrega-se em Continue.

associação_NO2

Carregando no botão Cells, em Counts escolhe-se Observed e Expected , para sabermos mais sobre os dados.

associação_NO3

Obtém-se o output do SPSS (imagem abaixo). O primeiro quadro mostra o número de inquéritos utilizados na análise. Neste caso apenas um caso foi considerado missing. O segundo quadro apresenta os valores observados e esperados em cada um dos géneros e em cada uma das categorias de resposta da variável percepção da qualidade de vida. O último quadro apresenta os valores de vários testes e a significância associada a cada um.

A significância associada ao teste do Qui-quadrado não foi menor que 0,05. Como tal, consideramos que a associação entre as variáveis não é estatisticamente significativa. No segundo quadro podemos constatar que as diferenças entre os valores esperados e os observados residem principalmente na percepção “boa” e “média”. Houve mais homens do que o esperado que consideram ter uma qualidade de vida média e menos homens do que o esperado que consideram ter uma qualidade de vida boa. No caso das mulheres, houve mais casos do que o esperado que consideram ter uma qualidade de vida boa e houve menos casos que consideram ter uma qualidade de vida média. Na qualidade de vida má as diferenças são bastante ténues. Neste caso podemos concluir que as mulheres têm uma melhor percepção da sua qualidade de vida. No entanto, esta conclusão é feita apenas a “olho nu” e carece de significância estatística, como anteriormente referido.

associação_NO4

 

Dimensões, domínios, facetas e factores

Quando se pretende avaliar e mensurar uma determinada qualidade elabora-se um instrumento de avaliação com um número de perguntas ou itens. Alguns instrumentos avaliam mais do que uma qualidade ou avaliam várias dimensões que fazem parte dessa qualidade que se pretende avaliar.

No caso da qualidade de vida, sabemos que existem várias dimensões. Ou seja, sabemos que a qualidade de vida engloba dimensões como o físico, o psicológico, o nível de dependência, relações sociais, meio ambiente ou aspectos religiosos. Um instrumento que pretenda avaliar a qualidade de vida apresentará variadas questões ligadas a estas dimensões. Um exemplo é o instrumento de avaliação da qualidade de vida da Organização Mundial de Saúde, composto por 100 questões (actualmente com versões mais curtas) e em que cada dimensão poderá ter até 8 questões.

No SPSS, torna-se necessário calcular o valor para cada uma dessas dimensões ou factores. Dependendo das orientações dos autores dos instrumentos, o cálculo pode corresponder a um total ou a um valor médio.

Tomando como exemplo um instrumento de avaliação em que uma das facetas corresponde às questões 3,4,5,6. Imaginemos que, de acordo com o autor do instrumento, a pontuação de cada dimensão é calculada correspondendo a um valor médio. Ou seja, é necessário somar os valores das respostas e dividir o total pelo número de itens. A figura abaixo demonstra como fazê-lo no SPSS.

dimensões1

Abre-se uma nova janela (figura abaixo), depois de executados os comandos anteriores, onde deve ser preenchido o nome da nova variável em Target Variable, que corresponde ao cálculo necessário para a pontuação da dimensão. Em Numeric Expression escreve-se a fórmula, utilizando as teclas que se encontram na janela.

dimensõe2

Na base de dados surge uma nova variável, a Faceta_A, cujo valor é a pontuação calculada.

Análise descritiva de variáveis quantitativas

As variáveis quantitativas permitem uma descrição em termos de média, mediana, moda, quartis e desvio padrão.

Vejamos o exemplo. Pretendo saber os valores médios, mínimos e máximos e de desvio padrão da variável Escala 1, nos homens e nas mulheres.

freq-escala1

Abre-se uma janela onde se escolhe a variável para a coluna (neste caso a variável Genero) e a variável quantitativa.

Para escolher as estatísticas, na caixa Define, escolhe-se Summary Statistics que abre nova janela. Aqui transportam-se as estatísticas que se pretende, utilizando a seta. De seguida, carrega-se em Aplly to Selection. A janela fecha e, carregando-se de seguida em Ok, obtêm-se as tabelas pedidas no ficheiro de Output.

freq-escala1-2

A tabela gerada indica-nos que a na Escala1, os homens apresentaram um valor médio de 2,75 enquanto as mulheres apresentaram um valor médio de 1,91. Em qualquer dos géneros, a amplitude de resposta variou entre zero e cinco.

freq-escala1-output

 

 

Análise descritiva de variáveis qualitativas

Qualquer que seja o estudo, é necessária a descrição de todas as variáveis envolvidas. Para as variáveis qualitativas, é apenas possível apresentar o número e a percentagem. Já para as variáveis quantitativas apresentam-se  a média, moda, mediana, quartis, desvio padrão, de acordo com as necessidades.
Em qualquer dos casos podem apresentar-se os valores para a totalidade da amostra ou por grupos. Imaginemos que a amostra é constituída por médicos e enfermeiros. Neste caso, pode ser do interesse do autor do estudo a apresentação dos resultados, quer no grupo dos enfermeiros, quer no grupo dos médicos. Da mesma forma, quando pretendemos apresentar os resultados por género, importa fazer a apresentação dos resultados no grupo do sexo masculino e no grupo do sexo feminino. Isto ocorre habitualmente quando se pretende fazer comparações entre grupos. Por exemplo, analisar se os homens diferem das mulheres ou se os enfermeiros diferem dos médicos em alguma das variáveis envolvidas no estudo.

Para as variáveis qualitativas, pede-se uma tabela de frequências.

table-fre

Os comandos do SPSS, na imagem acima, abrem a janela que se segue, onde serão escolhidas as variáveis, quer para as colunas, quer para as linhas. Caso não se pretenda a descrição por grupos, não se escolhe qualquer variável para as colunas.

tabela-freq2

É também nesta janela que se escolhem as estatísticas que se pretendem apresentar: percentagens ou subtotais, entre outros.

É gerada a seguinte tabela no output em que são apresentados o número e as percentagens por grupo e por variável. No caso do estado civil, das 12 pessoas do sexo masculino 41,7% são casadas ou em união de facto e 33,3% são solteiras. Já no grupo do sexo feminino, das 11 pessoas inquiridas, 63,6% são do casadas ou em união de facto e 27,3% são solteiras. No caso das habilitações literárias, sabemos que os inquiridos da amostra têm habilitações entre o 6º ano e o ensino superior, sendo que aproximadamente 60% dos homens tem habilitações superiores ao 12º ano e quase metade das mulheres tem o ensino superior.

tabela-freq-output

 

Guardar

Recodificação de variáveis- inversão de itens

Algumas escalas de avaliação são construídas com itens cujo sentido conceptual se encontra oposto ao dos restantes itens. Nestes casos, os autores das escalas determinam que, para o cálculo da pontuação, o valor atribuído deve ser invertido.

Para a recodificação dos itens, é sempre preferível criar uma nova variável para se manterem os dados originais. Os comandos são :transform/recode into different variables a partir dos quais se abrirá uma janela onde se escolhe a variável a trabalhar, o novo nome e o label. Carregando-se em old and new values, abre-se uma nova janela onde se atribuem os novos valores aos valores numéricos já existentes. De acordo com o exemplo da imagem seguinte, a variável Escala_1 pode assumir valores numéricos entre “0” e “6”, sendo que ao valor “0” corresponde o label “discordo completamente”  e ao valor “6” corresponde o label “concordo completamente”. A nova variável, com a inversão, assume os valores “0-concordo completamente” e “6-discordo completamente”.

inversao-itens-2Na base de dados podemos confirmar que a variável Escala_1_invertido apresenta os novos valores, conforme a inversão realizada.

inversao-itens-3

 

Recodificar variáveis- Classes de variáveis

Existem situações em que pretendemos diminuir o número de categorias duma variável sem perder informação. Nestes casos torna-se necessário congregar  os dados num menor número de categorias. Noutras situações pretende-se criar classes/categorias quando elas não existem. Nestes casos pode optar-se pela recodificação automática.

Pretendemos criar classes a partir da variável idade. Primeiramente é necessário saber quais os valores mínimo e máximo da nossa amostra, assim como os quartis, a média e o desvio padrão. Para tal pede-se uma análise de frequências, conforme demonstrado na figura abaixo (Analyze/Frequencies).

classes-idade

Obtém-se o seguinte otput:

classes-idades-output

Os participantes desta amostra têm idades entre os 21 e 67 anos e estão encontrados os seguintes quartis de idade: dos 21 aos 28 anos; dos 29 aos 37; dos 38 aos 42; e dos 43 aos 67 anos. Pedir uma análise dos quartis é a melhor forma de obter dados correctos quando pretendemos reorganizar uma variável de escala em classes.

De seguida, transforma-se a variável  utilizando para o efeito os comandos Transform/recode into different variable. Na primeira janela deverá colocar-se o nome da nova variável e o label e carregar no botão change. Carregar de seguida no botão Old and new values para aceder a uma nova janela onde serão assinalados os valores dos quartis e os valores numéricos que irão assumir.

classes-idade-transform

 

Perguntas de resposta aberta

Quando pretendemos explorar as respostas a uma questão deparamo-nos com a necessidade de utilizar uma pergunta de resposta aberta. Por exemplo, pode ser necessário saber quais as profissões das pessoas da amostra. Neste caso, na pergunta 6.Profissão o respondente escreve por extenso a sua profissão.

Para criar esta variável no SPSS, define-se como string, conforme abaixo se indica, com tamanho para 30 caracteres. Caso se torne necessário aumentar posteriormente o tamanho do campo, procede-se de igual forma.

variável string

Em Data view, a introdução dos dados relativamente a esta variável apresenta-se da seguinte forma:

variavel string1

Um dos cuidados a ter é utilizar sempre a mesma forma de escrita. O uso de maiúsculas e minúsculas pode dificultar o trabalho posterior e obrigar a rectificações. Por exemplo, introduzir a profissão Contabilista ou contabilista tem implicações futuras na recodificação da variável: serão contabilizadas duas diferentes profissões.

O primeiro passo é pedir uma tabela de frequências para termos uma ideia dos dados. É aberto o seguinte ficheiro de output no SPSS, onde consta a tabela de frequências.

variavel string-freq-output

Torna-se necessário recodificar esta variável para uma melhor apresentação dos resultados, ou mesmo em caso de pretendermos realizar outro tipo de análise estatística. O primeiro passo será a atribuição de valores numéricos a cada uma das profissões. Esta transformação só deverá ocorrer depois de todos os dados estarem inseridos na base de dados. Nas imagens seguintes apresentam-se os passos para tal (para ver maior carregue em cima da imagem).

variavel string3-1variavel string3-2

 

 

 

 

 

 

Criar a base de dados

Com a excepção de dados obtidos a partir dum suporte online, é sempre necessário criar uma base de dados. Alguns talvez optem por criar a base de dados num outro programa  (como o Excel), fazendo posteriormente a exportação para o SPSS. Mais uma vez, para facilitar e poupar tempo e esforço, é melhor optar-se pela base de dados em SPSS, já que é neste programa que se irá desenvolver todo o trabalho de análise dos mesmos.

Quando se inicia o programa podemos optar pelo data view ou pelo variable view (no SPSS fica em baixo e à esquerda). No primeiro são introduzidos os casos ou indivíduos e no segundo são introduzidas  as variáveis. O primeiro passo é optar pelo variable view e introduzir os nomes das variáveis, formatando-as de imediato.

Foram criadas as variáveis idade, género, estado civil, habilitações literárias e rendimentos familiares. A figura abaixo exemplifica a formatação da primeira variável, com zero casa decimais e com valores “0-Masculino ” e “1-Feminino”.

FORMATAR VARIAVEIS

De seguida identificar o tipo de medida.

FORMATAR VARIÁVEIS-2

Proceder de igual forma para as restantes variáveis, de acordo com o referido

Como classificar as variáveis no SPSS

Definir as variáveis no SPSS, a partir das perguntas dum inquérito, nem sempre é fácil. Embora algumas sejam mais difíceis do que outras, se somos caloiros neste programa de estatística temos a tendência a complicar ou a desvalorizar o correcto preenchimento da folha do SPSS.

Tomemos como exemplo a seguinte folha de rosto dum inquérito:

1. Idade: _________2. Género:

  1. Masculino
  2. Feminino

3. Estado Civil:

  1. Solteiro
  2. Casado ou a viver em união de facto
  3. Divorciado ou separado
  4. Viúvo

4. Habilitações literárias

  1. Até ao 4º ano
  2. Até ao 6º ano
  3. Até ao 9º ano
  4. Até ao 12º ano
  5. Ensino superior

5. Rendimentos familiares

  1. Até 500€
  2. Entre 501€ e 1000€
  3. Entre 1001€ e 2000€
  4. Entre 2001€ e 3000
  5. Entre 3001€ e 4000€
  6. Entre 4001€ e 4500€
  7. Mais de 4500€

As anteriores perguntas da página de rosto dum inquérito, que habitualmente servem para descrever a amostra utilizada no estudo e nomeadas variáveis sociodemográficas, assumem os seguintes tipos e medidas no SPSS.

Pergunta

Tipo de variável

SPSS

 

 

Type

Measure

Idade

 Quantitativa

Numeric

Scale

Género

Qualitativa

Numeric

Nominal

Estado civil

Qualitativa

Numeric

Nominal

Habilitações literárias

Qualitativa

Numeric

Ordinal

Rendimentos

Qualitativa

Numeric

Ordinal

Existem dois tipos de variáveis: qualitativas ou categóricas e quantitativas.

As variáveis qualitativas indicam uma qualidade, presente ou ausente, e cada uma das categorias é mutuamente exclusiva e exaustiva. Ou seja, se um indivíduo pertence a uma das categorias não poderá pertencer a outra e uma das categorias qualifica exaustivamente aquele indivíduo. Este tipo de variável pode apresentar-se numa escala nominal ou ordinal.

Um exemplo duma variável nominal é o género: ou se é do sexo masculino ou do sexo feminino (as categorias são mutuamente exclusivas) e uma das categorias qualifica exaustivamente o indivíduo. Podem utilizar-se números para identificar as categorias duma medida. Por este motivo a variável assume um tipo numérico (Type=numeric): “0” para masculino e “1” para feminino. No caso da variável estado civil, as categorias podem assumir os seguintes valores: “1”= solteiro; “2”=casado; “3”=divorciado; “4”= viúvo. A utilização de números facilita a introdução dos dados no SPSS, poupando tempo e esforço.

Numa variável ordinal, para além de serem mutuamente exclusivas e exaustivas, as categorias indicam uma ordem de magnitude. A variável habilitações literárias é um bom exemplo. Identificando as categorias com números, teremos: “1”= 4º ano; “2”=9º ano; “3”=12º ano; “4”= curso profissional; “5”= ensino superior. Sabemos que um indivíduo da categoria 2 apresenta-se numa ordem superior a outro da categoria 1. Não significa, no entanto, que o valor  2 seja o dobro do valor 1; assim como não significa que a diferença entre as categorias 2 e a 3 seja igual à diferença entre as categorias 4 e 5.

As variáveis quantitativas têm as propriedades das variáveis qualitativas e, adicionalmente, permitem medir a diferença entre valores. Ou seja, a diferença entre uma medição do valor 8 e o 10 é igual à diferença entre o valor 100 e o valor 102, e esta diferença é igual em qualquer ponto da escala. Estas variáveis podem apresentar-se numa escala intervalar ou de razão. Em qualquer dos casos, no SPSS são consideradas medidas de escala (measure=scale) e são sempre introduzidas com valor numérico.

Um exemplo duma variável intervalar (ou de intervalos iguais) são os graus de temperatura em Celsius. Uma diferença de cinco valores é igual em qualquer ponto da escala, quer seja entre o 16 e o 21, quer seja entre o 36 e o 41. . Embora possa existir uma medição com um valor zero, este não significa ausência de calor e, como tal, o zero não é absoluto. Neste caso, o valor zero é apenas  um valor arbitrário e corresponde ao ponto da congelação da água.

Uma variável de razão é aquela em que existe um zero absoluto, para além de possuir todas as propriedades duma variável intervalar. É o caso da idade que, como já foi referido, é formatada como variável de escala (measure=scale).

Testes de auto-avaliação

Testes de auto-avaliação em SPSS:

 

Prima aqui para experimentar o sistema I@NET