Author Archives: Teresa

Gráficos de linhas

A pedido do Gustavo, apresento aqui os passos para criar um gráfico de linhas.

Neste caso pretendemos saber os valores totais de vendas de cada mês de todos os vendedores duma empresa.

No menu escolher Graphs-Legacy Dialogs-Line.

grafico_vendas1

Na janela escolher Simple e Summaries of seprate variables. Carregar em Define. Como os vários meses do ano correspondem a variáveis distintas, interessa-nos escolher desta forma.

grafico_vendas2

Abre-se uma nova janela. Arrastar as variáveis dos meses do ano para a caixa Line Represents e carregar no botão Change Statistic que se encontra por baixo da caixa. Na nova janela escolhe-se Sum of Values uma vez que pretendemos saber a soma das vendas de cada mês. Carregar em Continue e OK.

grafico_vendas3

No Output podemos visualizar o seguinte gráfico.

grafico_vendas4

 

 

 

Problemas no teste do Qui-quadrado

As instruções para pedir o teste do Qui-quadrado encontram-se num artigo anterior.

Neste artigo pretende-se mostrar um erro comum ao pedir o Qui-quadrado e a forma como se pode resolver. O output abaixo é o resultado duma análise de associação do Sexo (masculino/feminino) com o Estado civil (4 categorias). No último quadro, a mensagem da alínea a) diz-nos que existem 3 células com valor esperado menor que 5. Comprovando-se que se trata da categoria “viúvo” no segundo quadro do output.

Qui-quadrado-problemasEste problema pode invalidar o resultado do teste. Para uma solução fácil, pode optar-se por realizar a análise para todas as categorias do estado civil, com excepção da categoria “viúvo”. Para tal escolhem-se as categorias mais expressivas ou com maior número de casos.

No menu, escolhe-se Data-Select Cases e abre-se a janela (imagem abaixo) onde se selecciona If Condition is Satisfied. Na nova janela selecciona-se a variável Estado civil e, utilizando o teclado virtual, escolhemos todos os casos em que a categoria é igual ou inferior a 3. Lembramos que o Estado civil tem 4 categorias assinaladas com os seguintes números: 1=solteiro; 2= casado/união de facto; 3=divorciado/separado; e 4=viúvo.

Qui-quadrado-problemas1Carrega-se em Continue e depois Ok na primeira janela aberta. Operou-se um filtro que deixará de lado todos os casos de pessoas viúvas.

Volta a realizar-se o teste do Qui-Quadrado.

 

Teste do Qui-quadrado

Recorre-se a este teste sempre que precisamos analisar a associação entre uma variável nominal e outra variável nominal ou ordinal.

Neste caso pretendemos analisar se a situação escolar (estudante e trabalhador-estudante) está associada à classe etária.  Qualquer uma das variáveis tem apenas duas categorias de resposta. A situação escolar é uma variável nominal e a variável classe etária é ordinal: dos 18 e 22 anos e dos 23 aos 60 anos.

No menu escolhe-se Analyze-Descriptive Statisctis-Crosstabs. Abre-se a janela Crosstabs da figura abaixo. Escolhe-se a variável situação escolar para a caixa Columns e a variável Classe etária para a caixa Rows. Para escolher o teste, carregar em Statistics e abre-se a janela à direita onde se escolhe o teste. Carregar em Continue na janela de Crosstabs:Statistics.

Qui-quadrado1

Para se saber como estão associadas as variáveis é importante pedir que as tabelas contenham não só os valores observados mas os esperados. Assim, ainda na janela Crosstabs, carrega-se em Cells e escolhe-se os valores observados e os esperados, conforma figura abaixo.

Qui-quadrado3Carregar Continue e depois Ok na janela de Crosstabs.

Obtém-se o output abaixo.

Qui-quadrado3O terceiro quadro apresenta o valor do teste e a significância associada. Este permite concluir que existe uma associação significativa da situação escolar com a idade, já que  p≤0,05. Quando analisamos  o quadro da Crosstabulation, podemos notar que existem mais casos, do que o esperado, de trabalhadores-estudantes nas pessoas acima dos 23 anos.

 

 

 

 

Perguntas de resposta aberta-alteração das categorias de resposta

Na sequência do artigo acerca de  perguntas de resposta aberta,  torna-se necessário alterar as categorias de resposta já que muitas são iguais. Por exemplo, queremos juntar numa só categoria de resposta as profissões jornalista e o jornalista de rádio, conforme output abaixo. Também notamos no output que a categoria 1 está em branco, não correspondendo a nenhum tipo de profissão.

categorias-resposta aberta

Em Variable View, abrindo o Values da nova variável recodificada, observamos que o valor 2 corresponde à profissão arquitecta, estando carregadas as várias categorias de resposta e os seus valores.

categorias-resposta aberta-1

Pode interessar-nos criar diferentes categorias de resposta que juntem mais do que uma profissão. No exemplo actual, interessam-nos as seguintes categorias profissionais:

  1. Quadros superiores e dirigentes
  2. Especialistas de profissões intelectuais e científicas
  3. Técnicos e profissionais de nível intermédio
  4. Pessoal administrativo e similares
  5. Pessoal dos serviços e vendedores
  6. Agricultores e trabalhadores da agricultura e pescas
  7. Operários, artíficies e similares
  8. Operários de instalações e máquinas
  9. Trabalhadores não qualificados

Como proceder? Transformar, recodificando na mesma variável. Em Transform/Recode into same variables, escolher a variável anteriormente criada e carregando em Old and New Values, abre-se uma nova janela. A cada valor já existente iremos atribuir um novo valor. Conforme se observa na janela da direita da imagem em baixo, no quadrado Old–New estão já carregados vários valores, sendo que o último será o valor 22 a que será atribuído o valor 2. Se observarmos na primeira imagem deste artigo, o valor 22 corresponde à resposta Veterinária. Neste caso, o valor 22 passará a er codificado com o valor 2, que corresponde a Especialistas de profissões intelectuais e científicas (conforme as categorias profissionais que nos interessam).  No final carregar em Continue e OK.

categorias-resposta aberta-2

Seguidamente é necessário atribuir novos nomes (Labels) aos valores da variável. Note que a variável continua com os valores e nomes anteriores a esta última recodificação. Para proceder a esta alteração, em Variable View, abrir o Values Labels e alterar os valores e os nomes, conforme imagem em baixo.

Para cada valor, escolher, alterar o Label e carregar em Change. Os restantes valores a que não se atribuir qualquer label, escolher um a um e carregar em Remove. No final carregar em OK.

categorias-resposta aberta-3Se pedirmos uma nova análise de frequências temos os seguintes dados actualizados.

categorias-resposta aberta-4

 

 

 

 

Perguntas de resposta múltipla-tabelas e gráficos

Em perguntas que permitem que o entrevistado assinale mais do que uma resposta, o tratamento dos dados obriga a algum planeamento.

Primeiro terá de se fragmentar a pergunta  em n variáveis. Sendo que n corresponde ao número de categorias de resposta. Como exemplo temos a pergunta “12- características de arquitectura” com as respostas a) cor; b) espaço; c) armários; d) luz.  Terão de ser criadas 4 variáveis que correspondem às categorias de resposta. Em cada uma delas, o nível de resposta será apenas 0=não e 1=sim.

Para criar a tabela de frequências para esta pergunta, procede-se do seguinte modo.

Em Analyze, Multiple Response Set, carregar em Define Variable Sets.

resposta multipla_1

Na janela, definir o conjunto de variáveis esolhendo as variáveis que fazem parte do conjunto e determinando apenas as respostas assinaladas com 1-Sim. Para tal, em Variables Are Coded As, escolher Dichotomies,  Counted Value, e assinalar 1 em Counted Value.

resposta multipla_2

Carregar em Add .

Para pedir as frequências do conjunto de variáveis, escolher novamente Em Analyze, Multiple Response Set e carregar em Frequencies e OK.

resposta multipla_3

Obtem-se a tabela de frequências no ficheiro de output.

Para pedir um gráfico desta tabela, será necessário activar a tabela, carregando com o botão esquerdo do rato em cima da mesma. Selecionar os dados que pretendemos ver em gráfico e, carregando no botão direito do rato, selecionar Create Graph e carregar Bar (ou outro).

resposta multipla_4

Obtém-se o gráfico no ficheiro de output.

resposta multipla_5

 

Análise da normalidade – como executar

Por vezes torna-se necessário analisar se uma variável tem ou não distribuição normal.

Seleccionam-se os comandos de acordo com a imagem a seguir.

normalidade

De seguida é aberta uma janela, onde se escolhe a variável cuja distribuição pretendemos analisar, conforme imagem abaixo.

normalidade_2

Em Statistics, selecionar Descriptives. Continue

normalidade_4Escolhendo a opção Plots, em  Boxplots- escolhe-se Factor levels together; em Descriptive escolhe-se Stem-and-leaf e Histogram. Escolhe-se, ainda, Normality plots with tests e Continue.

normalidade_3Carregar em Ok para obter o output da análise.

No output irá encontrar o valor do teste e a significância. Se esta for superior a 0,05 então as variáveis em estudo seguem uma distribuição normal.

 

Guardar

Escolha aleatória de parte da amostra

Quando se torna necessário trabalhar apenas com uma parte da amostra, teremos de seleccionar casos. Aqui apresenta-se um exemplo de selecção de metade da amostra.

Seleccionam-se os dados, conforme os comandos da imagem.

select_cases_0

Na nova janela, em Select escolhe-se “Random sample of cases” e carrega-se no botão “Sample”. Na nova janela escreve-se a percentagem de casos que se pretende seleccionar.

Em Output, escolhe-se “Copy selected cases to a new dataset” e escreve-se um novo nome para a nova base de dados.

Carregar em “Continue” e “Ok”.

select-0

 

Associação entre uma variável nominal e uma variável ordinal-problemas

Por vezes surgem algumas dificuldades quando se utiliza o teste do Qui-quadrado nas associações. O mais comum é surgirem células vazias.

Como exemplo, associou-se o género com a percepção de felicidade. No output gerado são apresentadas 3 tabelas: a primeira apresenta a percentagem de casos que foram utilizados na análise; a segunda apresenta o número de casos em cada classe, para cada género; e a terceira apresenta os valores e as significâncias dos testes de associação. A nota da terceira tabela diz-nos que existem células (na segunda tabela) que apresentam menos do que 5 casos, o que impede a utilização deste teste. Neste caso, pode optar-se por seleccionar apenas os casos em que não existem células vazias. Assim, a classe Nada ou muito ligeiramente será excluída e procede-se a nova análise.

qui-vazio

 

 

 

 

 

 

 

Correlações

A análise de correlações utiliza-se quando se pretende analisar a relação entre variáveis de escala.

Como exemplo, perante a necessidade de analisar a relação entre algumas características de personalidade e o tipo de afecto evidenciado, foi realizada uma análise de correlações. As dimensões da personalidade em análise são a extroversão, amabilidade, consciensiosidade, neuroticismo e abertura à experiência. As duas dimensões do afecto são o afecto positivo e o afecto negativo. Utilizando os comandos da imagem a seguir, abre-se uma nova janela (segunda imagem) onde se seleccionam as variáveis que interessam.

correlações

correlações-1

O output seguinte apresenta todas as correlações entre todas as variáveis. correlações-2

Para uma melhor e mais fácil leitura dos resultados mostra-se, num artigo posterior, como modificar a tabela no SPSS.

 

 

Testes de diferenças entre médias

Em estudos de mercado, quer seja no desenvolvimento dum produto, quer seja  na escolha dum público-alvo duma campanha de marketing, pode interessar-nos saber se existem diferenças entre homens e mulheres na aquisição do nosso produto. Para tal, teremos de comparar a aquisição do produto por parte de homens e de mulheres.

Neste caso, temos uma variável que podemos chamar “Aquisição”  e que nos diz qual o valor despendido, no nosso produto, pelo inquirido. Na amostra teremos respostas de homens e mulheres. O que precisamos fazer, de seguida, é comparar o valor médio amostral da variável “Aquisição”, quer no grupo de homens, quer no grupo de mulheres.

A “Aquisição” é uma variável de razão: compreende valores semanais gastos no nosso produto que oscilam entre zero euros e 10 euros. Neste caso utiliza-se o teste t para duas amostras independentes.  Os comandos são os que se seguem na figura abaixo.

testet1

Abre-se, de seguida, uma janela exemplificada na imagem em baixo. No campo Test Variable coloca-se a variável em que pretendemos analisar as diferenças e no campo Group Variable deve colocar-se a variável que identifica os grupos em teste. Neste caso o género é a variável grupo que pretendemos analisar. Devendo ser definidos os grupos em teste, carrega-se no botão Define Groups, que abre uma nova janela onde se define o grupo 1 com 0 (masculino)  e o grupo 2 com 1  (feminino), de acordo com a codificação anterior da variável na base de dados.

testet-2

O output do teste é apresentado na imagem abaixo. Na primeira tabela são apresentados os casos do grupo masculino e do grupo feminino, o valor médio despendido no nosso produto  nos grupos masculino e feminino e os respectivos valores de desvio padrão.

Na segunda tabela, são apresentados os valores do teste de Levene e do teste t. O teste de Levene permite-nos averiguar da homogeneidade das variâncias. Neste caso, conclui-se que as variâncias são diferentes nos dois grupos, uma vez que a significância associada ao teste é inferior a 0,05. Uma vez que não se assume a homogeneidade das variâncias, optamos por utilizar os valores do teste t de Equal variances not assumed. Os resultados indicam que não existem diferenças entre homens e mulheres no valor semanal despendido no nosso produto. O teste não mostrou diferenças estatisticamente significativas para um intervalo de 95% de confiança (a significância associada ao teste t foi superior a 0,05).

testet-3

Nota: para uma escolha mais criteriosa do teste a aplicar deve proceder-se à análise da distribuição das variáveis em estudo.