Sintaxe de comandos – I

O SPSS permite executar qualquer ação ou comando a partir de instruções de texto, ao invés de executá-las no ambiente gráfico a partir dos menus.

Abra o SPSS. No menu da janela Data Editor, abra uma janela de sintaxe com os comandos seguintes: File – New – Syntax.

Na janela de sintaxe, coloque o texto que consta da caixa seguinte. Depois, nos menus, escolha: Run – All.

DATA LIST FREE /
 Nome (A50) Sexo (F1.0) .
BEGIN DATA.
"António Manuel" 1
"Maria João" 2
"Josué Travanca" 1
"Teresa Salvador" 2
"Júlio Bento" 1
END DATA.

O resultado é a criação das variáveis Nome, do tipo String com 50 carateres (A50); e Sexo, do tipo numérico com um dígito e sem casas decimais (F1.0).

A janela Data Editor, no separador Data View, deve ter o seguinte conteúdo:

sintaxe1

No separador Variable View, o conteúdo é o seguinte:

sintaxe2

Escolha aleatória de parte da amostra

Quando se torna necessário trabalhar apenas com uma parte da amostra, teremos de seleccionar casos. Aqui apresenta-se um exemplo de selecção de metade da amostra.

Seleccionam-se os dados, conforme os comandos da imagem.

select_cases_0

Na nova janela, em Select escolhe-se “Random sample of cases” e carrega-se no botão “Sample”. Na nova janela escreve-se a percentagem de casos que se pretende seleccionar.

Em Output, escolhe-se “Copy selected cases to a new dataset” e escreve-se um novo nome para a nova base de dados.

Carregar em “Continue” e “Ok”.

select-0

 

Associação entre uma variável nominal e uma variável ordinal-problemas

Por vezes surgem algumas dificuldades quando se utiliza o teste do Qui-quadrado nas associações. O mais comum é surgirem células vazias.

Como exemplo, associou-se o género com a percepção de felicidade. No output gerado são apresentadas 3 tabelas: a primeira apresenta a percentagem de casos que foram utilizados na análise; a segunda apresenta o número de casos em cada classe, para cada género; e a terceira apresenta os valores e as significâncias dos testes de associação. A nota da terceira tabela diz-nos que existem células (na segunda tabela) que apresentam menos do que 5 casos, o que impede a utilização deste teste. Neste caso, pode optar-se por seleccionar apenas os casos em que não existem células vazias. Assim, a classe Nada ou muito ligeiramente será excluída e procede-se a nova análise.

qui-vazio

 

 

 

 

 

 

 

Correlações

A análise de correlações utiliza-se quando se pretende analisar a relação entre variáveis de escala.

Como exemplo, perante a necessidade de analisar a relação entre algumas características de personalidade e o tipo de afecto evidenciado, foi realizada uma análise de correlações. As dimensões da personalidade em análise são a extroversão, amabilidade, consciensiosidade, neuroticismo e abertura à experiência. As duas dimensões do afecto são o afecto positivo e o afecto negativo. Utilizando os comandos da imagem a seguir, abre-se uma nova janela (segunda imagem) onde se seleccionam as variáveis que interessam.

correlações

correlações-1

O output seguinte apresenta todas as correlações entre todas as variáveis. correlações-2

Para uma melhor e mais fácil leitura dos resultados mostra-se, num artigo posterior, como modificar a tabela no SPSS.

 

 

Testes de diferenças entre médias

Em estudos de mercado, quer seja no desenvolvimento dum produto, quer seja  na escolha dum público-alvo duma campanha de marketing, pode interessar-nos saber se existem diferenças entre homens e mulheres na aquisição do nosso produto. Para tal, teremos de comparar a aquisição do produto por parte de homens e de mulheres.

Neste caso, temos uma variável que podemos chamar “Aquisição”  e que nos diz qual o valor despendido, no nosso produto, pelo inquirido. Na amostra teremos respostas de homens e mulheres. O que precisamos fazer, de seguida, é comparar o valor médio amostral da variável “Aquisição”, quer no grupo de homens, quer no grupo de mulheres.

A “Aquisição” é uma variável de razão: compreende valores semanais gastos no nosso produto que oscilam entre zero euros e 10 euros. Neste caso utiliza-se o teste t para duas amostras independentes.  Os comandos são os que se seguem na figura abaixo.

testet1

Abre-se, de seguida, uma janela exemplificada na imagem em baixo. No campo Test Variable coloca-se a variável em que pretendemos analisar as diferenças e no campo Group Variable deve colocar-se a variável que identifica os grupos em teste. Neste caso o género é a variável grupo que pretendemos analisar. Devendo ser definidos os grupos em teste, carrega-se no botão Define Groups, que abre uma nova janela onde se define o grupo 1 com 0 (masculino)  e o grupo 2 com 1  (feminino), de acordo com a codificação anterior da variável na base de dados.

testet-2

O output do teste é apresentado na imagem abaixo. Na primeira tabela são apresentados os casos do grupo masculino e do grupo feminino, o valor médio despendido no nosso produto  nos grupos masculino e feminino e os respectivos valores de desvio padrão.

Na segunda tabela, são apresentados os valores do teste de Levene e do teste t. O teste de Levene permite-nos averiguar da homogeneidade das variâncias. Neste caso, conclui-se que as variâncias são diferentes nos dois grupos, uma vez que a significância associada ao teste é inferior a 0,05. Uma vez que não se assume a homogeneidade das variâncias, optamos por utilizar os valores do teste t de Equal variances not assumed. Os resultados indicam que não existem diferenças entre homens e mulheres no valor semanal despendido no nosso produto. O teste não mostrou diferenças estatisticamente significativas para um intervalo de 95% de confiança (a significância associada ao teste t foi superior a 0,05).

testet-3

Nota: para uma escolha mais criteriosa do teste a aplicar deve proceder-se à análise da distribuição das variáveis em estudo.

Associação entre uma variável nominal e uma variável ordinal

A análise de associação pretende verificar relações entre variáveis na amostra.

Pretende-se analisar a relação do género com a variável percepção da qualidade de vida. Sabemos que o género é uma variável nominal com duas categorias de resposta: masculino; feminino. Quanto à qualidade de vida, trata-se duma variável ordinal que compreende três categorias de resposta: alta, média, baixa.

Pretendemos verificar se a percepção da qualidade de vida está relacionada com o género. Neste caso, utilizamos o teste do Qui-quadrado, realizando um cruzamento entre as variáveis, como indicado na imagem abaixo..

associação_NO1

É aberta uma janela onde se escolhem as variáveis género e percepção da qualidade de vida e, carregando em Statistics, escolhe-se Chi Square e carrega-se em Continue.

associação_NO2

Carregando no botão Cells, em Counts escolhe-se Observed e Expected , para sabermos mais sobre os dados.

associação_NO3

Obtém-se o output do SPSS (imagem abaixo). O primeiro quadro mostra o número de inquéritos utilizados na análise. Neste caso apenas um caso foi considerado missing. O segundo quadro apresenta os valores observados e esperados em cada um dos géneros e em cada uma das categorias de resposta da variável percepção da qualidade de vida. O último quadro apresenta os valores de vários testes e a significância associada a cada um.

A significância associada ao teste do Qui-quadrado não foi menor que 0,05. Como tal, consideramos que a associação entre as variáveis não é estatisticamente significativa. No segundo quadro podemos constatar que as diferenças entre os valores esperados e os observados residem principalmente na percepção “boa” e “média”. Houve mais homens do que o esperado que consideram ter uma qualidade de vida média e menos homens do que o esperado que consideram ter uma qualidade de vida boa. No caso das mulheres, houve mais casos do que o esperado que consideram ter uma qualidade de vida boa e houve menos casos que consideram ter uma qualidade de vida média. Na qualidade de vida má as diferenças são bastante ténues. Neste caso podemos concluir que as mulheres têm uma melhor percepção da sua qualidade de vida. No entanto, esta conclusão é feita apenas a “olho nu” e carece de significância estatística, como anteriormente referido.

associação_NO4

 

Dimensões, domínios, facetas e factores

Quando se pretende avaliar e mensurar uma determinada qualidade elabora-se um instrumento de avaliação com um número de perguntas ou itens. Alguns instrumentos avaliam mais do que uma qualidade ou avaliam várias dimensões que fazem parte dessa qualidade que se pretende avaliar.

No caso da qualidade de vida, sabemos que existem várias dimensões. Ou seja, sabemos que a qualidade de vida engloba dimensões como o físico, o psicológico, o nível de dependência, relações sociais, meio ambiente ou aspectos religiosos. Um instrumento que pretenda avaliar a qualidade de vida apresentará variadas questões ligadas a estas dimensões. Um exemplo é o instrumento de avaliação da qualidade de vida da Organização Mundial de Saúde, composto por 100 questões (actualmente com versões mais curtas) e em que cada dimensão poderá ter até 8 questões.

No SPSS, torna-se necessário calcular o valor para cada uma dessas dimensões ou factores. Dependendo das orientações dos autores dos instrumentos, o cálculo pode corresponder a um total ou a um valor médio.

Tomando como exemplo um instrumento de avaliação em que uma das facetas corresponde às questões 3,4,5,6. Imaginemos que, de acordo com o autor do instrumento, a pontuação de cada dimensão é calculada correspondendo a um valor médio. Ou seja, é necessário somar os valores das respostas e dividir o total pelo número de itens. A figura abaixo demonstra como fazê-lo no SPSS.

dimensões1

Abre-se uma nova janela (figura abaixo), depois de executados os comandos anteriores, onde deve ser preenchido o nome da nova variável em Target Variable, que corresponde ao cálculo necessário para a pontuação da dimensão. Em Numeric Expression escreve-se a fórmula, utilizando as teclas que se encontram na janela.

dimensõe2

Na base de dados surge uma nova variável, a Faceta_A, cujo valor é a pontuação calculada.

Análise descritiva de variáveis quantitativas

As variáveis quantitativas permitem uma descrição em termos de média, mediana, moda, quartis e desvio padrão.

Vejamos o exemplo. Pretendo saber os valores médios, mínimos e máximos e de desvio padrão da variável Escala 1, nos homens e nas mulheres.

freq-escala1

Abre-se uma janela onde se escolhe a variável para a coluna (neste caso a variável Genero) e a variável quantitativa.

Para escolher as estatísticas, na caixa Define, escolhe-se Summary Statistics que abre nova janela. Aqui transportam-se as estatísticas que se pretende, utilizando a seta. De seguida, carrega-se em Aplly to Selection. A janela fecha e, carregando-se de seguida em Ok, obtêm-se as tabelas pedidas no ficheiro de Output.

freq-escala1-2

A tabela gerada indica-nos que a na Escala1, os homens apresentaram um valor médio de 2,75 enquanto as mulheres apresentaram um valor médio de 1,91. Em qualquer dos géneros, a amplitude de resposta variou entre zero e cinco.

freq-escala1-output

 

 

Análise descritiva de variáveis qualitativas

Qualquer que seja o estudo, é necessária a descrição de todas as variáveis envolvidas. Para as variáveis qualitativas, é apenas possível apresentar o número e a percentagem. Já para as variáveis quantitativas apresentam-se  a média, moda, mediana, quartis, desvio padrão, de acordo com as necessidades.
Em qualquer dos casos podem apresentar-se os valores para a totalidade da amostra ou por grupos. Imaginemos que a amostra é constituída por médicos e enfermeiros. Neste caso, pode ser do interesse do autor do estudo a apresentação dos resultados, quer no grupo dos enfermeiros, quer no grupo dos médicos. Da mesma forma, quando pretendemos apresentar os resultados por género, importa fazer a apresentação dos resultados no grupo do sexo masculino e no grupo do sexo feminino. Isto ocorre habitualmente quando se pretende fazer comparações entre grupos. Por exemplo, analisar se os homens diferem das mulheres ou se os enfermeiros diferem dos médicos em alguma das variáveis envolvidas no estudo.

Para as variáveis qualitativas, pede-se uma tabela de frequências.

table-fre

Os comandos do SPSS, na imagem acima, abrem a janela que se segue, onde serão escolhidas as variáveis, quer para as colunas, quer para as linhas. Caso não se pretenda a descrição por grupos, não se escolhe qualquer variável para as colunas.

tabela-freq2

É também nesta janela que se escolhem as estatísticas que se pretendem apresentar: percentagens ou subtotais, entre outros.

É gerada a seguinte tabela no output em que são apresentados o número e as percentagens por grupo e por variável. No caso do estado civil, das 12 pessoas do sexo masculino 41,7% são casadas ou em união de facto e 33,3% são solteiras. Já no grupo do sexo feminino, das 11 pessoas inquiridas, 63,6% são do casadas ou em união de facto e 27,3% são solteiras. No caso das habilitações literárias, sabemos que os inquiridos da amostra têm habilitações entre o 6º ano e o ensino superior, sendo que aproximadamente 60% dos homens tem habilitações superiores ao 12º ano e quase metade das mulheres tem o ensino superior.

tabela-freq-output

 

Guardar

Recodificação de variáveis- inversão de itens

Algumas escalas de avaliação são construídas com itens cujo sentido conceptual se encontra oposto ao dos restantes itens. Nestes casos, os autores das escalas determinam que, para o cálculo da pontuação, o valor atribuído deve ser invertido.

Para a recodificação dos itens, é sempre preferível criar uma nova variável para se manterem os dados originais. Os comandos são :transform/recode into different variables a partir dos quais se abrirá uma janela onde se escolhe a variável a trabalhar, o novo nome e o label. Carregando-se em old and new values, abre-se uma nova janela onde se atribuem os novos valores aos valores numéricos já existentes. De acordo com o exemplo da imagem seguinte, a variável Escala_1 pode assumir valores numéricos entre “0” e “6”, sendo que ao valor “0” corresponde o label “discordo completamente”  e ao valor “6” corresponde o label “concordo completamente”. A nova variável, com a inversão, assume os valores “0-concordo completamente” e “6-discordo completamente”.

inversao-itens-2Na base de dados podemos confirmar que a variável Escala_1_invertido apresenta os novos valores, conforme a inversão realizada.

inversao-itens-3