Recodificar variáveis- Classes de variáveis


Existem situações em que pretendemos diminuir o número de categorias duma variável sem perder informação. Nestes casos torna-se necessário congregar  os dados num menor número de categorias. Noutras situações pretende-se criar classes/categorias quando elas não existem. Nestes casos pode optar-se pela recodificação automática.

Pretendemos criar classes a partir da variável idade. Primeiramente é necessário saber quais os valores mínimo e máximo da nossa amostra, assim como os quartis, a média e o desvio padrão. Para tal pede-se uma análise de frequências, conforme demonstrado na figura abaixo (Analyze/Frequencies).

classes-idade

Obtém-se o seguinte otput:

classes-idades-output

Os participantes desta amostra têm idades entre os 21 e 67 anos e estão encontrados os seguintes quartis de idade: dos 21 aos 28 anos; dos 29 aos 37; dos 38 aos 42; e dos 43 aos 67 anos. Pedir uma análise dos quartis é a melhor forma de obter dados correctos quando pretendemos reorganizar uma variável de escala em classes.

De seguida, transforma-se a variável  utilizando para o efeito os comandos Transform/recode into different variable. Na primeira janela deverá colocar-se o nome da nova variável e o label e carregar no botão change. Carregar de seguida no botão Old and new values para aceder a uma nova janela onde serão assinalados os valores dos quartis e os valores numéricos que irão assumir.

classes-idade-transform

 


46 comentários a “Recodificar variáveis- Classes de variáveis”

      • Boa tarde quero fazer o agrupamento das idades. Já tenho os quartis, fiz tudo conforme o turorial,mas quando chego à caixa Odl and new values não consigo adicionar os valores.
        coloco os valores na caixa range e through mas não ativa o adicionar na caixa old/ new. Falta alguma coisa?
        Obrigado!

        • Falta atribuir um valor a cada quartil, no lado direito da caixa onde diz “New Value”-Value. Depois carregar no botão Add para cada valor.

          • Tenho uma amostra cuja idade vaia entre 13 e 24 anos. Quero agrupar em classe de idade, já calculei os quartis como mostra o tutorial (1º quartil=1 anos; 2º = 16 anos e 3º = 18 anos). A seguir, como devo proceder?

  1. Boa tarde.

    Tenho uma base de dados com uma variável continua : pesos .

    Quero agrupar em classes, as classes não deviam ter a mesma amplitude?

    • Primeiro terá de encontrar os quadris da variável peso. Depois faz uma recodificação para uma nova variável em classes de peso. Nesta nova variável irá atribuir um valor ao primeiro quadril, 2 ao segundo e assim sucessivamente.

    • Teresa, desculpa pelo incómodo, mas a minha dúvida continua. Fiz como me sugeriu, isto é,proceder como está na 3ª imagem do tutorial. E ficou assim: 1- Dos 13 (idade mínima aos 15 anos (1º quarti);
      2- Dos 16 aos 16 anos (2º quarti;
      3- dos 17 aos 18 anos (3º quartil);
      4- dos 19 aos 24 anos (4º quarti)
      Porém, acontece que, para o segundo grupo, o programa não me deixa adicionar. Como dividir?

  2. Olá! Tenho um questionário sobre um tema constituído por 11 perguntas, no entanto, existe um relação entre essas e os diferentes subtemas, por exemplo a pergunta 1 a 4 é o subtema a), da 5 a 7 é o o subtema b), da 8 a 11 é o o subtema c).
    Logo as minhas dúvidas são:
    – Como faço para através do questionário que tenho chegar a um resultado final para cada subtema? Isto é, para determinar qual o mais relevante para a população em estudo.
    – É possível criar uma “nova variável” para ter um resultado final para cada tema (isto é somatório de todas as perguntas)? É assim posso realizar testes de correlação com outros temas definidos nas hipóteses em estudo, certo?
    Muito obrigada pela sua ajuda!

  3. Bom dia, eu tenho uma base de dados do Instituto nacional de estatistica do meu pais, os mesmos fazem referencia ao perfil duma das cidades do pais. eu quero retirar os dados referentes as tipologias dos modelos das casos. Contudo, os dados vem em percentagem. Eu queria saber como devo proceder para obter graficos destes mesmos dados (por ex: casas convencionais – Distrito 1 tem 6.7%, Distrito 2 tem 4.8%, Distrito 3 tem 7.% etc; Flat/apartamento – Distrito 1 tem 6.8%, Distrito 2 tem 5.9%, Distrito 3 tem 7.4%). Pretendo obter um grafico que possa estabelecer uma comparacao com os diferentes casos.

  4. Não entendo muito bem o que fez nem os valores dos quartis.
    Se pretende criar categorias duma variável de escala, tem de selecionar no menu TRANSFORM e RECODE INTO DIFFERENT VARIABLE.

    Nota: 1943 deverá ter sido colocado por engano pelo respondente, sendo o ano em que a empresa foi criada. Tem de corrigir o valor para a idade da empresa.

  5. desenvolvo um estudo em que necessito agrupar os participantes por tipos de diagnostico , ou seja varios diagnósticos dentro de um . Tenho uma variável diagnostico . Como crio o grupo a b c por subtipos?

    • Primeiro é necessário que todos os diagnósticos estejam em categorias. Por exemplo, tem as categorias 1-cancro da mama; 2- cancro do colo do útero; 3- Insuficiência renal; 4- Diabetes.
      Depois, no Menu escolhe RECODE INTO DIFFERENT VARIABLE onde vai atribuir uma nova categoria a cada categoria anterior de diagnóstico.
      E pretende que as categorias 1,2 e 3 passem a se apenas uma: 1-cancro. A categoria 3 passa a 2- Insufi. renbal e a 4 passa a 3- diabetes.

  6. Boa tarde, eu fiz um questionario de 64 perguntas a 25 pessoas e coloquei as perguntas na base de dados como variáveis independentes, ou seja tenho 64 variaveis.
    Como é que as posso agrupar para fazer as tabelas e graficos?

    • Não especificou o que pretende agrupar.
      Por ex. a idade, se estiver como medida escalar, pode transformá-la para se agrupar em categorias. lEIA ESTE ARTIGO-http://www.dicas-spss.com/?cat=18
      Ou, caso tenha uma questionário com várias perguntas que queira agrupar para ter uma pontuação, LEIA ESTE ARTIGO- http://www.dicas-spss.com/?cat=23

      • Quero agrupar as perguntas (variaveis), porque ao fazer as tabelas de frequencia, aparecem me 64 tabelas diferentes e queria agrupar tudo numa só..

        • No MENU escolhe ANALYZE – TABLES – CUSTOM TABLES. Deve arrastar para “Rows” as variáveis que pretende ver na tabela.
          Depois de ter as variáveis escolhidas tem de escolher as estatísticas que pretende (média, desvio-padrão, percentagem, etc).

  7. Ola, boa tarde. Sou iniciante no SPSS e, talvez, possa ser burrice minha, mas nao entendi absolutamente nada da explicacao. Nao consegui compreender o passo-a-passo.

    Seguinte, quero recodificar a variavel idade. No banco de dados, estao dividias em 1- abaixo de 18; 2- entre 18 e 21; 3- entre 21 e 29, 4- entre 29 e 50 e 5- Acima de 50.

    Quero recodicifar com os seguintes intervalos:
    1-Até 24 anos
    2- 25 a 29 anos
    3- 30 a 34 anos
    4- 35 a 39 anos
    5 – 40 anos ou mais

    Pode explicar?

    Grato

    • Não pode fazer o que pretende porque limitou as respostas das pessoas a essas categorias.
      Só pode criar essas categorias se tiver uma variável escala em que as pessoas tenham escrito a idade exacta.

  8. Boa tarde,
    Para criar uma nova variável para a idade por exemplo, com 4 grupos etários devo ir a Transformar, categorização visual-escolher a variável que pretendo (idade) e depois em relação aos pontos de corte se quiser por exemplo 4 devo colocar um a menos? 3 neste caso? E depois qual é o processo para continuar?
    Obrigada!

    • Em Transform-Recode into Different Variables. Escolhe a variável Idade a partir da qual vai criar uma nova variável de classe, dá-lhe um nome classe_etaria (por ex.) e, em Range, coloca os valores para cada classe.

  9. Boa noite Teresa! Parabéns pelo site e pela forma como explica as coisas de forma tão clara 🙂
    Tenho 3 dúvidas, tenho uma amostra de 450 pessoas, estou a analisar as diferenças entre género para a cerveja.
    No questionário tenho uma pergunta com opções de resposta (1 cerveja por dia, 2 cervejas por dia, 3 cervejas por dia; 4 cervejas por dia; mais de 4 cervejas por dia; não sabe/não responde). Assim considero esta variável de escala ordinal ou intervalar ou de razões discreta?

    O Teste Qui-Quadrado aplico a duas variáveis nominais e após o seu resultado tenho de fazer mais alguma (coeficiente V de Cramer)? Se sim, como aplicar?

    Mais uma pergunta, a representação do teste de Mann-Whitney é feita de que forma? M-W = 26853; p=0,000)? Ou terei de colocar algo à frente de M-W?

    • A variável “nº de cervelas” é uma variável nominal se considerar as categorias “não sabe/não responde.
      Caso não considere essa categoria, trata-se duma variável ordinal.

      Para a qui-quadrado tem de ter atenção às notas acerca do nº de células vazias, que pode diminuir a fiabilidade dos resultados.

      Para a apresentação do Mann-Whitney, tem de consultar as normas de publicação que seguirá.

  10. Olá Teresa,
    Parabéns seu site é ótimo, você é muito didática.
    Tenho uma escala do tipo likert que mensura cinco dimensões da personalidade, gostaria de calcular o percentil no spss em cada uma dessas dimensões, como posso fazer isso?
    Obrigada!

  11. Gostaria de saber o seguinte, como posso recodificar uma nova variavel através de duas variaveis antigas.
    Por exemplo:

    Categoria 1 – Se velocidade <= 6 e inclinação =0
    Categoria 2 – Se velocidade <=10 e inclinação = 0
    Categoria 3 – Se velocidade <=10 e inclinação <=3

  12. Olá Teresa.
    Estou com um problema urgentíssimo! É o seguinte, consigo recodificar as variáveis que estão em escala mas as outras (nominal) não consigo. Excepto aquelas que não têm a presença de um “a” por baixo do símbolo, ao qual não sei o que é isso e se influência ou não.
    Há solução para recodificar? Dava-me imenso jeito colocar intervalos porque a minha base dados é enorme e os valores são todos diferentes.

    • Ruben, tenho dificuldade em responder-lhe porque não entendo o que quer dizer com um “a” por baixo dum símbolo (que também não percebo.
      Veja se as variáveis nominais não estão como variáveis String (na 2ª coluna no variable view).

  13. Tenho uma variável sobre a profissão (questão aberta) e a pergunta é:O que se fazia se tivesse uma questão qualitativa e se pretendesse analisar quantitativamente?

    • Tem de fazer a transformação automática analisar a lista de respostas, a sua frequência e então tentar agrupar as respostas em categorias de resposta mais abrangentes.
      Atenção que o SPSS é sensível a maiúsculas, acontecendo a repetição de profissões que apenas diferem na primeira letra (ex. Arquiteto, arquiteto, arquitecto)

  14. Boa tarde! Gostaria de saber em que autor baseou-se para fazer esse agrupamento de escalas etárias. Eu andei a pesquisar imensa coisa mas única fonte que consegui foi a sua.

    • Com base na amostra analisada, os quartis encontrados foram os que estão descritos no artigo.
      Em cada amostra deve analisar quais os quartis a partir dos quais deve dividir a amostra.

  15. Olá Teresa, desde já muitos parabéns pelo site.
    Gostaria de saber se pode indicar-me um autor a quem possa “recorrer” para fundamentar às faixas etárias, isto é, justificar porque recorri aos quartis?
    Muito obrigada.

    • Se tiver necessidade de saber qual a idade abaixo da qual tem 25% das pessoas da amostra, ou 50% da amostra ou 75% da amostra, usa os quartis.
      Não é necessário que nenhum autor o justifique. Isto é uma “ferramenta” como qualquer outro gráfico que é gerado pelo SPSS.

  16. Boa tarde.
    Estou a fazer um estudo com uma resposta aberta. Nesta resposta aberta, quem respondia teria de nomear 3 caraterísticas de 38. Agora, com todos os dados, e já com os valores colocados, não passo daqui. O que eu queria era que me contassem as caraterísticas de cada resposta individualmente e nao como um todo. Como posso fazer? Obrigado.

  17. Boa tarde
    Gostaria que alguém me ajudasse a resolver uma situação no spss:
    Tenho um questionário com 12 itens, para cada 3 itens é uma dimensão. Como posso cruzar essa dimensão com uma variável? Sabendo que uma dimensão tem 3 perguntas. Ajudem por favor.

  18. Boa tarde,

    Escrevo este comentário porque preciso de ajuda no seguinte: tenho uma variável: obesidade (1 e 0) e faixas etárias. O meu objetivo é juntar as duas variavies para posteriormente ver a probabilidade de morte em doentes diabéticos mediante a faixa etária.

    Espero ter sido clara.
    Muito obrigada,
    Joana

  19. Cara Dra, saudações. Pretendo criar classes num conjunto de dados no spss, mas encontro algumas dificuldades principalmente para preencher as janelas depois que abramos a partir do Old and New Value(regras para criação da nova variável!

  20. Olá. Tenho uma dúvida que gostaria de esclarecer. tenho uma questão que caso a pessoa responda “sim” responde à questão seguinte, se responde “não”, passa uma questão à frente.
    Como faço quando estou a inserir os dados? deixo em branco ou crio uma opção ?
    obrigado.

  21. Boa tarde.
    Antes de mais, parabéns pelo site.
    Tenho uma dúvida. Eu tenho o IMC distribuido em 3 classes (obesidade, pré-obesidade e eutrófico) e tenho 3 momentos de avaliação. Eu quero saber se a evolução da percentagem de obesidade, pré-obesidade e eutrofia é significativa ao longo do tempo. Qual o teste que devo utilizar?
    Obrigada

Responder a Ana Cancelar resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *