Recodificar variáveis- Classes de variáveis

Existem situações em que pretendemos diminuir o número de categorias duma variável sem perder informação. Nestes casos torna-se necessário congregar  os dados num menor número de categorias. Noutras situações pretende-se criar classes/categorias quando elas não existem. Nestes casos pode optar-se pela recodificação automática.

Pretendemos criar classes a partir da variável idade. Primeiramente é necessário saber quais os valores mínimo e máximo da nossa amostra, assim como os quartis, a média e o desvio padrão. Para tal pede-se uma análise de frequências, conforme demonstrado na figura abaixo (Analyze/Frequencies).

classes-idade

Obtém-se o seguinte otput:

classes-idades-output

Os participantes desta amostra têm idades entre os 21 e 67 anos e estão encontrados os seguintes quartis de idade: dos 21 aos 28 anos; dos 29 aos 37; dos 38 aos 42; e dos 43 aos 67 anos. Pedir uma análise dos quartis é a melhor forma de obter dados correctos quando pretendemos reorganizar uma variável de escala em classes.

De seguida, transforma-se a variável  utilizando para o efeito os comandos Transform/recode into different variable. Na primeira janela deverá colocar-se o nome da nova variável e o label e carregar no botão change. Carregar de seguida no botão Old and new values para aceder a uma nova janela onde serão assinalados os valores dos quartis e os valores numéricos que irão assumir.

classes-idade-transform

 

41 thoughts on “Recodificar variáveis- Classes de variáveis

      1. Cláudia Carvalho

        Boa tarde quero fazer o agrupamento das idades. Já tenho os quartis, fiz tudo conforme o turorial,mas quando chego à caixa Odl and new values não consigo adicionar os valores.
        coloco os valores na caixa range e through mas não ativa o adicionar na caixa old/ new. Falta alguma coisa?
        Obrigado!

        Reply
        1. Teresa Post author

          Falta atribuir um valor a cada quartil, no lado direito da caixa onde diz “New Value”-Value. Depois carregar no botão Add para cada valor.

          Reply
          1. Domingas

            Tenho uma amostra cuja idade vaia entre 13 e 24 anos. Quero agrupar em classe de idade, já calculei os quartis como mostra o tutorial (1º quartil=1 anos; 2º = 16 anos e 3º = 18 anos). A seguir, como devo proceder?

  1. Inês

    Boa tarde.

    Tenho uma base de dados com uma variável continua : pesos .

    Quero agrupar em classes, as classes não deviam ter a mesma amplitude?

    Reply
    1. Teresa Post author

      Primeiro terá de encontrar os quadris da variável peso. Depois faz uma recodificação para uma nova variável em classes de peso. Nesta nova variável irá atribuir um valor ao primeiro quadril, 2 ao segundo e assim sucessivamente.

      Reply
    2. Domingas

      Teresa, desculpa pelo incómodo, mas a minha dúvida continua. Fiz como me sugeriu, isto é,proceder como está na 3ª imagem do tutorial. E ficou assim: 1- Dos 13 (idade mínima aos 15 anos (1º quarti);
      2- Dos 16 aos 16 anos (2º quarti;
      3- dos 17 aos 18 anos (3º quartil);
      4- dos 19 aos 24 anos (4º quarti)
      Porém, acontece que, para o segundo grupo, o programa não me deixa adicionar. Como dividir?

      Reply
  2. Tiago Dias

    Olá! Tenho um questionário sobre um tema constituído por 11 perguntas, no entanto, existe um relação entre essas e os diferentes subtemas, por exemplo a pergunta 1 a 4 é o subtema a), da 5 a 7 é o o subtema b), da 8 a 11 é o o subtema c).
    Logo as minhas dúvidas são:
    – Como faço para através do questionário que tenho chegar a um resultado final para cada subtema? Isto é, para determinar qual o mais relevante para a população em estudo.
    – É possível criar uma “nova variável” para ter um resultado final para cada tema (isto é somatório de todas as perguntas)? É assim posso realizar testes de correlação com outros temas definidos nas hipóteses em estudo, certo?
    Muito obrigada pela sua ajuda!

    Reply
    1. Teresa Post author

      Deve calcular um valor para cada subtema (habitualmente denominados dimensão ou factor) em Transform/Compute variable.

      Reply
  3. Muchacha

    Bom dia, eu tenho uma base de dados do Instituto nacional de estatistica do meu pais, os mesmos fazem referencia ao perfil duma das cidades do pais. eu quero retirar os dados referentes as tipologias dos modelos das casos. Contudo, os dados vem em percentagem. Eu queria saber como devo proceder para obter graficos destes mesmos dados (por ex: casas convencionais – Distrito 1 tem 6.7%, Distrito 2 tem 4.8%, Distrito 3 tem 7.% etc; Flat/apartamento – Distrito 1 tem 6.8%, Distrito 2 tem 5.9%, Distrito 3 tem 7.4%). Pretendo obter um grafico que possa estabelecer uma comparacao com os diferentes casos.

    Reply
  4. Teresa Post author

    Não entendo muito bem o que fez nem os valores dos quartis.
    Se pretende criar categorias duma variável de escala, tem de selecionar no menu TRANSFORM e RECODE INTO DIFFERENT VARIABLE.

    Nota: 1943 deverá ter sido colocado por engano pelo respondente, sendo o ano em que a empresa foi criada. Tem de corrigir o valor para a idade da empresa.

    Reply
  5. Paula Peixoto

    desenvolvo um estudo em que necessito agrupar os participantes por tipos de diagnostico , ou seja varios diagnósticos dentro de um . Tenho uma variável diagnostico . Como crio o grupo a b c por subtipos?

    Reply
    1. Teresa Post author

      Primeiro é necessário que todos os diagnósticos estejam em categorias. Por exemplo, tem as categorias 1-cancro da mama; 2- cancro do colo do útero; 3- Insuficiência renal; 4- Diabetes.
      Depois, no Menu escolhe RECODE INTO DIFFERENT VARIABLE onde vai atribuir uma nova categoria a cada categoria anterior de diagnóstico.
      E pretende que as categorias 1,2 e 3 passem a se apenas uma: 1-cancro. A categoria 3 passa a 2- Insufi. renbal e a 4 passa a 3- diabetes.

      Reply
  6. Leonor Tavares

    Boa tarde, eu fiz um questionario de 64 perguntas a 25 pessoas e coloquei as perguntas na base de dados como variáveis independentes, ou seja tenho 64 variaveis.
    Como é que as posso agrupar para fazer as tabelas e graficos?

    Reply
    1. Teresa Post author

      Não especificou o que pretende agrupar.
      Por ex. a idade, se estiver como medida escalar, pode transformá-la para se agrupar em categorias. lEIA ESTE ARTIGO-http://www.dicas-spss.com/?cat=18
      Ou, caso tenha uma questionário com várias perguntas que queira agrupar para ter uma pontuação, LEIA ESTE ARTIGO- http://www.dicas-spss.com/?cat=23

      Reply
      1. Leonor Tavares

        Quero agrupar as perguntas (variaveis), porque ao fazer as tabelas de frequencia, aparecem me 64 tabelas diferentes e queria agrupar tudo numa só..

        Reply
        1. Teresa Post author

          No MENU escolhe ANALYZE – TABLES – CUSTOM TABLES. Deve arrastar para “Rows” as variáveis que pretende ver na tabela.
          Depois de ter as variáveis escolhidas tem de escolher as estatísticas que pretende (média, desvio-padrão, percentagem, etc).

          Reply
  7. Roberto

    Ola, boa tarde. Sou iniciante no SPSS e, talvez, possa ser burrice minha, mas nao entendi absolutamente nada da explicacao. Nao consegui compreender o passo-a-passo.

    Seguinte, quero recodificar a variavel idade. No banco de dados, estao dividias em 1- abaixo de 18; 2- entre 18 e 21; 3- entre 21 e 29, 4- entre 29 e 50 e 5- Acima de 50.

    Quero recodicifar com os seguintes intervalos:
    1-Até 24 anos
    2- 25 a 29 anos
    3- 30 a 34 anos
    4- 35 a 39 anos
    5 – 40 anos ou mais

    Pode explicar?

    Grato

    Reply
    1. Teresa Post author

      Não pode fazer o que pretende porque limitou as respostas das pessoas a essas categorias.
      Só pode criar essas categorias se tiver uma variável escala em que as pessoas tenham escrito a idade exacta.

      Reply
  8. Rita

    Boa tarde,
    Para criar uma nova variável para a idade por exemplo, com 4 grupos etários devo ir a Transformar, categorização visual-escolher a variável que pretendo (idade) e depois em relação aos pontos de corte se quiser por exemplo 4 devo colocar um a menos? 3 neste caso? E depois qual é o processo para continuar?
    Obrigada!

    Reply
    1. Teresa Post author

      Em Transform-Recode into Different Variables. Escolhe a variável Idade a partir da qual vai criar uma nova variável de classe, dá-lhe um nome classe_etaria (por ex.) e, em Range, coloca os valores para cada classe.

      Reply
  9. Pedro Miguel

    Boa noite Teresa! Parabéns pelo site e pela forma como explica as coisas de forma tão clara 🙂
    Tenho 3 dúvidas, tenho uma amostra de 450 pessoas, estou a analisar as diferenças entre género para a cerveja.
    No questionário tenho uma pergunta com opções de resposta (1 cerveja por dia, 2 cervejas por dia, 3 cervejas por dia; 4 cervejas por dia; mais de 4 cervejas por dia; não sabe/não responde). Assim considero esta variável de escala ordinal ou intervalar ou de razões discreta?

    O Teste Qui-Quadrado aplico a duas variáveis nominais e após o seu resultado tenho de fazer mais alguma (coeficiente V de Cramer)? Se sim, como aplicar?

    Mais uma pergunta, a representação do teste de Mann-Whitney é feita de que forma? M-W = 26853; p=0,000)? Ou terei de colocar algo à frente de M-W?

    Reply
    1. Teresa Post author

      A variável “nº de cervelas” é uma variável nominal se considerar as categorias “não sabe/não responde.
      Caso não considere essa categoria, trata-se duma variável ordinal.

      Para a qui-quadrado tem de ter atenção às notas acerca do nº de células vazias, que pode diminuir a fiabilidade dos resultados.

      Para a apresentação do Mann-Whitney, tem de consultar as normas de publicação que seguirá.

      Reply
  10. Mara

    Olá Teresa,
    Parabéns seu site é ótimo, você é muito didática.
    Tenho uma escala do tipo likert que mensura cinco dimensões da personalidade, gostaria de calcular o percentil no spss em cada uma dessas dimensões, como posso fazer isso?
    Obrigada!

    Reply
  11. Ana

    Gostaria de saber o seguinte, como posso recodificar uma nova variavel através de duas variaveis antigas.
    Por exemplo:

    Categoria 1 – Se velocidade <= 6 e inclinação =0
    Categoria 2 – Se velocidade <=10 e inclinação = 0
    Categoria 3 – Se velocidade <=10 e inclinação <=3

    Reply
  12. Ruben

    Olá Teresa.
    Estou com um problema urgentíssimo! É o seguinte, consigo recodificar as variáveis que estão em escala mas as outras (nominal) não consigo. Excepto aquelas que não têm a presença de um “a” por baixo do símbolo, ao qual não sei o que é isso e se influência ou não.
    Há solução para recodificar? Dava-me imenso jeito colocar intervalos porque a minha base dados é enorme e os valores são todos diferentes.

    Reply
    1. Teresa Post author

      Ruben, tenho dificuldade em responder-lhe porque não entendo o que quer dizer com um “a” por baixo dum símbolo (que também não percebo.
      Veja se as variáveis nominais não estão como variáveis String (na 2ª coluna no variable view).

      Reply
  13. Mariana

    Tenho uma variável sobre a profissão (questão aberta) e a pergunta é:O que se fazia se tivesse uma questão qualitativa e se pretendesse analisar quantitativamente?

    Reply
    1. Teresa Post author

      Tem de fazer a transformação automática analisar a lista de respostas, a sua frequência e então tentar agrupar as respostas em categorias de resposta mais abrangentes.
      Atenção que o SPSS é sensível a maiúsculas, acontecendo a repetição de profissões que apenas diferem na primeira letra (ex. Arquiteto, arquiteto, arquitecto)

      Reply
  14. Ana Sofia

    Boa tarde! Gostaria de saber em que autor baseou-se para fazer esse agrupamento de escalas etárias. Eu andei a pesquisar imensa coisa mas única fonte que consegui foi a sua.

    Reply
    1. Teresa Post author

      Com base na amostra analisada, os quartis encontrados foram os que estão descritos no artigo.
      Em cada amostra deve analisar quais os quartis a partir dos quais deve dividir a amostra.

      Reply
  15. Ana

    Olá Teresa, desde já muitos parabéns pelo site.
    Gostaria de saber se pode indicar-me um autor a quem possa “recorrer” para fundamentar às faixas etárias, isto é, justificar porque recorri aos quartis?
    Muito obrigada.

    Reply
    1. Teresa Post author

      Se tiver necessidade de saber qual a idade abaixo da qual tem 25% das pessoas da amostra, ou 50% da amostra ou 75% da amostra, usa os quartis.
      Não é necessário que nenhum autor o justifique. Isto é uma “ferramenta” como qualquer outro gráfico que é gerado pelo SPSS.

      Reply
  16. Mário Filipe

    Boa tarde.
    Estou a fazer um estudo com uma resposta aberta. Nesta resposta aberta, quem respondia teria de nomear 3 caraterísticas de 38. Agora, com todos os dados, e já com os valores colocados, não passo daqui. O que eu queria era que me contassem as caraterísticas de cada resposta individualmente e nao como um todo. Como posso fazer? Obrigado.

    Reply
  17. Jailson

    Boa tarde
    Gostaria que alguém me ajudasse a resolver uma situação no spss:
    Tenho um questionário com 12 itens, para cada 3 itens é uma dimensão. Como posso cruzar essa dimensão com uma variável? Sabendo que uma dimensão tem 3 perguntas. Ajudem por favor.

    Reply

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *