As estruturas mais básicas dos dados: as variáveis

No processo da pesquisa científica, o investigador sempre se depara com “alguma coisa” que precisa medir, controlar ou manipular. Este “algo” é chamado de variável. As variáveis e o conjunto de informações que elas podem oferecer são fundamentais na Estatística. Toda essa informação obtida e analisada depende de como essas variáveis são medidas e da qualidade dessa medição, e é por isso que reservamos um espacinho no nosso blog pra falar delas!

Variável é qualquer coisa que possa ser estudada. Mas, para ser considerada uma “variável” é necessário que ela varie! A temperatura do ar, por exemplo, varia. Ela varia de um período do dia para outro, de um dia para outro, de uma cidade para outra… “temperatura do ar” é, portanto, uma variável! O peso em kg das pessoas também é uma variável: cada indivíduo tem um peso diferente, porque a massa varia de pessoa para pessoa. Quando algo não varia, é chamado de “constante”, que na matemática é representada muitas vezes por uma letra. A velocidade da luz no vácuo, por exemplo, é uma constante e é denotada pela letra “c”.

Tá, mas o que se pode fazer com as variáveis? Bem, de forma geral, podemos fazer apenas duas coisas com as variáveis: ou a gente as caracteriza ou a gente estuda as relações entre elas

Sim! É que esses procedimentos vêm lá da lógica e da filosofia da ciência! Os cientistas, quando olham para um conjunto de informações desconhecidas, podem questionar o que é tudo aquilo. Saber “o que é” nada mais é do que caracterizar. Por exemplo: cientistas políticos podem querer conhecer qual é a preferência dos eleitores brasileiros nas eleições para presidente. Aqui, faz sentido que a variável seja “candidato à presidência”, que varia, uma vez que existem diferentes candidatos e cada eleitor brasileiro escolhe uma opção de sua preferência (candidato A, candidato B ou pode relatar estar indeciso). Um outro exemplo seria conhecer o perfil de pressão sanguínea de uma determinada população. Neste caso, a variável é o nível de “pressão sanguínea”, aferida em cada elemento da amostra. Saber o que é ou como é alguma coisa nada mais é do que identificar padrões, ou seja, caracterizar.

Mas, os cientistas podem querer saber não apenas o que são as coisas, mas como elas se relacionam entre si! E aqui, diferente da caracterização, os cientistas elaboram hipóteses das relações possíveis para serem testadas. Por exemplo, podemos querer investigar se existe diferença quanto ao hábito de ingerir bebidas alcoólicas entre homens e mulheres. Quem bebe mais daquela cervejinha? Temos agora duas variáveis: o “sexo biológico” e o “hábito de ingestão de bebida alcoólica”. Podemos testar a hipótese de que não existe diferença entre o sexo e o consumo de álcool. Ou, que os homens bebem mais, ou ainda que as mulheres bebem mais.

Sabendo o que se pode fazer com as variáveis, é necessário registrá-las ou medi-las de alguma forma. Quando estamos diante da variável “peso” em kg, fica fácil medir, certo? Podemos conseguir uma balança que esteja calibrada adequadamente e voilà! Quando as variáveis podem ser medidas diretamente, assim como a variável peso, são referidas como “variáveis operacionais”. Mas quando não conseguimos medir diretamente, dizemos que as variáveis são “teóricas”, pois estão mais no campo das ideias.

Por exemplo, se estamos interessados em estudar a variável “poluição” em uma cidade. Não conseguimos registrar essa variável diretamente. Ela é mais teórica. Para conseguirmos registrar a variável poluição, precisamos contar com uma série de outras variáveis operacionais. Assim, neste exemplo, se medirmos a concentração de gás carbônico no ar, a presença de metais pesados na água, a quantidade de lixo, a densidade de fumaça etc… todas essas variáveis operacionais em conjunto nos ajudarão a medir a variável poluição na cidade.

As variáveis operacionais são fundamentais pois são elas que são registradas. Elas podem ser quantitativas ou qualitativas. As variáveis quantitativas assumem medidas intervalares (por exemplo, a temperatura medida em graus Celsius), de contagens (por exemplo, o número de batimentos cardíacos) ou contínuas, quando admitem números fracionários (como o peso ou altura de pessoas). As variáveis qualitativas se apresentam em categorias de classificação discreta e mutuamente exclusivas. Podem ser nominais (por exemplo, o tipo sanguíneo A, B, AB ou O) ou ordinais, quando há uma certa “ordem” nas categorias (por exemplo, o nível socioeconômico – baixo, médio, elevado).

Um caso especial das variáveis qualitativas é aquele em que as variáveis apresentam apenas duas categorias, e por essa razão são conhecidas por variáveis binárias ou dicotômicas. Vale mencionar que as variáveis qualitativas podem assumir valores numéricos, como se fossem “códigos” para facilitar as análises posteriormente. No exemplo do sexo biológico, as categorias podem assumir valores 0 ou 1, para masculino e feminino respectivamente.

As variáveis (operacionais ou teóricas; quantitativas ou qualitativas) também podem ser classificadas de acordo com a função que exercem no estudo. Toda variável pode ser dependente ou independente. Além dessas, existem também as variáveis intervenientes ou também chamadas de “confusão”, que são aquelas que não são alvo do estudo, mas precisam ser consideradas porque modificam a relação entre as variáveis dependente e independente.

Para entender essa questão de ser dependente ou independente, veja este exemplo: a variável “saúde do coração” é teórica pois não conseguimos registrá-la diretamente. O que fazemos é a sua operacionalização: registramos uma série de variáveis operacionais relacionadas com as atividades do coração como batimentos cardíacos, ausculta, pressão sanguínea etc… para falarmos em saúde do coração.  A variável “ cortisol”, que é um hormônio liberado em situações de estresse, é uma variável operacional pois conseguimos medi-la diretamente (basta coletarmos uma amostra de sangue ou urina e submeter ao exame laboratorial). Além disso, é quantitativa. Já a variável “estresse” é teórica , pois não registramos diretamente (estresse é uma pressão que o organismo sente e não medimos isso diretamente; o que fazemos é a sua operacionalização: conseguimos registrar as respostas que o organismo dá frente a estas situações, como o aumento dos níveis de cortisol). Assim, numa situação onde o pesquisador esteja interessado em saber se situações de estresse podem causar prejuízo à saúde do coração , a variável “saúde do coração” assume o papel de variável dependente (ou de resposta) e “nível de cortisol”, a variável independente. Por outro lado, o investigador pode querer saber se a saúde do coração pode causar prejuízos à rotina do paciente. Assim, faz sentido que nesta situação, a variável “saúde do coração” seja a variável independente (e não mais a dependente como anteriormente). Ou seja, o que faz uma variável ser dependente ou independente depende da relação que o pesquisador a coloca em relação a outra variável. 

 

Resumidamente, quando levamos em conta o registro das variáveis, a classificação entre Teórica ou Operacional é muito importante. Já quando olhamos para as relações entre variáveis, os conceitos de variável independente ou dependente se tornam mais úteis.

Esses conceitos são básicos para todo e qualquer pesquisador, inclusive para dialogar com os profissionais da Estatística. E se você gosta ou se interessa por assuntos mais técnicos, dê uma olhadinha na seção Portfólio aqui no nosso blog!

Referências

Arango, H. Bioestatística teórica e computacional. 3.ed. Rio de Janeiro: Guanabara Koogan; 2009.

Volpato, GL. Scientific Methodology through the looking glass. Revista de Sistema de Informação da FSMA. 2020; 26:56-61.

Crédito das imagens:  pixabay.com

Autora: Lara Maria Herrera Drugowick

Deixe um comentário

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

WhatsApp