Capítulo 2 Como os pesquisadores utilizam a Estatística?

Primeiro a gente usa a estatística para resumir dados. Mas não é só isso. Também usamos a estatística para mensurar a qualidade de uma inferência. Qualquer um pode extrapolar resultados. Todavia é bem difícil dizer o quanto essa inferência é boa. Por exemplo, se a gente tirasse uma amostra de 100 criminosos de Bangu 1 que foram para o programa de reabilitação e fizesse uma estimativa que 30% de todos os criminosos que participaram desse programa vão retornar a prisão, a gente gostaria de saber quanto essa estimativa se aproxima do verdadeiro percentual. O erro é de 5% e 10% ou 30%? De forma semelhante quando a gente tá pesquisando as características de uma população ou universo baseado em uma amostra, a gente devia saber qual a chance de conseguir uma conclusão incorreta.

AVISO
A estatística é como um bisturi: útil quando usada de forma correta e potencialmente desastrosa em mãos erradas.

O acesso fácil aos métodos estatísticos - usando softwares aonde você aperta um botão traz muitos riscos. Temos que ter muito cuidado com o excel, o SPSS e outras ferramentas automáticas.

Do político manipulador ao analista descuidado, do economista amador ao anunciante agressivo, temos infinitos exemplos de que pode dar errado quando o método estatístico é mal utilizado. Escolha seletiva supersimplificação, violação de pressupostos.

É comum a aplicação de métodos inapropriados e abordagens equivocadas. Um computador executar análises solicitadas sem ter condições se importar se os pressupostos requeridos para o uso adequado do método foram satisfeitos. Análises incorretas ocorrem quando os pesquisadores não tomam tempo suficiente para entender o método estatístico, as premissas para o seu uso ou se a abordagem é adequada.

Você irá precisar de um bom conhecimento de estatística para entender qual o método estatístico selecionar e como tirar conclusões válidas do resultado (Agresti and Finlay 2012).



2.1 Antes de iniciar - Material do curso

Muitos livros de R foram disponibilizados pelos autores de forma gratuita na internet. Fiz repositório com todos os livros e apostilas de R em português que encontrei. Ele está disponível aqui https://github.com/DATAUNIRIO/R_Livros_e_Apostilas

A editora Springer disponibilizou mais de 500 livros gratuitamente. Muitos deles sobre a liguagem R. A lista completa pode ser acessada aqui

Os bancos de dados que vamos utilizar no curso estão disponíveis nesse repositório: https://github.com/DATAUNIRIO/Base_de_dados. Para fazer o download dos bancos de dados, copie o código abaixo e cole no script ou no console do R.

2.1.0.1 O diretório de trabalho

No R, o diretório de trabalho é um conceito importante para entender.

É o local de onde o R estará procurando e salvando os arquivos. Quando você

escreve código para o seu projeto, ele deve se referir aos arquivos em relação

à raiz do seu diretório de trabalho e precisa colocar apenas de arquivos nesse

local.

O RStudio facilita o acesso ao diretório de trabalho. Se você precisar verificar aonde está o diretório de trabalho, pode usar a função getwd(). Se, por algum motivo, o diretório de trabalho não for o que deveria ser, você poderá alterá-lo na interface do RStudio, navegando no menu chamado Session depois acesse o Set working directory e depois em choose directory. Como alternativa, você pode usar o comando setwd(“/caminho/para/seu/diretorio”) para redefinir seu diretório de trabalho por meio do uso do código.

2.1.0.2 Procurando ajuda no R

Use a interface de ajuda integrada do RStudio para procurar mais informações sobre as funções do R. Por exemplo, quero uma ajuda para a função média ( mean )) no R. O Rstudio pode me ajudar como na figura abaixo.

Help do R Studio

Figura 2.1: Help do R Studio

Como funciona a interface de ajuda do RStudio

Uma das maneiras mais rápidas de obter ajuda é usar a interface de ajuda do RStudio. Esse painel, por padrão, pode ser encontrado no painel inferior direito do RStudio. Como visto na captura de tela, digitando a palavra “Mean” (Média), o RStudio tenta também fornecer várias sugestões nas quais você pode estar interessado. A descrição é mostrada na janela direita inferior (Help).

“Eu sei o nome da função que quero usar, mas não sei como usá-la.”

Se você precisar de ajuda com uma função específica, digamos barplot(), digite:

?barplot

Se você estiver procurando por uma função para executar uma tarefa específica, poderá usar a função nomeada help.search(), chamada pelo ponto de interrogação duplo ??. O R vai procurar nos pacotes instalados páginas de ajuda que correspondem à sua solicitação de pesquisa. Por exemplo:

??kruskal

“Quero usar uma função que faça X, deve haver uma função para ela, mas não sei qual é o nome em inglês…”

Se você não encontrar o que está procurando na ajuda do R, use o google. Escreva algo do tipo “barplot in R” ou kruskal in R que provavelmente encontrará o que está procurando.

Uma pesquisa no Google o envia para a documentação de um pacote do R ou para um fórum em que uma outra pessoa já fez sua pergunta.

"Estou travado … recebo uma mensagem de erro que não entendo

Comece com uma pesquisa da mensagem de erro no Google. No entanto, você pode ter uma mensagem de erro muito geral que pode não ser muito útil para diagnosticar um problema (por exemplo, “subscrito fora dos limites”) . Se a mensagem for muito genérica, sugiro incluir o nome da função ou do pacote que está usando no R.

Se o erro persistir, uma outra estratégia muito utilizada é mudar a linguagem do R do português para o inglês, pesquisar a mensagem de erro em inglês e voltar para o português com as funções Sys.setenv(LANG = “en”) e Sys.setenv(LANG = “pt”)

Uma ótima referência (em inglês) de como começar no R pode ser encontrada aqui

Referências

Agresti, Alan, and Barbara Finlay. 2012. Métodos Estatísticos Para as Ciências Sociais. Editora Penso. https://www.grupoa.com.br/.