Manual de Análise de Dados
23/04/2020 updated:21 de julho de 2020
Capítulo 1 Introdução
Este texto pretende ser um manual destinado ao auxílio às aulas de estatística para os(as) alunos(as) da UNIRIO com o objetivo de fornece os códigos para a linguagem R.
Esse guia foi montado em RMarkdown, usando o pacote bookdown (Xie 2020). Esse material é 100% reprodutível.
AVISO
A ênfase deste texto será na prática com o uso da linguagem R. Você deve consultar os livros Estatística Básica (Bussab and Morettin 2015) e Métodos Estatísticos para as Ciências Sociais (Agresti and Finlay 2012) antes de usar as análises apresentadas aqui. Essas publicações são encontradas na biblioteca da UNIRIO.
É permitida a reprodução não comercial deste conteúdo, com atribuição.
É proibida a reprodução com fins lucrativos sem permissão.
Se você usar o código ou as informações deste guia em um trabalho publicado, solicito que cite-o como uma fonte nas referências bibliográficas.
DUTT-ROSS,S. Manual de Análise de Dados. Rio de Janeiro. 2020. mimeo. Disponível em: http://livro.metodosquantitativos.com/docs/bookdown.pdf
1.1 A estatística é importante
Esse texto foi planejado para introduzir os conceitos estatísticos com maior relevância para a vida cotidiana. Precisamos conjugar o rigor analítico com uma mentalidade prática.
É fácil mentir com a estatística, mas é difícil dizer a verdade sem ela.
A estatística é uma maneira importante de se olhar o mundo. A vida é cheia de eventos ao acaso. Todos os dias a maioria de nós toma decisões que se baseia em uma avaliação de uma incerteza.
Além disso, a estatística é a base do método cientifico. Muitas vezes queremos ver como as explicações e as teorias se ajustam aos dados. Para tomar uma decisão (ou examinar argumento científico), precisamos de dispor de dados e métodos.
Assim, na última metade do século temos visto um aumento drástico do uso dos métodos estatísticos em todas as Ciências (sociais, humanas, medicina, biologia, e quase todas as outreas áreas). Existem várias razões para isso. 1. A pesquisa tem cada vez mais empregado uma abordagem quantitativa. 2. A ciência geralmente estuda as questões de interesse e análise evidências fornecidas pelos resultados empíricos. 3. o crescimento da internet resultou em um aumento da informação quantitativa disponível (Agresti and Finlay (2012)).
1.2 Por que analisar dados?
A análise estatística é sobre processo de descoberta. O desenvolvimento científico precisa gera um método para examinar objetos de interesse de uma maneira sistemática. Esse processo geralmente pecisa de evidência para apoiar um argumento. Um dos melhores métodos para estabelecer a evidência é por meio do exame dos números associados com o objeto de estudo. Esse exame é realizado através de análise estatística. A análise estatística é o ponto central da descoberta, e o domínio dela nos aproxima do método científico. A estatística apresenta muitas técnicas consagradas na academia para extrair informações significativas de dados brutos. por exemplo:
- Como fazer inferências sobre a natureza de uma população com base na observação de uma amostra estraída dela?
- Como prever taxas de ocorrências de eventos estocásticos (aleatórios)?
- E como entender e interpretar cálculos estatísticos efetuado por outras pessoas?
1.3 A grande pergunta
Por que as graduações nas áreas de Ciências Sociais exigem um curso de estatística?
Por que estudantes que desejam ingressar em uma profissão como Serviço Social ou Enfermagem tem que fazer a disciplina de estatística?
Estatística pode ser essencial na sua carreira. Os estudantes precisam estudar estatística por vários motivos:
1. Estudantes (e profissionais) devem estar aptos a ler e entender vários estudos estatísticos no seu campo de atuação. Tem que entender o vocabulário, símbolos, conceitos e procedimentos estatísticos utilizados nesses estudos.
2. Estudantes (e profissionais) podem ser chamados para conduzir uma pesquisa no seu campo. Dado que os procedimentos estatísticos são à base de todas as pesquisas quantitativas, para alcançar isso, eles devem estar aptos para desenhar experimento, coletar, organizar, analisar e resumir dados.
3. Eles também tem que estar apto a comunicar os resultados dos seus estudos em suas próprias palavras.
4. Estudantes (e profissionais) também podem usar o conhecimento adquirido dentro da estatística para ser melhores cidadãos e consumidores. Por exemplo, eles podem fazer entre decisões inteligentes sobre que produto comprar baseado no estudo do Consumidor, olhar os gastos do governo, etc…
Entender Estatística é essencial aos cidadãos das sociedades atuais: para ser crítico em relação à informação disponível na sociedade, para entender e comunicar com base nessa informação, mas, também, para tomar decisões, uma vez que uma grande parte da organização dessas mesmas sociedades tem por base esses conhecimentos. (Shaughnessy, 1992, 1996).
Em outras palavras, quando você se formar, vai trabalhar em uma área que precisam usar métodos estatísticos ou pelo menos ler os relatórios que contém estatísticas. Em alguma fase da sua carreira, você vai ter que lidar com os métodos estatísticos.
Muitas pessoas encaram a estatística como assunto maçante/difícil. De fato algumas partes da estatística são difíceis, mas há outras que se apresentam de forma mais fácil e concisa. A reputação de dificuldade de estatística provém em grande parte da época em que não tinhamos acesso aos computadores.
Naquele tempo, os estatísticos eram forçados a efetuar os cálculos laboriosos manualmente. Hoje em computador faz essa parte do trabalho deixando os pesquisadores mais livres para estudar e entender o significado do que se passa. Nesse sentido, para fazer estatística, você deve aprender a programar em R ou em Python. Estas linguagens vão ajudá-lo a utilizar métodos para entender dados complexos para apoiar as suas conclusões.
Em alguma fase do seu trabalho o pesquisador se vê as voltas com problemas de analisar e entender uma massa de dados relevantes ao seu objeto de estudo. Se forem informações sobre uma amostra, ele necessitará resumir os dados para estes sejam informativos ou para compará-los com outros resultados, ou ainda para julgar sua adequação alguma teoria (Bussab & Morettin, 1987)
Referências
Agresti, Alan, and Barbara Finlay. 2012. Métodos Estatísticos Para as Ciências Sociais. Editora Penso. https://www.grupoa.com.br/.
Bussab, Wilton, and Pedro Morettin. 2015. Estatística Básica. Editora Saraiva. https://www.editorasaraiva.com.br.
Xie, Yihui. 2020. Bookdown: Authoring Books and Technical Documents with R Markdown. https://CRAN.R-project.org/package=bookdown.