Capítulo 4 Banco de dados

O banco de dados (data.table) é a organização e armazenagem de informações sobre um deteminado escopo. De forma mais simples, é o agrupamento de dados que tratam do mesmo assunto.

Além disso, os bancos de dados (data.table) exibe as informações em forma de tabela, isto é, com linhas e colunas. Cada linha representa um registro/caso/observação e cada coluna representa um atributo. No nosso caso, chamamos esses atributos de variáveis.

4.1 Registros e variáveis

Os registros são objetos descritos por um conjunto de dados, podendo ser pessoas, animais, municípios, estados ou objetos.

Uma variável é qualquer característica do registro. Uma variável pode assumir valores diferentes para registros diferentes.

4.2 O que é um banco de dados

Iris Data: 50 flores de 03 espécies.

Cada linha é um registro e cada coluna é um atributo (que chamamos de variável).

4.2.0.1 Exemplo de banco de dados: Províncias da Suiça (Swiss Data)

Cada linha é uma província e cada coluna é uma informação.


4.2.0.2 Exemplo de banco de dados: Midwest Data

Informações Demográficas dos municípios do Meio-Oeste. Cada linha é equivalente a um município e cada coluna é uma informação.

4.2.0.3 Exemplo de banco de dados: Mtcars Data

Banco de dados de Performance de carros (10 informações). Cada linha é um carro diferente e cada coluna é uma informação.


4.2.0.4 Geralmente acompanhado de um DICIONÁRIO DE DADOS

Por exemplo:
* mpg: Miles/(US) gallon
* cyl: Number of cylinders
* disp: Displacement (cu.in.)
* hp: Gross horsepower
* drat:Rear axle ratio
* wt: Weight (1000 lbs)
* qsec: 1/4 mile time
* vs: V/S
* am: Transmission (0 = automatic, 1 = manual)
* gear: Number of forward gears
* carb: Number of carburetors

Por exemplo, esse banco de dados que estamos trabalhando tem 32 carros e 11 variáveis. No R isso pode ser verificado pelo comando dim(mtcars), e names(mtcars).

## [1] 32 11
##  [1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear"
## [11] "carb"