Capítulo 4 Banco de dados
O banco de dados (data.table) é a organização e armazenagem de informações sobre um deteminado escopo. De forma mais simples, é o agrupamento de dados que tratam do mesmo assunto.
Além disso, os bancos de dados (data.table) exibe as informações em forma de tabela, isto é, com linhas e colunas. Cada linha representa um registro/caso/observação e cada coluna representa um atributo. No nosso caso, chamamos esses atributos de variáveis.
4.1 Registros e variáveis
Os registros são objetos descritos por um conjunto de dados, podendo ser pessoas, animais, municípios, estados ou objetos.
Uma variável é qualquer característica do registro. Uma variável pode assumir valores diferentes para registros diferentes.
4.2 O que é um banco de dados
Iris Data: 50 flores de 03 espécies.
Cada linha é um registro e cada coluna é um atributo (que chamamos de variável).
4.2.0.1 Exemplo de banco de dados: Províncias da Suiça (Swiss Data)
Cada linha é uma província e cada coluna é uma informação.
4.2.0.2 Exemplo de banco de dados: Midwest Data
Informações Demográficas dos municípios do Meio-Oeste. Cada linha é equivalente a um município e cada coluna é uma informação.
4.2.0.3 Exemplo de banco de dados: Mtcars Data
Banco de dados de Performance de carros (10 informações). Cada linha é um carro diferente e cada coluna é uma informação.
4.2.0.4 Geralmente acompanhado de um DICIONÁRIO DE DADOS
Por exemplo:
* mpg: Miles/(US) gallon
* cyl: Number of cylinders
* disp: Displacement (cu.in.)
* hp: Gross horsepower
* drat:Rear axle ratio
* wt: Weight (1000 lbs)
* qsec: 1/4 mile time
* vs: V/S
* am: Transmission (0 = automatic, 1 = manual)
* gear: Number of forward gears
* carb: Number of carburetors
Por exemplo, esse banco de dados que estamos trabalhando tem 32 carros e 11 variáveis. No R isso pode ser verificado pelo comando dim(mtcars), e names(mtcars).
## [1] 32 11
## [1] "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear"
## [11] "carb"