Este projeto realiza uma análise de trabalhadores em plataformas digitais utilizando dados da PNAD COVID-19, fornecidos pelo IBGE. A análise é implementada em R e utiliza pacotes específicos para manipulação e visualização de dados.
- Analisar o impacto da pandemia de COVID-19 no trabalho em plataformas digitais.
- Explorar dados demográficos como idade, sexo, escolaridade e características do trabalho.
Os dados são importados diretamente da PNAD COVID-19 usando o pacote PNADcIBGE
. Os dados carregados incluem informações como:
- UF: Unidade da Federação.
- A002: Idade.
- A003: Sexo.
- A004: Cor ou raça.
- A005: Escolaridade.
- C007: Realização de trabalho remunerado.
- C007B: Trabalho em aplicativos de transporte ou entrega.
- C007C: Trabalho em aplicativos de venda ou outros.
- C008: Horas trabalhadas na semana de referência.
- C009: Rendimento efetivo de todos os trabalhos.
Cada coluna dos dados é descrita e padronizada com base no dicionário da PNAD COVID-19. Isso permite facilitar a interpretação dos resultados e a criação de filtros.
Os dados são filtrados e manipulados para atender aos objetivos da análise. Por exemplo:
- Filtragem de dados referentes aos meses de 2020.
- Foco em indivíduos que realizam trabalhos em plataformas digitais, como aplicativos de transporte ou entrega.
- Criação de variáveis derivadas para cálculo de estatísticas como rendimento médio e horas trabalhadas.
A análise utiliza os pacotes survey
e srvyr
para realizar cálculos de estimativas com pesos amostrais, garantindo que os resultados sejam representativos da população.
Os gráficos são criados usando o pacote ggplot2
e suas extensões (ggrepel
, gridExtra
) para melhorar a apresentação. As visualizações incluem:
- Distribuição de idade e sexo dos trabalhadores.
- Comparação de rendimentos por categorias de trabalho.
- Evolução do número de trabalhadores ao longo do tempo.
- R (versão 4.0 ou superior)
- Pacotes R necessários:
tidyverse
PNADcIBGE
COVIDIBGE
knitr
gridExtra
ggrepel
survey
zoo
scales
srvyr
-
Clone o repositório:
git clone https://github.com/seu-usuario/PNADCovid_TrabalhadoresAPP.git cd PNADCovid_TrabalhadoresAPP
-
Instale os pacotes R necessários:
install.packages(c("tidyverse", "PNADcIBGE", "COVIDIBGE", "knitr", "gridExtra", "ggrepel", "survey", "zoo", "scales", "srvyr"))
- Abra o arquivo PNADCovid_TrabalhadoresAPP.Rmd no RStudio ou outro editor de R Markdown.
- Execute as células para processar e analisar os dados.
- Visualize os resultados no relatório gerado em HTML.
• Importação de bibliotecas e dados. • Manipulação de dados usando tidyverse e survey. • Visualização de dados com gráficos do ggplot2.
Contribuições são bem-vindas! Siga os passos abaixo para colaborar:
- Faça um fork do repositório.
- Crie uma nova branch:
git checkout -b sua-feature
- Faça suas alterações e envie um pull request.
Embora o foco desta análise tenha sido uma extração de trabalhadores por meio de plataformas digitais, a estrutura pode ser aproveitada para diversos outros tipos de análises alterando as variáveis analisadas e aplicando filtros diferentes consultando as variáveis no Dicionário.
Este projeto está licenciado sob a MIT License.
Se precisar de mais detalhes ou quiser alterações específicas, é só avisar!