forked from tomasbarcellos/2020-09-esferas
-
Notifications
You must be signed in to change notification settings - Fork 0
/
02_rend_desp.R
executable file
·77 lines (63 loc) · 2.62 KB
/
02_rend_desp.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
library(pof)
library(tidyverse)
# O script está montado para ter 4 partes: cada uma uma função
# As funções usadas estão no script 00_funcoes.R
# 1) Ler os dados de acordo com as intruções do IBGE
# 2) Classificar os rendimentos nas esferas alta/baixa
# A ideia é que só precisemos mexer nessa etapa
# 3) Identificar as UC nas esferas
# baseado em corte vindo da análise dos dados (0.63)
# 4) Vincular os gastos das UCs com as esferas
# Etapa 0 ------------------ preparar repoditório -------------------
# downaload_pof(2018)
# unzip_pof(2018)
#
## Tive que usar essa linha de baixo pq o IBGE mudou
## a forma de extrair os arquivos
# dir(glue::glue("dados/2018/Arquivos de dados"),
# full.names = TRUE) %>%
# file.rename(str_remove(., "Arquivos de dados/"))
# Etapa 1 -----------------------------------------------------------
rendas2009 <- ler_rendimentos2009()
# Etapa 2 -----------------------------------------------------------
rendas_classificadas2009 <- classificar_rendimentos2009(rendas2009)
rendas_ucs2009 <- rendas_classificadas2009 %>%
dplyr::group_by(cod_uc, forma) %>%
dplyr::summarise(renda = sum(recmes)) %>%
tidyr::pivot_wider(names_from = forma, values_from = renda,
values_fill = list(renda = 0)) %>%
dplyr::mutate(total = cv + mv,
p_cv = (cv + 0.01) / (total + 0.01)) %>%
dplyr::ungroup()
# # K-Means usadas para estabelecer corte alta/baixa
# k_rendas <- kmeans(rendas_ucs2009$p_cv, c(0.2, 0.5))
# k_rendas$centers
#
# ggplot(rendas_ucs2009, aes(p_cv, total, col = factor(k_rendas$cluster))) +
# geom_point(shape = ".", alpha = 0.5) +
# geom_vline(xintercept = 0.6, lty = 2) +
# scale_y_continuous(limits = c(0, 20e3)) +
# theme_classic() +
# theme(legend.position = "none")
# A análise acima propor o corte de 63% para esfera alta/baixa
corte <- 0.95
# Etapa 3 -----------------------------------------------------------
rendas_esferas2009 <- rendas_ucs2009 %>%
mutate(esfera = ifelse(p_cv > corte, "baixa", "alta"))
esferas_ucs2009 <- rendas_esferas2009 %>%
select(cod_uc, esfera)
# Etapa 4 -----------------------------------------------------------
# Esse ano está sem os níveis, apenas código
despesas_esferas <- ler_despesas2009() %>%
left_join(esferas_ucs2009, by = "cod_uc") %>%
# select(cod_uc, codigo, nivel_0:esfera)
rename(valor = despmes)
# Estimativa geral esferas
despesas_esferas %>%
group_by(esfera) %>%
summarise(soma = sum(valor) * 12 / 1e9) %>% # Em bilhões
filter(!is.na(esfera)) %>%
mutate(partic = soma / sum(soma), tx_mv = soma / last(soma))
despesas_esferas %>%
mutate(ano = 2009) %>%
write_csv("gastos_esferas_2009.csv")