ech19 %>% count(estrato) %>% summarize(n())
# A tibble: 1 x 1 `n()` <int>1 82
# para 2019 la variable se llama upm_fic, la renombroech19 <- ech19 %>% rename(upm = upm_fic)ech19 %>% count(upm) %>% summarize(n())
# A tibble: 1 x 1 `n()` <int>1 9570
ech19 %>% count(numero) %>% summarize(n())
# A tibble: 1 x 1 `n()` <int>1 42507
ech19 %>% count(numero) %>% summarize(n())
# A tibble: 1 x 1 `n()` <int>1 42507
nrow(ech19)
[1] 107871
Se selecciona una muestra bajo un diseño estratificado en dos etapas de selección.
# los estratos de Montevideoech19 %>% filter(dpto == 1) %>% count(estrato)
# A tibble: 5 x 2 estrato n <chr> <int>1 01 60752 02 80803 03 101564 04 84605 05 5436
Las UPM son un conjunto de viviendas, por ejemplo, manzanas
Las UUM son viviendas
ech19 %>% select(numero, pesoano, pesotri, pesomen) %>% head()
# A tibble: 6 x 4 numero pesoano pesotri pesomen <chr> <dbl> <dbl> <dbl>1 2019000001 21 85 2462 2019000001 21 85 2463 2019000002 18 74 2154 2019000002 18 74 2155 2019000003 27 104 2356 2019000003 27 104 235
ech19 %>% summarise(sum(pesoano))
# A tibble: 1 x 1 `sum(pesoano)` <dbl>1 3517931
ech19 %>% filter(duplicated(numero) == FALSE) %>% summarise(sum(pesoano))
# A tibble: 1 x 1 `sum(pesoano)` <dbl>1 1247820
ech19 %>% summarise(sum(pesoano))
# A tibble: 1 x 1 `sum(pesoano)` <dbl>1 3517931
ech19 %>% filter(duplicated(numero) == FALSE) %>% summarise(sum(pesoano))
# A tibble: 1 x 1 `sum(pesoano)` <dbl>1 1247820
Observemos las variables que vamos a usar en el diseño
ech19 %>% select(numero, estrato, upm, pesoano, pesotri, pesomen) %>% head(6)
# A tibble: 6 x 6 numero estrato upm pesoano pesotri pesomen <chr> <chr> <dbl> <dbl> <dbl> <dbl>1 2019000001 41 8038 21 85 2462 2019000001 41 8038 21 85 2463 2019000002 58 8548 18 74 2154 2019000002 58 8548 18 74 2155 2019000003 02 1050 27 104 2356 2019000003 02 1050 27 104 235
Si para un hogar 'pesoano' es igual a 21 quiere decir que se representa a sí mismo y a 20 hogares más.
ech19 %>% select(pesoano, pesotri) %>% summarise_all(sum)
# A tibble: 1 x 2 pesoano pesotri <dbl> <dbl>1 3517931 14073156
ech19 %>% select(pesoano, pesotri, mes) %>% filter(mes %in% 1:3) %>% summarise(sum(pesotri))
# A tibble: 1 x 1 `sum(pesotri)` <dbl>1 3518556
Bases | Datos personales | Ubicación de la vivienda | Sección | Segmento | Zona |
---|---|---|---|---|---|
INE | Sí | Sí | Sí | Sí | Sí |
Pública | No | No | Sí | Sí | No |
Fuente: Ficha técnica ECH 2018
PET (Población en edad de trabajar)
Población total de 14 o más años de edad
PEA (Población económicamente activa)
Personas de 14 o más años de edad, que tiene al menos una ocupación, o que, sin tenerla, la buscan activamente durante el período de referencia elegido para la encuesta. Este grupo incluye la fuerza de trabajo civil y los/as efectivos/as de las fuerzas armadas.
PEI (Población económicamente inactiva)
Personas que no aportan su trabajo para producir bienes o servicios económicos y no buscan trabajo. Se clasifica en las siguientes categorías:
¡El trabajo doméstico no remunerado no se considera trabajo!
PO (Población ocupada o empleada)
Personas que trabajaron por lo menos 1 hora durante el período de referencia de la encuesta, o que no lo hicieron por estar de vacaciones, por enfermedad, accidente, conflicto de trabajo o interrupción de este a causa del mal tiempo, averías producidas en las maquinarias o falta de materias primas, pero tiene empleo al que volverá con seguridad. Se incluyen en esta categoría a las/los trabajadoras/es familiares no remuneradas/os.
PD (Población desocupada)
Personas que durante el período de referencia no tenían trabajo, buscaban un trabajo remunerado, y estaban disponible en ese momento para comenzar a trabajar. Esta categoría comprende a las personas que trabajaron antes pero perdieron su empleo (desocupados propiamente dichos), desempleados en seguro de paro y aquellas que buscan su primer trabajo.
# Analizamos 'pobcoac'library(labelled) # paquete para ver las etiquetasech19 %>% select(pobpcoac) %>% val_labels()
1 - 'Menores de 14 años' 2 - 'Ocupados'3 - 'Desocupados buscan trab. por 1a. vez' 4 - 'Desocupados propiamente dichos' 5 - 'Desocupados en seguro de paro' 6 - 'Inactivo: realiza los quehaceres del hogar' 7 - 'Inactivo: estudiante' 8 - 'Inactivo: rentista' 9 - 'Inactivo: pensionista' 10 - 'Inactivo: jubilado'11 - 'Inactivo: otro'
# PEA: 2- Ocupados, 3- Desocupados buscan trab. por 1a. vez, # 4-Desocupados propiamente dichos, 5-Desocupados en seguro de paro # PET: ! 1-Menores de 14 años# PO: 2 - Ocupados# PD: 3- Desocupados buscan trab. por 1a. vez, 4-Desocupados propiamente dichos, # 5-Desocupados en seguro de paroech19 <- ech19 %>% mutate(pea = if_else(pobpcoac %in% 2:5, 1, 0), pet = if_else(pobpcoac != 1, 1, 0), po = if_else(pobpcoac == 2, 1, 0), pd = if_else(pobpcoac %in% 3:5, 1, 0))
ech19 %>% select(pea, pet, po, pd) %>% summarise_each(sum)
# A tibble: 1 x 4 pea pet po pd <dbl> <dbl> <dbl> <dbl>1 53487 89807 49036 4451
# reviso la ayuda ?employment
Esta función permite calcula las siguientes variables: PEA, PET, PO, PD
ech19 <- employment(data = ech19, pobpcoac = "pobpcoac")
Comparamos los resultados:
ech19 %>% select(pea, pet, po, pd) %>% summarise_each(sum)
# A tibble: 1 x 4 pea pet po pd <dbl> <dbl> <dbl> <dbl>1 53487 89807 49036 4451
Usamos la función de ech llamada get_estimation_ratio() cuyos argumentos y valores por defecto son los siguientes:
get_estimation_ratio( data = ech::toy_ech_2018, # data.frame variable.x = NULL, # numerador variable.y = NULL, # denominador by.x = NULL, # otra variable by.y = NULL, # otra variable domain = NULL, # subpoblacion, dominio level = NULL, # hogares o personas ids = NULL, # upm numero = "numero", # id hogar estrato = NULL, # estratos pesoano = "pesoano", # ponderador name = "estimacion" # etiqueta resultado)
library(ech)# Estimación de la tasa de actividadtabla <- get_estimation_ratio(data = ech19, variable.x = "pea", variable.y = "pet", ids = "upm", level = "i", estrato = "estrato", pesoano = "pesoano")
Estimar la tasa de empleo para el total país
Estimar la tasa de desempleo para el total país
Comparar con los resultados oficiales del INE
¿Qué pasa con las estimaciones por intervalo cuando no definimos UPM ni estrato?
Calcular la variable subempleo. Ayuda: ?underemployment
Calcular la variable empleo con restricciones. Ayuda: ?employment_restrictions
library(ech)# Estimación de la tasa de actividadtabla <- get_estimation_ratio(data = ech19, variable.x = "pea", variable.y = "pet", by.x = "dpto", ids = "upm", level = "i", estrato = "estrato", pesoano = "pesoano")
Estimar la tasa de desempleo de agosto para el total país
Estimar tasa de actividad de junio por sexo
Estimar la tasa de desempleo de agosto para Montevideo e Interior
Graficar las estimaciones e intervalos de confianza
Si la estimación tasa de actividad, varía de un mes a otro puedo afirmar que subió o bajó?
Si el tamaño de muestra en el dominio no es suficientemente grande, se pierde precisión en la estimación.
Hay una rama del muestreo que refiere a la estimación en área pequeñas.
library(ech)# Estimación de la tasa de actividadtabla <- get_estimation_ratio(data = ech19, variable.x = "pea", variable.y = "pet", ids = "upm", level = "i", estrato = "estrato", pesoano = "pesoano", domain = "e27 >= 18 & e27 <=35")
Estimar la tasa de desempleo para la población afrodescendiente
Estimar la tasa de actividad para el departamento de Paysandú
Estimar la tasa de empleo para la zona urbana
¿Qué reparos tengo que tener a la hora de usar estas estimaciones?
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |