Estimación de ingresos

La medición de los ingresos tiene un rezago de un mes ya que si el hogar fue encuestado, por ejemplo en marzo, en este mes se preguntó por los ingresos del mes pasado, es decir de febrero. A su vez, estos ingresos están expresados a precios corrientes, por lo cual, para hacerlos comparables entre los diferentes meses de la encuesta o de otros años es necesario llevarlos a una medida común. Para convertir los ingresos de precios corrientes a precios constantes debemos elegir un índice como puede ser el IPC (Índice de Precios al Consumo) o el IPAB (Índice de Precios de Alimentos y Bebidas) para construir un deflactor. Por ejemplo, para expresar los ingresos del hogar con la información de la ECH 2019, elegimos como mes base junio y como año base 2019 y como deflactor el IPC. Esto implica que debemos considerar los valores del IPC mensual desde diciembre 2018 a noviembre 2019.

Obtener los datos del IPC es bastante sencillo usando el paquete ech, para ello existe la fucnión de hecho la función get_ipc() que descarga el archivo de la web del INE y lo guarda en un formato tidy en el data frame ipc_base2010. La estructura del objeto es la siguiente:

tail(ech::ipc_base2010)
#> # A tibble: 6 × 8
#>   fecha      indice        mensual acum_ano acum_12_meses trimestre cuatrimestre
#>   <date>     <chr>         <chr>   <chr>    <chr>         <chr>     <chr>       
#> 1 2022-03-01 250.41999999… 1.1100… 4.41999… 9.3800000000… 4.424335… 4.319933347…
#> 2 2022-04-01 251.65000000… 0.4899… 4.94000… 9.3699999999… 3.097218… 4.937241983…
#> 3 2022-05-01 252.81999999… 0.4600… 5.42999… 9.3699999999… 2.075258… 3.576549633…
#> 4 2022-06-01 254.30000000… 0.5899… 6.04     9.2899999999… 1.549397… 2.672803617…
#> 5 2022-07-01 256.25999999… 0.7700… 6.86000… 9.5600000000… 1.831909… 2.332082102…
#> 6 2022-08-01 258.38        0.8299… 7.74000… 9.5299999999… 2.199193… 2.674349294…
#> # ℹ 1 more variable: semestre <chr>

La función que permite obtener un deflactor es la función deflate(), que a su vez, utiliza internamente la función get_ipc(). No utilizamos directamente ninguna de estas funciones, sino que la simplicidad de ech radica en que para calcular ingresos a precios constantes usamos la función income_constant_prices() la cual utiliza internamente las otras dos funciones ya mencionadas.

Antes de deflactar los ingresos del hogar, tenemos que tener cargado el objeto con los microdatos de la ECH.

library(ech)
df <- get_microdata(year = 2019, folder = tempdir(), toR = FALSE)
#df <- organize_names(df)

Las variables a tener en cuenta en esta parte son:

Para convertir los ingresos del hogar, que están medidos en la variable ht11, de precios corrientes a precios constantes, usamos la función income_constant_prices() y definimos sus parámetros: mes base (base_month), año base (base_year), el tipo de índice (index) que puede IPC o IPAB y el nivel del índice (level) que puede ser “G” (general) o “R” (regional que distingue entre Montevideo e Interior). Definimos como base enero de 2005.

df <- income_constant_prices(data = df, base_month = 1, base_year = 2005, index = "IPC", level = "G")

Esto crea una serie de variables:

Para obtener la estimación de alguna de estas variables usamos la función get_estimation_mean(), para estimar la media, get_estimation_total(), para estimar el total o get_estimation_median() para estimar la mediana. Estas funciones tienen algunos argumentos que refieren al diseño de muestreo como:

Para los microdatos de 2018 y 2019 la ECH pública cuenta con la información de las UPM y estratos. En la web del INE se encuentra en un archivo aparte pero la función get_microdata() ya la agrega a los microdatos que genera de manera que no es necesario hacer un merge entre ambas bases. Para años anteriores no están disponible estás variables en la base pública.

Es necesario definir ids y estrato que vienen con valor por defecto NULL, las demás se pueden dejar con sus valores por defecto, salvo que se usen registros de un mes o semestre en ese caso se debe cambiar el ponderador de los casos según corresponda.

get_estimation_mean(df, variable = "y_pc_d", level = "i", ids = "upm", estrato = "estrato")

Para estimar el ingreso medio de los hogares a precios constantes de enero 2005 según departamento, se debe definir en el argumento by.x la variable “nomdpto”

# Estimación de ingresos promedio per cápita a pesos constantes de ene/05 según dpto
get_estimation_mean(df, variable = "y_pc_d", by.x = "nomdpto", level = "i", ids = "upm", estrato = "estrato")

Podemos comparar estos resultados con los publicados por el Observatorio Territorio Uruguay de OPP que se encuentran aquí.