El siguiente documento fue elaborado por:

Rebeca Riella - División Normalización, Investigación y Proyectos

Abril 2023

1. Introducción



El diseño muestral de la Encuesta Anual de Actividad Económica (EAAE) es aleatorio, por conglomerados y estratificado. Las empresas son estratificadas en base a su tamaño (personal ocupado y/o ventas) y a su clase de actividad económica principal. Las empresas grandes son incluidas a priori de forma forzosa en la muestra, mientras que las empresas pequeñas y medianas son seleccionadas al azar.

La EAAE es una encuesta de tipo panel rotativo más nacimientos. El panel rotativo implica que las empresas aleatorias (pequeñas y medianas) permanezcan un mínimo de tres años en la muestra, para luego ser sustituidas por otras empresas del mismo estrato de diseño. Este diseño permite obtener estimaciones confiables, de un período a otro, tanto de los niveles de los distintos indicadores como de sus variaciones.

El marco muestral de la EAAE para el año 2021 está compuesto por aproximadamente 11.400 empresas. El tamaño de la muestra teórica se definió en 4.467 empresas y la muestra efectiva obtenida fue de 3.344 empresas, lo que se traduce en una tasa de efectividad del 74,9%.

Para los cálculos publicados se agregaron 186 empresas provenientes del Censo económico de Zonas Francas 2021 que cumplen criterios de elegibilidad.


2. Condición de elegibilidad



Son elegibles para participar en la EAAE las empresas que cumplan las siguientes características:

  1. La empresa tiene personal ocupado dependiente promedio en el año mayor o igual a 10 y/o presenta un promedio mensual de ventas mayor a 189.786.191 pesos.

  2. La actividad económica principal de la empresa siguiendo la clasificación CIIU REV 4 se encuentra comprendida en las secciones de actividad (SEC):

  • B. Explotación de minas y canteras
  • C. Industrias Manufactureras
  • D. Suministro de electricidad, gas, vapor y aire acondicionado
  • E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento
  • G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas
  • H. Transporte y almacenamiento
  • I. Alojamiento y servicio de comida
  • J. Información y comunicación
  • K. Actividades financieras y de seguros.
  • L. Actividades inmobiliarias
  • M. Actividades profesionales, científicas y técnicas
  • N. Actividades administrativas y servicios de apoyo
  • P. Enseñanza
  • Q. Servicios sociales y relacionados con la Salud Humana
  • R. Artes, entretenimiento y recreación
  • S. Otras actividades de servicios


3. Marco muestral



El marco muestral es de donde se selecciona la muestra. Se construye a partir del Directorio de Empresas y Establecimientos (DEE) que lleva adelante de forma anual y continua el INE. El DEE se conforma a partir de fuentes administrativas provenientes de la Dirección General de Impositiva (DGI), del Banco de Previsión Social (BPS) y de la Caja Bancaria. Los registros son depurados en base a información del INE proveniente de sus propias encuestas y relevamientos específicos realizados para mejorar la calidad de la información.

Con la información disponible para el año 2021 se construyó el marco muestral para la EAAE 2021, compuesto por 11.384 empresas. En el Gráfico 1 se presenta la cantidad de empresas según su actividad económica principal a nivel de sección de actividad.


Gráfico 1: Cantidad de empresas en el marco muestral del año 2021 según sección de actividad económica

Fuente: Marco muestral EAAE 2021, INE


4. Diseño muestral



El diseño muestral es aleatorio, por conglomerados y estratificado. La unidad de muestreo es la empresa, la cual puede verse como un conglomerado o cluster de actividades económicas. Para la selección de la muestra, el universo de empresas es particionado en estratos y dentro de los mismos se realiza un sorteo independiente, aleatorio y sistemático con las empresas ordenadas en función del personal ocupado.


4.1. Estratificación



El interés principal de la EAAE es estimar el total de la producción, valor agregado, remuneraciones y el personal ocupado para la población de interés. Por este motivo la estrategia de selección tiene en cuenta la información disponible en el marco muestral sobre cantidad de personal ocupado y monto de remuneraciones de las empresas.

Al mismo tiempo, la EAAE no solo intenta proporcionar estimaciones confiables para el total del universo sino que también a nivel de sub sectores de actividad (dominios), por lo cual los tamaños de muestra para los distintos sub sectores son controlados a priori para obtener estimaciones más precisas. La estratificación reconoce dos dimensiones: la clase de actividad económica principal de la empresa (agrupaciones de clases de actividad a cuatro dígitos, denominada CAE) y una medida de tamaño, que corresponde al personal ocupado registrado en BPS y/o a las ventas declaradas ante la DGI. Esto significa que cada CAE es estratificada en tres estratos de tamaño:

  • Estrato 1: comprende a las empresas con personal ocupado entre 10 y 19
  • Estrato 2: comprende a las empresas con personal ocupado entre 20 y 49
  • Estrato 3: comprende a las empresas con Personal ocupado mayor o igual a 50 y/o promedio mensual de ventas por un monto mayor a 189,8 millones de pesos.

El estrato de tamaño 3 es de inclusión forzosa a priori, es decir, todas las empresas dentro del estrato son encuestadas (censo).

En los gráficos 2 y 3 se puede apreciar la importancia del estrato forzoso en dos de las principales variables de interés: Personal Ocupado Dependiente (POD) y remuneraciones (REM) según los datos administrativos presentes en el marco muestral de la EAAE para el año 2021.


Gráfico 2. Participación del estrato forzoso en el empleo para cada sección de actividad económica en el marco muestral de la EAAE 2021

Fuente: Marco muestral EAAE 2021, INE


Gráfico 3. Participación del estrato forzoso en las remuneraciones para cada sección de actividad económica en el marco muestral de la EAAE 2021

Fuente: Marco muestral EAAE 2021, INE


4.2. Tamaño de muestra



Los tamaños de muestra para los estratos forzosos vienen dados por la cantidad de empresas que se encuentran clasificadas en los mismos. Los tamaños de muestra para los estratos aleatorios son calculados utilizando como variable auxiliar las remuneraciones de la empresa. Se calculan de manera de obtener coeficientes de variación para los estimadores de los totales de remuneraciones y personal ocupado por CAE de como máximo 5%.

Posteriormente, los tamaños de muestra que surgen de la asignación óptima son ajustados de forma de tener un mínimo de cuatro empresas por estrato, así como una probabilidad de selección máxima de 1/25 para empresas medianas y de 1/15 para empresas pequeñas.

Bajo estos requerimientos el tamaño de muestra teórico se fijó en 4.462 empresas. En el siguiente cuadro se presenta la distribución del tamaño de muestra por sección de actividad y estrato de tamaño.


Cuadro 1: Tamaños de muestra teórica por estrato tamaño y según sección de actividad

Estrato
Sección de actividad Total 10 a 19 20 a 49 Forzoso
B. Explotación de minas y canteras 25 12 11 2
C. Industrias Manufactureras 792 265 232 295
D. Suministro de electricidad, gas, vapor y aire acondicionado 6 3 1 2
E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento 47 12 21 14
G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas 1.111 344 324 443
H. Transporte y almacenamiento 393 137 110 146
I. Alojamiento y servicio de comida 136 59 38 39
J. Información y comunicación 204 69 54 81
K. Actividades financieras y de seguros 114 39 35 40
L. Actividades inmobiliarias 69 25 31 13
M. Actividades profesionales, científicas y técnicas 207 71 74 62
N. Actividades administrativas y servicios de apoyo 455 95 118 242
P. Enseñanza 297 43 51 203
Q. Servicios sociales y relacionados con la Salud Humana 316 54 83 179
R. Artes, entretenimiento y recreación 122 36 32 54
S. Otras actividades de servicios 168 63 69 36
Total 4.462 1.327 1.284 1.851
Fuente: Muestra teórica EAAE 2021, INE


4.3. Selección de las empresas en la muestra



El panel rotativo implica que las empresas aleatorias (pequeñas y medianas) permanezcan un mínimo de tres años en la muestra, para luego ser sustituidas por otras empresas del mismo estrato.

En el año 2021, partiendo de la muestra del año anterior, se seleccionó 1/3 de las empresas de cada estrato aleatorio para ser remplazadas por empresas nuevas del mismo estrato. Las empresas a ser removidas de la muestra fueron seleccionadas aleatoriamente entre las que cumplieran tener más de 3 años en el panel, siempre que existiesen en el marco empresas nuevas para sustituirlas. El sorteo realizado fue sistemático con arranque aleatorio, con las empresas ordenadas por clase de actividad (CIIU REV.4 a cuatro dígitos) y por personal ocupado a los efectos de no distorsionar la representatividad a nivel de esas dos variables.

Además, se ajustó el número de empresas de cada estrato de acuerdo al tamaño de muestra óptimo calculado. Las empresas incluidas en la muestra, en cada uno de los estratos, fueron seleccionadas directamente bajo un diseño sistemático de arranque aleatorio donde las empresas se ordenan por clase de actividad y por personal ocupado. Para estratos donde debieron ser removidas empresas, se realizó un sorteo de iguales características al referido en el párrafo anterior.

Por su parte, las empresas incluidas en el marco muestral clasificadas en el estrato de tamaño 3 fueron todas incluidas en la muestra.


5. Muestra efectiva



Culminado el relevamiento, la muestra efectiva se situó en 3.344 empresas. Esto se debe a la no respuesta, la no elegibilidad o la imposibilidad de contacto con las empresas que habían sido seleccionadas originalmente.

La no elegibilidad se debe a que la actividad económica principal de una empresa no se encuentra dentro de las actividades investigadas por la EAAE, existiendo un error o un cambio respecto a lo que figura en el marco muestral. A su vez, existen casos en la muestra para los que no es posible determinar si son elegibles o no. Dichos casos corresponden a empresas que no pudieron ser ubicadas y por ende es imposible establecer si son elegibles o no de participar en la EAAE.


Cuadro 2: Muestra teórica por causales

Cantidad de empresas
Elegibles que respondieron (ER) 3.344
Elegibilidad desconocida (ED) 350
No Elegibles (NE) 35
Elegibles que no respondieron (ENR) 738
Total (n) 4.467
Fuente: Muestra teórica (actualizada) EAAE 2021, INE


La tasa de efectividad (TEF) se situó en 74,9% y se define como:

\[ TEF=\frac{ER}{n} \times 100,\]

Por su parte, la tasa de elegibilidad (TE) se situó en 99,1% y se define como:

\[ TE=\frac{n-(ED+NE)}{n-ED} \times 100,\] Por último, la tasa de respuesta (TR) se situó en 81,9% y se define como:

\[ TR=\frac{ER}{ER + ENR} \times 100,\]


6. Ponderadores de la encuesta



Los datos de la muestra efectiva son ponderados, de forma de obtener estimaciones tanto a nivel del total de la población como para otros dominios de estudio. El ponderador final para la empresa \(i\) viene dado por:

\[w_{ih}=w_{ih}^0\times nr_{ih} \times g_{ih}, \]

donde \(w_{ih}^0\) es el ponderador original o basado en el diseño para la empresa \(i\) perteneciente al estrato \(h\), \(nr_{ih}\) es el ajuste por no respuesta y \(g_{ih}\) es el ajuste proveniente de la calibración.


6.1 Ponderador original



El ponderador muestral teórico depende de la estrategia utilizada para la selección de las empresas en la muestra, es decir, las probabilidades de inclusión de las empresas provenientes del diseño muestral.

El ponderador teórico de la empresa \(i\) perteneciente al estrato \(h\) es:

\[ w_{ih}^0=\frac{N_h}{n_h},\]

donde \(N_h\) y \(n_h\) son la cantidad de empresas en el marco y en la muestra teórica respectivamente perteneciente al estrato \(h\). Esto significa que cada empresa de la muestra teórica se representa a ella misma y a \(N_h/n_h -1\) empresas que pertenecen al universo y no pertenecen a la muestra de la EAAE.


6.2 Ajuste por no respuesta



La no respuesta y la imposibilidad de contactar a algunas de las empresas que fueron sorteadas en la muestra teórica obliga a ajustar los ponderadores originales. El ajuste fue realizado a nivel de estrato multiplicando el ponderador original \(w_{ih}\) por el inverso de la tasa de efectividad en el estrato. El ponderador muestral para la empresa \(i\) perteneciente al estrato \(h\) ajustado es

\[w_{ih}^{nr}= {w_{ih}^0} \times {nr_{ih}} = {w_{ih}^0} \times {{TEF_h}^{-1}} = \frac{N_h}{m_h},\]

donde \(TEF_h\) es la tasa de efectividad en el estrato \(h\) y \(m_h\) es el tamaño de muestra efectivo (elegibles respondentes) en el estrato de diseño \(h\) .

La tasa de efectividad presenta una asociación con el tamaño de la empresa (ver Cuadro 4). La no efectividad se debe principalmente a la deficiencia en el marco muestral en lo concerniente a las variables de identificación y ubicación de las unidades. También obedece a la volatilidad del ciclo de vida de las empresas que conforman el universo de estudio, factor que se intensifica en las empresas pequeñas en términos de su Personal Ocupado.


Cuadro 3: Tamaños de muestra teóricos y efectivos, y tasa de no respuesta por estrato de tamaño

Estrato Muestra teórica (MT) Muestra efectiva (ME) Tasa de efectividad (TEF)
1 1329 860 64,7
2 1286 907 70,5
3 1852 1577 85,2
Total 4467 3344 74,9
Fuente: Muestra teórica y efectiva EAAE 2020, INE


6.3 Calibración



La calibración/regresión es un método que consiste en ajustar (calibrar) los ponderadores originales utilizando información auxiliar acerca de la estructura del universo, con el objetivo que la muestra expandida coincida con la información conocida del Universo, lo cual brinda coherencia y comparabilidad a las estimaciones obtenidas. Por otra parte, si la información auxiliar utilizada se encuentra relacionada con las variables de interés de la encuesta, la precisión (reducción del error estándar) de las estimaciones mejora notoriamente. Finalmente, la calibración sirve para minimizar el sesgo ocasionado por la no respuesta siempre que la misma esté correlacionada con las variables utilizadas para la calibración.

La información auxiliar para la calibración de los ponderadores de la EAAE es el número de empleados, remuneraciones y las ventas registradas en el periodo de las empresas las cuales se encuentran contenidas en el propio marco muestral de donde se seleccionó la muestra de la EAAE. La calibración se lleva a cabo a nivel de sección de actividad, esto provoca que las estimaciones de la cantidad de empresas, el total de empleados, total de remuneraciones y el total de las ventas para cada una de las trece secciones de actividad que componen el universo de estudio de la EAAE coincida exactamente con el marco muestral.

Los ponderadores calibrados quedan definidos como:

\[w_{ih}^{re}=w_{ih}^{nr}\times g_{ih} ,\]

donde \(g_{ih}\) es el factor de ajuste proveniente de la calibración.

El ajuste proveniente de la calibración para la empresa \(i\) perteneciente al estrato \(h\) es definido como:

\[ g_{ih}=1 + (\mathbf{X}-\hat{\mathbf{X}})^{'} (\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}\mathbf{x}_{ih}^{'})^{-1}\mathbf{x}_{ih} , \]

donde \(s_{ER,h}\) es la muestra de las empresas elegibles respondentes en el estrato de diseño \(h\), \(\mathbf{x}_{ih}\) el vector de información auxiliar para la empresa \(i\) perteneciente al estrato \(h\) de dimensión \(J\), \(\mathbf{X}=\sum\nolimits_{h=1}^H \sum\nolimits_{i \in U_h}\mathbf{x}_{ih}\) es el vector de totales poblacionales de las variables auxiliares utilizadas para la calibración y \(\hat{\mathbf{X}}=\sum\nolimits_{h=1}^H \sum\nolimits_{i \in s_{ER,h}}w_{ih}^{nr}\times\mathbf{x}_{ih}\) es el estimador de \(\mathbf{t}_{\mathbf{x}}\) utilizando los ponderados provenientes del diseño muestral ajustados por la no respuesta.

En el siguiente gráfico se presentan los ajustes de los ponderadores originales provenientes de la calibración


Gráfico 4: Factores de ajuste producto de la calibración

Fuente: EAAE 2021, INE


Se impone como condición para la calibración que \(0.5<g_{ih}<2\). La restricción es impuesta como compromiso entre la reducción de posibles sesgos en las estimaciones, y un aumento innecesario en los errores estándar de las estimaciones por el hecho de un aumento en la variabilidad de los pesos.


6.4 Recorte o trimming de los pesos finales



Una vez computado los pesos ajustados por calibración pueden existir empresas muy grandes en términos de VAB o VBP que tengan ponderadores mayores a uno. En este caso, los ponderadores calibrados de dichas empresas son definidos a posteriori igual a uno debido a que las mismas se consideran únicas y por ende deberían representarse únicamente así mismas.


7. Precisión de las estimaciones



Las estimaciones varían entre muestra y muestra, es decir, dependiendo de la muestra que sea seleccionada son las estimaciones que se obtiene para los indicadores de interés de la encuesta. Esta variación producto del muestreo describe la incertidumbre de las inferencias acerca de la población en base a una muestra en particular y es medida por medio de la varianza del estimador. La varianza del estimador depende del diseño muestral, la variabilidad de los datos, el tamaño de muestra y el método de ajuste de los ponderadores determinan el error muestral.

El estimador para el total de la variable \(y\), \(Y=\sum\limits_{i=1}^Ny_{i}=\sum\limits_{h=1}^H\sum\limits_{i \in U_h} y_{ih}\), viene dado por:

\[\hat Y=\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}\times y_{ih},\]

donde \(y_{ih}\) es el valor que toma la variable \(y\) en la empresa \(i\) perteneciente al estrato de diseño \(h\).

La estimación de la varianza del estimador de un total bajo el diseño muestral de la EAAE y teniendo en cuenta la calibración de los ponderadores viene dada por:

\[\widehat {\text{Var}} (\hat Y)= \sum\limits_{h=1}^H N_h^2\times{(1-m_h\times N_h^{-1})}\times{m_h}^{-1}\sum\limits_{i \in s_{ER,h}}(e_{ih}-\bar e_h)^2\times (m_h-1)^{-1},\] donde \(e_{ih}=y_{ih}-\mathbf{x}_{ih}^{'}\hat{\mathbf{B}}\) es el residuo (error) de la empresa \(i\) perteneciente al estrato \(h\) con

\[\hat{\mathbf{B}}=(\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}\mathbf{x}_{ih}^{'})^{-1} (\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}y_{ih})^{-1} , \] y \(\bar e_{ih}\) es la media muestral de los errores en el estrato de diseño \(h\).

Las estimaciones de las varianzas de los estimadores se llevaron a cabo en el paquete Survey del software libre R. A continuación se presentan los coeficientes de variación \[\widehat{\text{CV}}=\sqrt{\widehat{Var}(\hat Y)} \times {|\hat Y}^{-1}|\times 100\] expresados en porcentajes para las principales variables de interés VBP, VAB y remuneraciones (RA) a nivel de sección de actividad.


Cuadro 4: Coeficientes de Variación por sección de actividad

Coeficiente de variación (%)
Sección de actividad VBP VAB RA
B. Explotación de minas y canteras 26,47 10,66 9,80
C. Industrias Manufactureras 1,48 1,25 0,70
D. Suministro de electricidad, gas, vapor y aire acondicionado 0,00 0,01 0,01
E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento 2,36 2,07 2,32
G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas 2,72 3,17 1,46
H. Transporte y almacenamiento 18,21 7,48 2,93
I. Alojamiento y servicio de comida 10,32 5,58 3,51
J. Información y comunicación 2,64 1,85 3,15
K. Actividades financieras y de seguros 19,25 30,83 4,26
L. Actividades inmobiliarias 24,31 21,91 6,88
M. Actividades profesionales, científicas y técnicas 5,70 6,24 5,24
N. Actividades administrativas y servicios de apoyo 2,92 3,30 4,05
P. Enseñanza 4,59 3,03 2,70
Q. Servicios sociales y relacionados con la Salud Humana 2,08 1,79 1,18
R. Artes, entretenimiento y recreación 6,79 5,48 3,97
S. Otras actividades de servicios 8,04 8,40 7,78
Fuente: EAAE 2021, INE


8. Empresas de Zonas Francas



Los microdatos de la EAAE se combinan con los datos obtenidos para las empresas que desarrollan su actividad en Zonas Francas para elaborar las estadísticas publicadas por el INE.

La información se obtiene del censo económico de Zonas Francas correspondiente al año 2021, realizado en convenio con la Dirección General de Comercio del Ministerio de Economía y Finanzas (DGC del MEF) y el Banco Central del Uruguay (BCU).

Se incluyen todas aquellas empresas que siendo usuarias de alguna Zona Franca del país, tuvieran un VBP anual mayor a $U 189.786.191 o que realizaran alguna clase de actividad perteneciente a la industria manufacturera, según la CIIU REV 4.

En 2021 totalizaron 186 empresas, cuya actividad se distribuye de la siguiente manera:


Cuadro 5: Cantidad de empresas Zona Franca por sección de actividad
Sección de actividad Cantidad de empresas ZF
C. Industrias Manufactureras 43
D. Suministro de electricidad, gas, vapor y aire acondicionado 1
G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas 44
H. Transporte y almacenamiento 9
J. Información y comunicación 22
K. Actividades financieras y de seguros 26
L. Actividades inmobiliarias 8
M. Actividades profesionales, científicas y técnicas 17
N. Actividades administrativas y servicios de apoyo 13
Q. Servicios sociales y relacionados con la Salud Humana 1
S. Otras actividades de servicios 2
Total 186
Fuente: Censo económico de Zonas Francas 2021, INE





Contacto: Depto. de Difusión y Comunicación

Instituto Nacional de Estadística

Torre Ejecutiva Anexo, Piso 4 Liniers 1280, C.P.: 11.100

Tel: (598) 29027303, ints.: 7723, 7725

E-mail: difusion@ine.gub.uy

Sitio Web: https://www.ine.gub.uy

Twitter: https://twitter.com/ine_uruguay