COL_2016_GEIH_v01_M
Gran Encuesta Integrada de Hogares 2016
Name | Country code |
---|---|
Colombia | COL |
Income/Expenditure/Household Survey [hh/ies]
ANTECEDENTES DE LA OPERACIÓN ESTADÍSTICA
El DANE, ha desarrollado e implementado encuestas de hogares: fuerza de trabajo, de ingresos y gastos desde finales de la década del sesenta del siglo pasado. Durante la década de 1970, se dio inició a la denominada Encuesta Nacional de Hogares (ENH), la cual fue concebida como un sistema de encuestas de múltiples propósitos que tenía como fin producir estadísticas básicas relacionadas con las situaciones: demográfica, social y económica de la población colombiana. Entre 1970 y 1975, se llevaron a cabo nueve etapas con diferente periodicidad, cobertura y diseño muestral, estos criterios se unificaron a partir de marzo de 1976. Posteriormente en 1978, se realizó la primera medición áreas rurales, la cual se replicó nuevamente en 1988. Entre los años 1976 y 1984 en forma trimestral se investigaron las ciudades de Bogotá, Cali, Medellín y Barranquilla con una cobertura variable en cada trimestre, y en forma semestral Bucaramanga, Manizales y Pasto.
En la década de 1980, se incluyeron los municipios circundantes a las siete principales ciudades, conformando la muestra trimestral las ciudades de Bogotá D.C. y Pasto. De igual manera las áreas metropolitanas de Medellín - Valle de Aburrá (Caldas, La Estrella, Sabaneta, Itagui, Envigado, Bello Copacabana y Barbosa), Cali - Yumbo; Barranquilla - Soledad; Bucaramanga - Girón Piedecuesta, Floridablanca; Manizales - Villa María, semestralmente las áreas metropolitanas de Pereira - Dos Quebradas y la Virginia y Cúcuta, Villa del Rosario, Los Patios y el Zulia; y anualmente las ciudades de Ibagué, Montería, Cartagena y Villaviciencio.
A partir de marzo de 1990, se presentaron resultados representativos por área metropolitana. En el mes de diciembre de 1991, se dio inició a la medición nacional, aunque se incorporó el concepto de ruralidad se mantuvo el concepto de distribución cabecera - resto por regiones, esta medición continuo todos los años en los meses de septiembre a partir de 1992. En 1996, se amplió la muestra lo que permitió presentar resultados a nivel departamental y finalmente se elimina el concepto de ruralidad.
En desarrollo del plan de trabajo, en enero de 1999 se inició en Bogotá la aplicación de la Encuesta Continua de Hogares (ECH) como prueba piloto, la cual se extendió a partir del segundo semestre a las ciudades de Medellín y Cali, y desde septiembre a Barranquilla, Bucaramanga, Manizales y Pasto. Una vez realizados los análisis correspondientes a la prueba piloto, la ECH, se aplicó en forma definitiva a partir de enero de 2000, en las siguientes 13 ciudades con sus áreas metropolitanas: Bogotá, Cali, Medellín, Barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Cúcuta, Villavicencio, Ibagué, Montería y Cartagena, las cuales comenzaron a formar parte del nuevo Sistema de Encuestas a Hogares . El sistema completo comprende además la encuesta continua de cobertura nacional que tiene diferentes niveles de desagregación geográfica en la medida que se vaya acumulando tamaño de muestra (cabecera y resto, grandes regiones y total por departamento).
Durante el año 2000, se realizaron en paralelo la encuesta tradicional de aplicación trimestral y la encuesta continua, con el fin de proporcionar información que permitiera analizar las diferencias en los resultados de los dos métodos e identificar los criterios básicos para el empalme de las series, lo anterior con el fin de afinar los procesos y procedimientos operativos, armonizar las encuestas urbanas y rurales y definir el sistema de procesamiento y producción de resultados. Con los resultados anteriores se pudo determinar la cantidad de indicadores y la periodicidad con la cual se debían publicar.
En 2001, se amplió la muestra maestra de 165 a más de 240 municipios, con 30.000 hogares en 13 ciudades y sus áreas metropolitanas y 7.500 en el resto de cabeceras, centros poblados y rural disperso. En el año 2003 se amplía la investigación por regiones y total por departamentos. En 2004, se incrementó la muestra maestra, con un total de 44.400 hogares, con 30.000 en 13 ciudades y sus áreas metropolitanas y 14.400 en el resto de cabeceras, centros poblados y rural disperso.
En el año 2005, se propuso la integración de las tres más importantes Encuestas a Hogares del DANE: la Encuesta Continua de Hogares (ECH), la Encuesta Nacional de Ingresos y Gastos (ENIG) y la Encuesta de Calidad de Vida, (ECV), esto con el propósito de ampliar el alcance temático de la investigación y reducir el costo de la aplicación. Como resultado de esta propuesta tan solo se pudieron aplicar algunos módulos de las ECV y ENIG. La integración de estas encuestas no fue efectiva en su totalidad.
En ese proceso se revisó la documentación disponible sobre esta estrategia, y se contó con el apoyo financiero del programa del Banco Mundial, para el Mejoramiento de las Encuestas y la Medición de las Condiciones de Vida en América Latina y el Caribe (MECOVI) el apoyo financiero del Banco se centró en el diseño temático, el diseño de muestras, diseño logístico, así como la estrategia de capacitación, y las pruebas de campo para avanzar en la estrategia de integración de encuestas. En el año 2006, sobre la base de la revisión de experiencias internacionales y con el propósito de cumplir el alcance temático de las encuestas a hogares, se inició el diseño de la GEIH.
La GEIH es el resultado de un marco estructural del Sistema de Encuestas Sociales en un lapso de 10 años (periodo intercensal) donde, en el primer año, se integró la ECH con la ENIG Posteriormente, se integra la ECH con la ECV. En las etapas subsiguientes se realizaron módulos periódicos, bien de profundización en el estudio de fenómenos específicos, o bien, para monitorear fenómenos que se midieron en profundidad en la GEIH el primer año.
Consecuentemente, se revisaron las variables a mejorar en cada investigación, comparando el resultado de los periodos anteriores: temáticas y variables comunes para tres encuestas. Se concluyó que el eje central de la GEIH debía ser la de Mercado Laboral ECH por su carácter de continua y por ser la de mayor tamaño y cobertura. Las otras se incluyeron como módulos específicos, los cuales no se hicieron a toda la muestra sino a una submuestra de la ECH.
El reto asumido por el DANE, fue el de lograr esta integración temática permitiendo el enriquecimiento de cada encuesta en particular, sin que el tamaño del formulario afectara la calidad en la recolección. Esto supuso la implementación de nuevos desarrollos logísticos considerando innovaciones como:
Introducción del informante directo, que permitió realizar una mayor indagación sobre variables claves como son los ingresos y las condiciones de trabajo de las personas.
Captura de información mediante dispositivos móviles, lo que permitió una mayor oportunidad en la producción de resultados.
La recolección de la GEIH empezó el 7 de agosto de 2006 en su módulo central de mercado laboral e ingresos y, a partir del 11 de septiembre, con su módulo de gastos de los hogares. A partir del 10 de julio de 2006 se amplió la cobertura de la ECH a once ciudades adicionales, a las trece principales ciudades y áreas metropolitanas, al resto de cabeceras y al resto rural; cobertura que en la actualidad mantiene la GEIH.
Desde el año 2007, la GEIH ha estado sometida a la revisión y evaluación de expertos nacionales e internacionales, con el propósito de establecer los impactos en la serie de mercado laboral e ingresos, teniendo en cuenta mejoras incorporadas. En enero de 2009 se actualizaron los marcos de muestreo de las encuestas a hogares y los techos de población en edad de trabajar para los distintos dominios con base en las proyecciones de población que surgen del censo de población y vivienda 2005. Posteriormente, este ejercicio se volvió a realizar en 2011 para ajustar las poblaciones de la GEIH y llevarlas a los techos suministrados por la oficina de Censos y Demografía del DANE.
Actualmente, la encuesta se ha especializado en la medición de la estructura del mercado laboral y los ingresos de los hogares. Esta tiene una muestra total anual de 240.000 hogares aproximadamente, lo que hace que sea la de mayor cobertura a nivel nacional. Por su parte, las mediciones de Calidad de vida e Ingresos y Gastos de los hogares, se realizan a través de encuestas independientes (ECV y ENIG).
En cuanto a la medición de la informalidad para Colombia, la Encuesta Nacional de Hogares - ENH, aplicada de 1976 hasta el año 2000, fue la primera encuesta utilizada para medir la informalidad en el país. El primer módulo de informalidad fue implementado en la ENH en Junio de 1986 para las 7 principales ciudades, incluidas sus áreas metropolitanas (Bogotá, Cali, Medellín, Barranquilla, Manizales, Pasto y Bucaramanga). A partir de ese año y hasta el año 2000, el módulo se aplicó en el mes de junio con periodicidad bianual. Durante todo el período, la encuesta tuvo la misma estructura con excepción de la realizada en junio de 1990, cuando se introdujeron cambios en las opciones de respuesta a la pregunta que generaba el filtro de informalidad.
Entre los años 2001-2006, con la sustitución de la ENH por ECH, se inicia la aplicación del módulo de informalidad en los segundos trimestres de cada año, para el tercer trimestre de 2006 se empieza a aplicar la GEIH. La ECH aplicada a las 13 principales ciudades con sus áreas metropolitanas realizó la medición del sector informal mediante la denominada Encuesta 1 2 3. Esta fue una encuesta mixta realizada en tres fases, que se describen a continuación:
Fase 1. En esta se aplicó una encuesta de hogares que identificó a los miembros del hogar, patronos o trabajadores por cuenta propia, de una unidad económica informal visible, no visible o móvil. Con esta información se construyó un marco muestral de unidades económicas de los hogares.
Fase 2. Se aplicó una encuesta a las unidades económicas informales, indagando por las características generales de la unidad económica tales como actividad económica, edad, formas de financiamiento, número y características del personal ocupado, costos, producción, ventas, ingresos, valor de los activos fijos, etc.
Fase 3. Mediante la aplicación de una encuesta de ingresos y gastos, se indagó sobre la proporción de los gastos de consumo final de los hogares que se realiza en establecimientos informales y las razones por las cuales los hogares adquieren productos de consumo final en establecimientos informales.
Para la GEIH la batería de preguntas del módulo de informalidad se mantuvo, aunque se decidió que la aplicación del mismo debería ser de forma continua con una cobertura para total nacional, que incluye además las ciudades con sus áreas metropolitanas, cabeceras y centros poblados. La medición de informalidad se empieza a publicar en el año 2007, en un informe especial de mercado laboral según el empleo informal. Esta publicación es mensual pero el acumulado de la muestra que se presenta es trimestral posteriormente el año 2008, se presentan los resultados de la GEIH, incluyendo la medición de informalidad, con proyecciones de población basadas en el Censo 2005.
A partir de diciembre de 2009, se comienza a hacer uso de la resolución de 1993 de la OIT, la cual cambia el límite de escala de personal ocupado en las empresas, pasando de 10 a 5 trabajadores. Acorde con el principio 9 de la ONU sobre la utilización de normas internacionales, el DANE realizó la actualización de parámetros con la revisión estadística correspondiente, sustentada a través de la encuesta de microestablecimientos, donde se encontró evidencia de que las empresas que ocupan entre 6 y 9 empleados generan empleo formal.
En el último trimestre del año 2012, la Gran Encuesta Integrada de Hogares se empieza a aplicar en las ocho ciudades capitales de los nuevos departamentos. Con esta ampliación de la muestra se logra cubrir el 100% de las ciudades capitales de todos los Departamentos.
REFERENTES INTERNACIONALES
Los conceptos, las definiciones, el formulario básico y el sistema de recolección se enmarcan en las resoluciones y recomendaciones que produce la OIT y la CIET.
El DANE también emprendió la revisión del marco conceptual y metodológico de la encuesta rural, sobre la frecuencia de su aplicación y de la utilización de conceptos y definiciones que se usan para las encuestas urbanas. Asimismo, se intenta encontrar un mecanismo técnico que permita incorporar a la investigación dos elementos que son fundamentales: la estacionalidad de la actividad económica en las áreas rurales y la movilidad de la mano de obra. Se revisaron las experiencias al respecto de otros países de América Latina, pero no se hallaron pistas alentadoras, razón por la cual se solicitó asistencia técnica nacional - expertos en el tema - e internacional (OIT).
En este contexto, en mayo de 1998 vino en misión a Colombia el señor Ralf Hussmans, experto internacional de la OIT- Ginebra en temas relacionados con las estadísticas laborales. Atendiendo sus recomendaciones y las de los expertos nacionales, se hizo un rediseño parcial del cuestionario de las encuestas de cobertura nacional (urbana y rural) y se incluyeron los módulos de historia laboral y movilidad laboral en las encuestas de septiembre de 1998, y de marzo y septiembre de 1999. Asimismo, se planeó la aplicación como prueba piloto de una "Encuesta Continua de Hogares" en Bogotá.
En abril de 1999, el señor Hussmans cumplió una nueva misión de asesoría para evaluar los avances logrados, de la cual se concluyó la viabilidad de remplazar las encuestas trimestrales o transversales de hogares por encuestas continuas. En forma paralela, el DANE conformó el "Comité Técnico de Empleo ", que se reunió por primera vez el 20 de mayo del mismo año.
En relación con la Comunidad Andina (CAN), el Programa Estadístico Comunitario busca la armonización estadística en temas como población, mercado de trabajo, cuentas nacionales, moneda y banca, balanza de pagos, entre otros. El citado programa pretende, igualmente, fortalecer los sistemas nacionales de estadística y la coordinación subregional, con miras a disponer de información sobre la base de definiciones, conceptos y metodologías comunes o similares. Asimismo, ANDESTAD - proyecto de cuatro años lanzado en junio 2005 entre la Unión Europea y la Comunidad Andina - busca mejorar la calidad de las estadísticas que sirven para la preparación, gestión y evaluación de las políticas públicas a nivel nacional, y, en particular, las políticas que tienen en común los países que forman la Comunidad Andina. Asimismo, el proyecto propicia la armonización de las metodologías estadísticas para hacer comparable la información entre los países, y también una amplia difusión de la misma.
Por su parte, el Sistema de Integración Económica Centroamericana (SIECA) ha puesto en marcha un Sistema Regional de Información Laboral, con el fin de proporcionar las estadísticas laborales de los países de la sub-región por indicador (desagregados por edad y sexo) en un solo portal. A su vez, La OIT ha elaborado un estudio sobre las diferencias conceptuales y de sistemas de clasificación relativo a los indicadores del mercado de trabajo en los países centroamericanos.
La Gran Encuesta Integrada de Hogares (GEIH) tiene como objetivo principal proporcionar información básica sobre el tamaño y estructura de la fuerza de trabajo (empleo, desempleo e inactividad) de la población del país, así como de las características sociodemográficas de la población colombiana, permitiendo caracterizar a la población según sexo, edad, parentesco con el jefe del hogar, nivel educativo, la afiliación al sistema de seguridad social en salud, entre otros.
Igualmente, a través de la encuesta se clasifica a las personas según su fuerza de trabajo en ocupadas, desocupadas o inactivas. De esta forma, es posible estimar los principales indicadores del mercado laboral colombiano, como son la Tasa Global de Participación (TGP), la Tasa de Ocupación (TO) y la Tasa de Desempleo (TD).
Sample survey data [ssd]
La encuesta tiene las siguientes unidades de análisis: Hogares e Individuos
A continuación se describe el contenido temático de la operacion estadística:
• Vivienda: Tipo de vivienda y características físicas (material de paredes y pisos).
• Datos del hogar: Conexión a servicios públicos, privados - comunales, valor pagado por consumo y calidad de los mismos, conexión y uso de servicio sanitario, obtención de agua para consumo, lugar y energía para preparar alimentos, eliminación de basuras, tipo de tenencia de la vivienda, tenencia de bienes en el hogar.
• Registro de personas: Identificación del residente habitual.
• Características generales: Sexo, edad, parentesco, estado civil.
• Seguridad social en salud: Cobertura del Sistema General de Seguridad Social en Salud -SGSSS- por regímenes, persona que paga afiliación y cobertura.
• Educación: alfabetismo, asistencia escolar, máximo nivel educativo alcanzado y último año aprobado o que esté cursando y títulos o diplomas obtenidos.
• Fuerza de trabajo: PEA (ocupados y desocupados)
• Ocupados:
Empleo principal (rama de actividad, ocupación, tipo de contrato, acceso a prestaciones, tiempo trabajado y posición ocupacional).
Asalariados (medios de búsqueda, remuneración mensual, horas extras, pagos en especie, subsidios, primas y bonificaciones).
Independientes (formas de trabajo, registro mercantil, contabilidad, ganancia u honorarios netos).
Asalariados e independientes (duración del empleo, horas normales y efectivas trabajadas, honorarios, tamaño de la empresa, sitio de trabajo, Afiliación a pensiones, caja de compensación familiar y ARP, duración entre empleo anterior y actual).
Empleo secundario (horas trabajadas, posición ocupacional, remuneración mensual, tamaño de la empresa y sitio de trabajo)
Empleo con insuficiencias de horas y situaciones de empleo inadecuado (por competencias e ingresos).
Calidad del empleo
• Desocupados: Duración de búsqueda de trabajo, historial laboral, ingresos y seguridad social.
• Inactivos: trayectoria laboral, ingresos y seguridad social.
• Otras actividades. Actividades no remuneradas y ayudas
• Otros Ingresos. Otros ingresos diferentes a los ingresos laborales
• Fecundidad. Cantidades de hijos nacidos vivos y la influencia de la paternidad o maternidad en el mercado laboral
• Migración. Dinámicas migratorias a nivel nacional de la población objetivo
• Trabajo Infantil. Actividades y razones del trabajo infantil.
Cobertura nacional que permite obtener resultados para cabeceras y resto, ciudades y áreas metropolitanas, grandes regiones y total por departamento.
El universo para la Gran Encuesta Integrada de Hogares está conformado por la población civil no institucional, residente en todo el territorio nacional.
Name | Affiliation |
---|---|
Dirección de Metodología y Producción Estadística - DIMPE | Departamento Administrativo Nacional de Estadística - DANE |
Name | Role |
---|---|
Departamento Administrativo Nacional de Estadística | Ejecutor |
MARCO MUESTRAL
Está constituido por el inventario cartográfico y el listado de viviendas obtenidas de la Muestra Maestra de Hogares, con actualizaciones permanentes y nuevos recuentos de edificaciones y viviendas a través de la misma.
TIPO DE MUESTREO
Teniendo en cuenta los objetivos y las características del marco, se optó por una muestra probabilística, estratificada, de conglomerados, multietápica, los cuales se presentan a continuación:
A). Probabilística: Cada unidad de la población objetivo tiene una probabilidad de selección conocida y superior a cero. Este tipo de muestra permite establecer anticipadamente la precisión deseada en los resultados principales, y calcular la precisión observada en todos los resultados obtenidos.
B). Estratificada: Este método asegura una mejor precisión de la muestra, al disminuir la varianza de las estimaciones, los criterios de estratificación son:
· El primer estrato corresponde a las 24 capitales y áreas metropolitanas con dominios de estudio independientes. Cada ciudad o área metropolitana es autorrepresentada. Para la estratificación y selección de la muestra, las áreas geográficas se organizaron, según los principios cartográficos establecidos, en sectores, secciones y manzanas con la información del número de viviendas a nivel de manzana y el estrato socioeconómico.
· El segundo estrato corresponde al resto urbano y al resto de cabeceras, centros poblados y rural disperso. Los municipios se estratificaron de acuerdo con los siguientes criterios:
Geográficos, a nivel de regiones constituidas por varios departamentos.
Socioeconómicos, a nivel municipal, con los siguientes indicadores:
· Nivel de urbanización, en términos de la cantidad de población de las cabeceras municipales.
· Estructura urbano-rural de la población municipal (% de población en cabecera). Proporción de la población con necesidades básicas insatisfechas (NBI), la cual, a su vez, se clasificó en 4 intervalos: A [0-29,8%); B [29,8%-42,7%); C [42,7%-57,3%); y D [57,3%-100%].
· Tamaño poblacional del estrato.
Cada municipio con 7.000 o más habitantes en su población total, se constituyó en Unidad Primaria de Muestreo, UPM. Los de menor población se agruparon con uno vecino para constituirse en UPM.
Las UPM cuyo tamaño era similar al tamaño promedio de los estratos, se constituyeron en estratos de “certeza”; para efectos probabilísticos tuvieron probabilidad 1. Las demás UPM se agruparon en estratos de no certeza, aplicando las variables de estratificación en el orden de prioridad especificado antes.
C). De Conglomerados: Corresponde a la unidad final de muestreo, que es la medida de tamaño o segmento; es el área que contiene un promedio de diez viviendas, en la cual se investigan todas las viviendas, todos los hogares y todas las personas.
La concentración de la muestra en conglomerados presenta grandes beneficios en el nivel operativo; lo cual reduce, en forma considerable, los tiempos y los costos, y facilita la supervisión.
D). Multietápica:
Unidades Primarias de Muestreo (UPM)
Hay UPM de inclusión forzosa y de inclusión probabilística:
Son de inclusión forzosa las áreas metropolitanas y el resto de capitales departamentales que son autorrepresentadas, pues su tamaño muestral permite estimaciones trimestrales separadas para cada una de ellas, y aquellos municipios de tamaño intermedio cuya población es similar o mayor que el tamaño promedio de los estratos de su departamento.
Son de inclusión probabilística las UPM seleccionadas con PPT de los estratos conformados por dos o más UPM (estratos de no certeza). La técnica de selección controlada utilizada permitió mediante un procedimiento probabilístico incrementar las probabilidades de selección de las combinaciones preferidas de UPM que podían ser seleccionadas en un departamento, adicionalmente a lo obtenible con un muestreo estratificado corriente.
En el caso de la Muestra Maestra la selección controlada proporcionó un mejor balance interregional en las características de las UPM seleccionado. El resultado final de este ejercicio fue lograr la máxima reducción posible en el error estándar de estimación de los resultados.
Unidades Secundarias de Muestreo (USM)
En las cabeceras municipales y centros poblados, las USM son grupos de manzanas contiguas del mismo municipio, que contienen un mínimo de 12 medidas de tamaño (MT) con un promedio de 10 viviendas, y en la zona rural dispersa, la USM es una sección o sector censal. El tamaño de la USM permite un control adecuado de la distribución y rotación de la muestra con cada encuesta. Para la selección de las USM se aplica el siguiente procedimiento (PPT):
· Conformación, delimitación y listado de las USM por estrato socioeconómico (solo cabeceras municipales) de cada municipio seleccionado, siguiendo el orden de la nomenclatura de la cartografía censal: sector, sección y manzana.
· Cálculo del número de medidas de tamaño (MT), dividiendo por 10 (el número de viviendas) y aproximando a un valor entero.
· Cálculo de intervalo de muestreo (IM), dividiendo el total de MT existentes en una zona por el número de USM requeridas en la muestra de la zona.
· Selección de un número de arranque entre 1 y el valor del intervalo, el cual indica la primera USM de la muestra de la zona; y selección del resto de USM de la zona, sumando sucesivamente el IM al número de arranque.
Unidades Terciarias de Muestreo (UTM)
El tercer paso es la selección dentro de cada USM de una o más UTM, dependiendo de las requeridas, del tamaño y cantidad de USM preseleccionadas en cada municipio.
Cada UTM es un segmento con un promedio de 10 viviendas contiguas (5 a 14 viviendas), es decir, una medida de tamaño (MT). En un paso intermedio, se seleccionan manzanas en las cabeceras municipales, centros poblados y segmentos de sección rural claramente delimitados, con límites naturales (quebradas, ríos, etc.) o sociales (carreteras, caminos, etc.). Los segmentos de los sectores rurales se conforman previamente con base en fotografías aéreas y en lo posible, se procura que tengan un promedio de 10 viviendas; sin embargo, por insuficiente detalle cartográfico, los segmentos pueden tener dos o más MT.
La selección se hace con probabilidad proporcional al número de MT (PPT), así una manzana o segmento rural puede contener una o más MT, y las que tienen menos de 5 viviendas se juntan con una manzana vecina del mismo estrato socioeconómico.
Las áreas urbanas no urbanizadas se anexan al área o manzana vecina muy cercana con una o más viviendas con el objeto de que tengan probabilidad de selección y para que puedan captar cualquier proceso futuro de urbanización. Si solo se requiere una MT y la manzana o porción solo tiene una MT, la muestra queda constituida por todas las viviendas y hogares existentes. Si la manzana o segmento rural tienen dos o más MT se procede al recorrido y delimitación de segmentos de una MT, en el terreno. Finalmente, se hace la asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación.
Unidades Cuartas de Muestreo (UCM)
Cada UCM es un segmento de 10 viviendas contiguas (5 a 14 viviendas), es decir una medida de tamaño MT y su selección es aleatoria.
Finalmente, se hace una asignación aleatoria del orden en que entrarán los segmentos al proceso de rotación. En este proceso de selección por etapas, solo se requiere una actualización cartográfica detallada de las áreas seleccionadas.
Para el estrato de resto de cabeceras, centros poblados y rural disperso se seleccionó:
En una primera etapa, la UPM, utilizando la técnica de selección controlada dentro de cada estrato.
Para la segunda etapa se seleccionó en la zona urbana la manzana, y en la al resto de cabeceras, centros poblados y rural disperso la sección, o sea la USM.
En la tercera etapa se seleccionó el segmento o UTM.
En este proceso de selección por etapas sólo se requiere una actualización cartográfica detallada de las áreas seleccionadas.
DEFINICIÓN TAMAÑO DE LA MUESTRA
Inicialmente, el tamaño de la muestra mensual correspondía aproximadamente a 23.000 hogares. En el año 2000 con la implementación de la ECH la muestra maestra fue ampliada de 165 a más de 240; con 30.000 hogares en 13 áreas y 7500 en el resto de cabeceras, centros poblados y rural disperso. Durante 2004 se amplió la muestra maestra, con un total de 44.400 hogares, con 30.000 hogares en 13 áreas y 14.400 en el resto de cabeceras, centros poblados y rural disperso. Para el año 2006 con la implementación de la GEIH, se amplió la muestra a 11 ciudades más; con 17.600 hogares adicionales, para un total de 62.000 hogares. Con el nuevo marco generado por el censo 2005, la nueva muestra implementada desde 2009 está conformada por 437 municipios y anualmente se visitan aproximadamente 248.028 hogares, concentrados en 22.548 segmentos. La muestra mensual es de 20.669 hogares, 18.790 viviendas y 1.879 segmentos.
Los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%. Los cálculos se realizan con las fórmulas correspondientes al tipo de diseño muestral. Se ajustan con base en el efecto de los conglomerados en el diseño (deff), que es una relación, para cada dominio, entre la varianza real de este diseño de conglomerados y la que se obtendría con un diseño aleatorio simple de elementos.
COMPONENTES DEL FACTOR DE EXPANSIÓN
Factor básico de expansión (F). Aplicado a los datos muestrales, da a cada elemento de la muestra el peso o representación que le corresponde en el universo investigado. En consecuencia, mediante su aplicación, se estiman numéricamente, en forma aproximada, las características de la población objetivo.
Peso de submuestreo (Ph). Está dado por segmento y es teóricamente igual a 1 para todos los segmentos en razón de que representan una medida de tamaño. El desarrollo dinámico del marco de muestreo en algunos casos puede ser mayor o menor que 1, de acuerdo con la densidad de viviendas del segmento en el momento de hacer la encuesta, y por tal motivo modifica el factor básico de expansión en el segmento.
Ajuste de cobertura por no respuesta (Rh). Cuando las tasas de no respuesta varían en los subgrupos de la población de diferentes características, el ajuste normal es asignar a los hogares y a las personas no encuestadas el promedio de las características de los encuestados en el mismo segmento. Esto se logra corrigiendo el factor básico de expansión por un nuevo factor resultante de la razón entre el número de hogares seleccionados en un segmento y el número de hogares encuestados en el mismo segmento.
El factor final de expansión (Wh). Es el producto de los anteriores y se aplica a cada segmento de la ciudad o área investigada.
AJUSTE POR LOS VALORES POBLACIONALES
Las estimaciones del universo de estudio pueden ser mejoradas, si se equiparan a nivel de las desagregaciones geográficas los totales de la población obtenidos de la muestra expandida, con los totales del censo de población proyectados a la fecha de la encuesta. Dicho mejoramiento se basa en la premisa de que la estructura por desagregaciones geográficas, proyectada a partir de un censo de población reciente, es más exacta que la estimada a partir de la muestra.
Se aplican los estimadores de regresión utilizando la información auxiliar correspondiente a las Proyecciones de Población del CENSO 2005, en este caso, se ha usado la información auxiliar por grupos de edad y sexo. Este proceso se realiza a través de los Métodos de Calibración que son procedimientos que utilizan información auxiliar relacionada con las variables de estudio, con el fin de mejorar la precisión y reducir los sesgos en las estimaciones.
ESTIMADOR DEL TOTAL
Para aplicar el método de calibración se establecieron los siguientes ocho grupos:
SEXO:
Y para cada uno los siguientes grupos de EDAD:
Con la información del total de personas en las proyecciones de población, en cada grupo de calibración se construye el vector de totales.
Donde cada variable x da la cantidad de personas en cada grupo den la vivienda. (Se hace a nivel de vivienda ya que es la unidad de análisis más agregada, de esta manera a la vivienda le corresponde un único factor de expansión que es el mismo de los hogares y personas que viven en ella).
El cálculo del ajuste por calibración se realizó utilizando la macro Clan 97 v3.1 software creado por Statistics Sweden que corresponde a un conjunto de rutinas en el programa SAS para la estimación puntual y de errores en encuestas por muestreo.
El instrumento desarrollado para la recolección de información de la GEIH, cuenta con una serie de preguntas e incorpora los siguientes capítulos y módulos
A. Identificación: 19 preguntas.
B. Vivienda: 5 preguntas.
C. Datos del hogar: 15 preguntas.
D. Registro de personas: 4 preguntas.
E. Características generales: 8 preguntas.
F. Seguridad social en salud: 7 preguntas.
G. Educación: 5 preguntas.
H. Fuerza de trabajo: 14 preguntas.
I. Ocupados: 65 preguntas
J. Desocupados: 14 preguntas.
K. Inactivos: 10 preguntas.
L. Otras actividades: 1 pregunta.
M. Ingresos no laborales: 4 preguntas.
N. Módulo de Micronegocios: 6 preguntas.
O. Módulo Formación para el trabajo: 16 preguntas*.
P. Módulo de Fecundidad: 11 preguntas.
Q. Módulo de Migración: 7 preguntas.
R. Módulo de Trabajo Infantil: 23 preguntas**.
Start | End |
---|---|
2016 | 2016 |
Name | Affiliation |
---|---|
Departamento Administrativo Nacional de Estadística | Gobierno Nacional |
La recolección de la información está bajo la dirección del supervisor, quien fundamentalmente controla el trabajo de campo que realizan los encuestadores, y cuyos resultados dependen en gran parte de la iniciativa para la solución de problemas y dificultades, del liderazgo y la capacidad organizativa del trabajo.
Las actividades de control que debe llevar a cabo un supervisor son:
Control de desempeño de las actividades diarias del encuestador.
Control de calidad, con el objetivo de verificar la calidad y consistencia de la información recolectada mediante la verificación de conocimientos de conceptos del encuestador o por medio de re-entrevistas.
Control de visitas dirigido a revisar que el encuestador haya concurrido directa y personalmente a los hogares de las viviendas que debe entrevistar, y el cumplimiento de las citas concertadas para lograr la encuesta completa.
Control de cobertura, cuyo propósito es controlar que los hogares de las viviendas encuestadas correspondan exactamente a las viviendas seleccionadas en la muestra; y en caso de rechazo por parte del hogar, tratar de persuadir al informante de la importancia de la investigación, recordando su confidencialidad para que suministre los datos.
Como parte de las funciones del supervisor también se encuentra la evaluación de la entrevista, para verificar el buen manejo de los DMC por parte del encuestador y seguimiento a las instrucciones de recolección dadas para recoger la información de mercado laboral.
El objetivo del Sistema de Sensibilización, es lograr una respuesta oportuna y de calidad por parte de las fuentes de información para la investigación estadística al DANE. Esta busca lograr un ambiente de colaboración, acercamiento y conocimiento de la población objetivo mediante la visita a cada uno de los hogares a los que les será aplicada la encuesta, por parte de los sensibilizadores, con el fin de informarles que el hogar ha sido seleccionado para ser encuestado. En esta primera visita, se pueden establecer citas y horarios en los cuales los encuestadores del DANE pueden aplicar la encuesta.
Cada Dirección Territorial y subsede capacita al personal convocado en temas como: cartografía, recuento, recolección, conceptos básicos y manejo del Dispositivo Móvil de Captura (DMC), realiza los exámenes escritos y de campo que sean necesarios y selecciona el personal. Para cada uno de los cursos de capacitación deben aplicarse evaluaciones de: asistencia al curso, prueba de conocimientos y manejo del flujo del cuestionario.
En la página web del DANE Central se publican los términos de referencia. El DANE Central envía a las Direcciones Territoriales y subsedes el nombre de las personas que se inscribieron; luego las Direcciones Territoriales y subsedes reciben las hojas de vida de estas personas y verifican si cumplen el perfil requerido. Como criterios para la selección del personal se evalúa el grado de aprehensión, manejo de los conceptos y de los flujos del cuestionario. Finalmente, las personas que cumplen el perfil requerido son llamadas para capacitación mediante publicación en la página web.
Se hacen evaluaciones sobre todos los conceptos temáticos y del trabajo de campo, y de igual forma se hacen simulaciones de encuestas para medir la destreza en el trabajo de campo que hace parte de la evaluación definitiva.
Por último se realiza una prueba de campo, la cual es una evaluación que consiste en que cada uno de los que están participando en el curso, van a terreno y realizan una o dos encuestas, las cuales se califican y hacen parte de la evaluación. Esta prueba de campo tiene las mismas características de la recolección, es decir, participan recolectores, supervisores y sensibilizadores.
Para manejar eficientemente el trabajo de campo, se conforma un equipo operativo de carácter temporal que funciona sobre la base de cuatro niveles jerárquicos:
Asistente técnico Gran Encuesta Integrada de Hogares. A nivel regional es el responsable de la organización operativa de la encuesta, de él dependen los grupos de trabajo adscritos a su Dirección Territorial, con quienes debe mantener comunicación permanente.
Coordinador de campo Gran Encuesta Integrada de Hogares. En las Direcciones Territoriales del DANE, es el responsable de las actividades preliminares de la encuesta y la supervisión a los grupos de trabajo en campo. En las subsedes tiene a su cargo el manejo de la encuesta en todos sus aspectos administrativos y operativos.
Apoyo Logístico Gran Encuesta Integrada de Hogares. El Apoyo Logístico colabora con las actividades de recuento y logísticas, en la elaboración de los informes operativos. Es el encargado de la revisión, preparación y distribución de los requerimientos para la ejecución de los procesos de recolección de la información y, de la realización de por lo menos una re-encuesta semanal a un hogar perteneciente a cada grupo de trabajo, con fin de confirmar si la información recolectada es consistente.
Apoyo informático. En las Direcciones Territoriales del DANE, es el encargado de transmitir la información y realizar el cruce de segmentos faltantes.
Supervisores. Coordinan y controlan el trabajo en los segmentos en la ciudad y en los municipios que se les asignen y, reportan su trabajo al coordinador de campo de la encuesta.
Encuestador. Conocido también como recolector, es la persona encargada de obtener la información requerida, digitándola en el DMC conforme a las normas y los conceptos establecidos. La labor del encuestador es exigente y requiere un conocimiento preciso de los conceptos y las normas que rigen la encuesta, además de un compromiso orientado a lograr la cobertura y los niveles de calidad propuestos.
Para la ejecución del trabajo de campo, se utiliza un fólder por segmento (carga de trabajo) denominado Carpeta de muestra, en cuya carátula se encuentra la identificación del área, que se va a trabajar el cual contiene:
Un plano (cuando así se requiera) del municipio o del segmento en que se encuentra ubicado para orientación del grupo de trabajo.
El formato de recuento GEIH1.
Listado de edificaciones y viviendas GEIH2.
La encuesta utiliza un informante directo para las personas de 18 años y más, y para aquellas de 10 a 17 años que trabajen o estén buscando trabajo. Para los demás se acepta informante idóneo (persona del hogar mayor de 18 años, que a falta del informante directo pueda responder correctamente las preguntas). No se acepta información de empleados del servicio doméstico, pensionistas, vecinos o menores, excepto cuando el menor de edad es el jefe del hogar o cónyuge.
El sistema utilizado para la recolección es el de barrido y rutas, para el resto de cabeceras, centros poblados y rural disperso.
CONSOLIDACIÓN DE ARCHIVOS
Los datos provenientes del área geográfica en donde se aplica la investigación se consolidan diariamente, y pueden ser monitoreados por el área temática y sistemas
Para enviar la información al DANE Central, se utiliza la herramienta Swin que genera un archivo comprimido asignándole un nombre, que indique la investigación, ciudad y fecha a que corresponde la información contenida; luego se copia al servidor destinado para el proceso de transmisión, utilizando el protocolo FTP en la carpeta asignada para ello y confirmar inmediatamente que la información está en dicho servidor, se envía mediante correo electrónico.
De igual forma, en el DANE Central se realizan las copias de respaldo necesarias y se aplican los planes de contingencia que garanticen el normal funcionamiento del operativo.
NORMAS DE VALIDACIÓN Y CONSISTENCIA
Validación de rangos de acuerdo con la estructura de las preguntas. Cuándo la pregunta tiene predefinidos las opciones de respuesta, es necesario controlar las opciones a mostrar dadas las restricciones que existen sobre unicidad o valor máximo posible de ocurrencia.
Validación de los universos. A este proceso lo definen tres aspectos: el primero, cuando la pregunta define un flujo o salto dependiendo de la opción; el segundo cuando los datos de la vivienda se toman una sola vez, así exista más de un hogar; el tercero, cuando se define en el universo según la edad de la persona residente en el hogar.
Para algunas variables relacionadas con la aplicación de conceptos básicos de la Gran Encuesta Integrada de Hogares que son determinantes en la calidad de la estructura de la información, el DMC permite que el entrevistador confirme la respuesta que da el entrevistado. Estas variables son: Número de hogares en la vivienda; nombres y apellidos; sexo; edad; parentesco; y todas las variables relacionadas con valores de los diferentes formularios.
En el diseño del programa se garantiza que en la misma pantalla se muestren el capítulo que está relacionada con las variables como las diferentes preguntas que por su alta correlación debe controlarse su consistencia.
Los anteriores aspectos hacen parte del documento "Especificaciones de normas técnicas de validación y consistencia" que tienen de forma detallada cada una de las preguntas de los formularios.
VERIFICACIÓN DE LA CONSISTENCIA INTERNA DE LOS DATOS Y AJUSTES
El proceso para controlar e identificar los datos faltantes, inválidos o inconsistentes se lleva a cabo mediante el análisis de la variable "Incompleta" que toma valor 0 cuando la encuesta se encuentra completa y se puede utilizar directamente de la base de datos, y toma valor 1 cuando la encuesta debe ser revisada por datos faltantes inválidos o inconsistentes.
IMPUTACIÓN Y/O AJUSTES DE COBERTURA
El procesamiento es centralizado por DANE Central, e inicia desde el momento en que las Direcciones Territoriales envían la información; los datos son transmitidos por FTP (File Transfer Protocol) y posteriormente cargados en la base de datos Oracle.
En esta operación estadística no se realiza el proceso de imputación, cuando los miembros de los hogares se niegan a responder la encuesta, esta no respuesta es ajustada con los factores de expansión.
ANÁLISIS ESTADÍSTICO
Los principales indicadores que se utilizan en el análisis estadístico de los resultados son:
Cobertura de viviendas: se obtiene de cruzar la información de viviendas iniciales seleccionadas, contra viviendas finales encontradas.
Cobertura de hogares: se obtiene de cruzar la información del total de encuestas completas contra el total de hogares encontrados.
Calidad de la recolección: se obtiene de identificar el número de errores cometidos durante la recolección.
Errores e inconsistencias: se obtiene de la realización de diversas pruebas que ayudan a constatar que los cálculos estén bien hechos y que los datos sean coherentes.
Alarmas: se obtienen al hacer una búsqueda de datos que se salgan de los estándares, como: alto número de viviendas vacantes, alto número de rechazos, bajo promedio de personas, entre otros.
Informe de cobertura campo vs Sistemas: se obtiene de cruzar la información que las sedes y subsedes envían al DANE Central en los resúmenes de cobertura sobre viviendas, hogares y personas encontradas, contra la información que es transmitida al área de sistemas.
Indicador de puntualidad: busca garantizar que la información enviada por las sedes y subsedes sea oportuna.
Tasa de respuesta: se obtiene al medir en número de encuestas efectivas respecto a las esperadas. El objetivo de este indicador es identificar el grado de eficacia en el que se encuentra la investigación con respecto al proceso operativo de recolección.
Para garantizar la calidad de la información es necesario tener en cuenta las siguientes normas:
El personal de campo y oficina, a saber: recolectores y supervisores, ha de ser evaluado periódicamente.
Por lo menos dos veces a la semana, el líder de la GEIH en cada ciudad debe hacer una reunión con el personal de campo para solucionar casos especiales, analizar el desarrollo del proyecto en cuanto a cobertura, no respuesta, cartografía, manejo de la muestra, etc.
Los recolectores deben ser rotados de supervisor y de zonas de la ciudad.
Mensualmente, el líder de la GEIH de cada ciudad debe enviar al DANE Central un informe de la justificación de la variación de las tasas de mercado laboral según formato establecido.
Las cargas de trabajo deben ser evacuadas en su totalidad en la semana respectiva, y por ningún motivo dejar trabajo de recolección para la semana siguiente.
El personal de campo debe tomar obligatoriamente un día de descanso a la semana, según convenga, para el desarrollo óptimo del operativo.
En cada ciudad se debe conformar un “Comité Técnico de la Gran Encuesta Integrada de Hogares”. Este comité tendrá como funciones principales hacer seguimiento, evaluar los aspectos metodológicos y operativos de la encuesta y producir las recomendaciones que considere pertinentes, las cuales deben ser enviadas al DANE Central junto con el informe mensual.
ANÁLISIS DE CONTEXTO
Este procedimiento está orientado al análisis tanto de la consistencia interna de los datos como del comportamiento del mercado laboral y su relación con otras variables macroeconómicas que sirvan de base para la formulación, el seguimiento y la evaluación de políticas.
Para realizar el análisis de contexto se llevan a cabo diferentes tipos de análisis como son:
El análisis descriptivo ayuda a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos, intervalos de confianza y estadísticas de tendencia y dispersión.
Se analiza en la muestra la estructura de los indicadores por dominios de estudio a partir de la distribución de frecuencias, y se detectan posibles inconsistencias y valores atípicos. Se verifica la cobertura a nivel de segmento, viviendas, hogares y persona, y se observa la distribución de la pérdida de muestra para realizar los respectivos ajustes de la no respuesta.
El análisis inferencial tiene como objetivo realizar la estimación de la muestra a la población objetivo. En este proceso se aplican los factores de expansión y se revisa la inferencia a la población objetivo establecido para los correspondientes dominios de estudio.
Se verifica que los ajustes del factor de expansión no generen sesgos en las estimaciones, y que sus errores muéstrales sean aceptables de acuerdo con los parámetros establecidos por dominios de estudio.
El secretario técnico de la GEIH, el coordinador de Temática Social, el director de Metodología y Producción Estadística, el subdirector y el director del DANE revisan la consistencia de la información sobre los principales indicadores de mercado laboral IML y posteriormente se elaboran y organizan otros productos como son el boletín de prensa y la presentación de resultados. En este proceso se realiza análisis comparativos y se analiza la consistencia interna de la información frente a otras variables económicas.
Temática Social analiza el dato por divulgar frente al mismo periodo del año inmediatamente anterior y respecto a otros periodos, y los de las demás variables según conceptos de fuerza de trabajo.
COEFICIENTE DE VARIACIÓN
Para medir la magnitud de la variabilidad de la distribución muestral del estimador, denominado error muestral, se usan el error estándar y el coeficiente de variación.
El coeficiente de variación se define como la relación porcentual del error estándar o raíz cuadrada de la varianza del estimador y el estimador, multiplicado por 100.
El valor de este coeficiente, expresado en porcentaje, permite evaluar la calidad de un procedimiento de estimación.
Departamento Administrativo Nacional de Estadística - DANE
Departamento Administrativo Nacional de Estadística
http://formularios.dane.gov.co/Anda_4_1/index.php/catalog/427/get_microdata
Costo: Ninguno
Name | Affiliation | URL | |
---|---|---|---|
Departamento Administrativo Nacional de Estadística | Gobierno Nacional | www.dane.gov.co | dane@dane.gov.co |
Is signing of a confidentiality declaration required? | Confidentiality declaration text |
---|---|
yes | Ley 79 de 1993 Artículo 5: Los datos suministrados al Departamento Administrativo Nacional de Estadística DANE, en el desarrollo de los censos y encuestas, no podrán darse a conocer al público ni a las entidades u organismos oficiales, ni a las autoridades públicas, sino únicamente en resúmenes numéricos, que no hagan posible deducir de ellos información alguna de carácter individual que pudiera utilizarse para fines comerciales, de tributación fiscal, de investigación judicial o cualquier otro diferente del propiamente estadístico. |
El acceso a los microdatos anonimizados de uso público es de carácter gratuito y estará disponible en la página Web del DANE.
El acceso a los microdatos anonimizados por licencia, cuando requiera procesamientos adicionales, podrá tener un costo que será definido mediante acto administrativo.
Para más información acerca de la difusión de información estadística, consultar:
http://www.dane.gov.co/files/acerca/Normatividad/Ley79_1993.pdf
http://www.dane.gov.co/files/acerca/Normatividad/Resolucion1503_2011.pdf
El uso de estos datos debe ser reconocido mediante una citación que incluya:
La identificación del investigador principal
El título de la encuesta (incluyendo el país, el acrónimo y el año de aplicación)
El número de referencia de la encuesta
La fuente y la fecha de descarga
Ejemplo:
Departamento Administrativo Nacional de Estadística - DANE. Colombia, Gran Encuesta Integrada de Hogares (GEIH) 2016, Ref. COL_2016_GEIH_v01_M. Dataset downloaded from [url] on [date]
El usuario de los datos reconoce que el recolector original de los datos, el distribuidor autorizado de los datos, y la entidad que apoya financieramente no son reponsables por el uso o interpretaciones realizadas por terceros.
Name | Affiliation | URL | |
---|---|---|---|
Geovanni Alexander Portilla | Profesional especializado - GEIH | gaportillac@dane.gov.co | Coordinador - GEIH |
Hilda Patricia Ramirez Gonzalez | Profesional especializado - GEIH | pramirezg@dane.gov.co | Documentador |
contacto@dane.gov.co | DANE | contacto@dane.gov.co | http://www.dane.gov.co/index.php/contactenos |