Los salarios en México y las malas estadísticas del INEGI

Update: Inicialmente mis cálculos no consideraban el factor de ponderación que usa el INEGI. Los números han sido actualizados para reflejarlo.

Yo crecí en México en lo que consideré la clase media, pero después viví en E.U.A y en Europa, por lo que tal vez mi concepción de las diferentes clases dejó de estar apegada a la realidad. Yo pensaba que un salario mensual de $20,000 (una cantidad módica en países del primer mundo) se consideraría clase media, y cuando una persona me dijo que el salario promedio era $8,000 no lo creí, y así comenzó la tarea de buscar los salarios de las diferentes clases en México que resultó no ser tan fácil como parecía.

ENIGH

El INEGI realizó una encuesta (Encuesta Nacional de Ingresos y Gastos de los Hogares) que supuestamente contiene estos datos, sin embargo, estos son los resultados:

I $1,674
II $3,033
III $3,977
IV $4,900
V $5,959
VI $7,183
VII $8,800
VIII $11,313
IX $16,012
X $42,120
* Trimestral.

En teoría ahí está toda la información y la tarea está hecha, sin embargo hay un problema al tratar de entender estos números. La tabla se titula “ingreso corriente total promedio trimestral per cápita en deciles de personas”. Ahí vemos los diez grupos, pero un decil se define como: “cualquiera de los nueve valores que dividen los datos ordenados en diez partes iguales”; nueve valores, y en la tabla hay diez, esos números no son deciles.

Básicamente, la tabla es completamente inútil. Si una persona gana $10,000 trimestrales, ¿Está en el grupo VII o VIII? El número que necesitamos para saber eso no está en esta tabla.

A mano

Afortunadamente el INEGI provee los datos originales, y gracias a mis habilidades de programación pude hacer las manipulaciones necesarias para sacar los datos de interés. Desafortunadamente en el proceso noté discrepancias en las tablas del INEGI, así que tuve que hacer los cálculos por mi cuenta.

10% $835
20% $1,180
30% $1,478
40% $1,798
50% $2,182
60% $2,632
70% $3,306
80% $4,315
90% $6,753

Estos números sí son deciles, y es fácil saber a qué grupo perteneces. Si tu ingreso mensual es de $3,000 pesos (y no tienes familia), eso significa que ganas más que el 70% de la población (grupo VII). Curiosamente es fácil ver la media (50%), que es $2,182, es decir: 50% de la población gana menos de $2,182, 50% gana más.

De forma similar podemos dividir la población en tres grupos:

baja menos de $1,579
media de $1,579 a $3,033
alta más de $3,033

Parece difícil de creer, pero estos números se pueden comprobar fácilmente. El tamaño de la muestra del INEGI son 19479 personas, con un filtro para ver cuántas personas ganan más de $3,033, el resultado es 8040 (41.28%), sin embargo al usar el factor de expansión el resultado es 33.32% (una tercera parte).

Cabe mencionar que los números son per cápita. Es decir, si ganas $8,000 pesos y mantienes a una familia de 4, cada persona se considera que percibe un ingreso de $2,000 pesos. Más detalles abajo.

Los números para la clase súper rica son:

91% $7,156
92% $7,663
93% $8,325
94% $9,130
95% $10,065
96% $11,516
97% $13,159
98% $16,475
99% $22,763

Promedios

Los promedios pintan un panorama muy diferente. Por ejemplo; la clase alta es más de $3,033, sin embargo hay mucha diferencia entre un ingreso de $4,000 y $400,000 pesos, y ambos están en el mismo grupo. Al promediar a toda la gente de éste grupo, el resultado cambia mucho. El promedio de la clase alta (top %33) es de $7,262, el promedio del top 90% es de $14,040, y el promedio del top %1 es de $42,910.

Por eso son peligrosos los promedios. A pesar de que el promedio de todo el país es de $3,499, el promedio del bottom 99% es de $3,101, pero al juntarlo con el top %1 de $42,911 se eleva a $3,499 (3101 * 0.99 + 42910 * 0.01).

Ingresos por trabajo

Hay muchos detalles de estos números, pero en general es el ingreso de todo el hogar: salarios, utilidades, rentas, transferencias, y estimado de alquiler, dividido por el número de integrantes.

Si tomamos en cuenta sólo el ingreso por trabajo de las personas ocupadas, el resultado es más prometedor.

10% $782
20% $1,545
30% $2,201
40% $2,872
50% $3,563
60% $4,303
70% $5,324
80% $7,008
90% $10,492

En tres grupos:

33% $2,413
66% $4,937

Y el top 10%:

91% $11,041
92% $11,848
93% $12,739
94% $13,960
95% $15,473
96% $16,988
97% $19,565
98% $24,508
99% $32,983

 

Desigualdad

Existe un número que se usa para medir la desigualdad de forma rápida, el coeficiente Gini. Aunque no es perfecto, es el más utilizado, y no deja de ser útil. Una sociedad perfectamente igual tendría un valor de 0%, mientras que una totalmente desigual 100%. Alemania, un país con mucha igualdad social tiene un valor de 27%, Estados Unidos, conocido por su desigualdad, 45%. Según el INEGI México tiene un valor de 48%, pero según mis cálculos el valor es 49.70%. La diferencia se debe a que el INEGI usa sus promedios por decil (10 datos), mientras que yo uso todos los registros (19479 datos), por lo que mi cálculo es más preciso.

lorenz

Probablemente la forma más fácil de visualizar la increíble desigualdad que hay es graficando todos los ingresos de la muestra:

desigualdad

Errores del INEGI

Ya mencioné el hecho de que para empezar su tabla de deciles no contiene deciles,  contiene promedios de los diversos grupos, que como ya vimos los promedios son peligrosos por que pueden pintar las cosas más positivas de lo que son.

Además hay discrepancias muy curiosas. La misma tabla de ‘ingresos’ está en un formato “tradicional” y de “nueva construcción”.

folioviv foliohg numren clave ing_5
0860298316 1 01 P043 8000
0860298316 1 01 P071 8237
folioviv foliohg numren clave ing_5
0860298316 1 01 P043 8000
0860298316 1 01 P071 58237

Aquí vemos dos ingresos de una persona; P043 es un beneficio de PROCAMPO, P071 es la clave de negocios agrícolas. En una tabla dice que sacó $8,237 de negocios agrícolas, y en la otra $58,237. Parece ser un error de dedo (que cambia las cantidades drásticamente), pero por qué no comparan sus propias tablas?

Como éste tipo de errores parece haber muchos. Por ejemplo en la documentación de la variable ‘ing_cor’:

inc_cor: ingreso corriente
La suma de ing_cor y percep_tot

Eh? Para sacar ‘ing_cor’ necesito ‘ing_cor’?

Otro ejemplo son registros marcados como “indemnizaciones” (P034), que no parecen usarlos en ningún lado.

Todo indica que al INEGI le hace falta revisar su propia información.

Mapa de la muestra

Update: Mucha gente preguntó que de dónde sacaron las encuestas, aquí hay un mapa para visualizarlo. Por alguna extraña razón en el centro de Tabasco es donde tomaron más información. Se ve muy evidente que a el norte no le prestaron mucha atención.

Mapa

Conclusión

No queda más que aceptar que estamos mucho peor de lo que pensaba, no solo en cuestión de salarios, pero desigualdad, e incluso disponibilidad de la información. Si el organismo dedicado a proveer datos estadísticos no sabe ni lo que es un decil, realmente no se puede esperar mucho del futuro.

Nota: Estos números son confiables sólo si la muestra del INEGI es realmente aleatoria. Dado que ya detecté muchos errores en sus tablas, es posible que la muestra del INEGI también deje que desear. Desafortunadamente no hay mejores datos, así que hasta donde yo sé, estos son los números más confiables.

Método

Cualquier persona puede verificar los datos si le interesa. Todo el código se encuentra en GitHub, yo utilicé Linux, pero es posible correr Ruby en Windows también.

Advertisements

38 thoughts on “Los salarios en México y las malas estadísticas del INEGI

  1. Muy interesante. ¿Cómo podemos exigir que vuelvan a hacer bien el estudio? ¿No podría en teoría el INEGI hacer un muestreo absoluto de Hacienda? En teoría, éste muestreo no contempla la informalidad, ¿correcto?

  2. La muestra del INEGI incluye informalidad, el de SHCP no lo tendría. En teoría lo único que tiene que hacer el INEGI es arreglar los cálculos. Desafortunadamente la muestra parece estar sesgada al centro y sur. El INEGI podría sacar una segunda muestra del norte, y con esa segunda muestra se podría comprobar si hay un sesgo significativo.

  3. Totalmente sesgada tu información ,me causa gracia el párrafo donde dices “gracias a mis habilidades de programación”

  4. Muy buena investigación, no se necesita más que un par de presonas estudiadas para sacar estas estadisticas de manera decente. Hay gente muy capaz en algunas instituciones gubernamentales (espero), pero los que hicieron esta investigación o no les importó o les dió flojera entregar algo bien fundamentado. Ni en la escuela (algunas) te aceptan un trabajo asi. También por no contar el norte el sesgo es enorme, habría que incluso dividir el pais en dos y sacar promedios diferentes. Pero estas cosas no son “tan importantes”… ¿Cierto? Saludos y éxito.

  5. Hola, interesante el estudio. Gracias por dejar el código! Oye sólo una pregunta. Este estudio entonces va encontra de las cifras que se dan para el PIB per capita para México? Buscando en Google y Wikipedia, se reporta un ingreso promedio de 13085USD (https://en.wikipedia.org/wiki/List_of_countries_by_average_wage).

    13085*18 (USD/MXN) / 12 (meses) = 19627 pesos al mes….
    Supongo que la pregunta central aquí es cuál es la relación entre el salario promedio reportado en otras fuentes, y el reportado en este estudio?

  6. Que tal! Si el INEGI manejara los datos reales y a detalle, como lo hiciste tu Felipe, entonces tendría problemas con las personas pensantes, ya que por eso sacan números acumulados, de esa manera los que buscamos información tenemos que filtrarla para obtener resulados que, al igual que tu, no cuadra en comparación con datos de la UNAM, una muestra de ello es la medición del desempleo, ya que la situación real de personas desempleadas (dato del 2012!!) fluctúa en 8.7 millones de personas y no los 2.5 millones que la OCDE y el INEGI tienen contabilizado, esto es respaldado por el Centro de Análisis Multidisciplinario (CAM) de la UNAM, cito: “La forma en cómo el INEGI mide el desempleo es con una fórmula extraña, nada más mide los que perdieron el empleo en un mes contra los que adquirieron empleo el siguiente mes y eso es una medición que tiene el instituto, pero no es la tasa real de desempleo del país.(Mayoral, 2011).”
    Fuente:
    Hay 8.7 millones de desocupados y no 2.4, como reporta el INEGI. Oculta el gobierno las cifras reales del desempleo: estudio, Juan Carlos Miranda
    http://www.jornada.unam.mx/2012/04/12/economia/024n1eco
    Felicitaciones por tan buen aporte, saludos!

  7. Pingback: Porqué México | Innovación Audiovisual

  8. Gracias por tu análisis Felipe, estoy trabajando en una presentación sobe el tema para un grupo de estudiantes extranjeros y lo tomaré como parte de mi plática.

  9. Excelente análisis, pero como se basa en una encuesta y la gente tiende a mentir es complicado tomar decisiones en base a esta información.

    Revisando la ultima disponible de 2015, veo que hay una columna estim_alqu (estimación de alquiler) que se suma como ingreso y es la renta estimada que se pagaría por el hogar. No entiendo porqué se considera como un ingreso. Ese sólo concepto infla en 10% los ingresos corrientes.

    Otras dos columnas se suman al ingreso corriente: trans_hogar y trans_inst pero en la descripción indica que son gastos. La suma de estas dos infla el ingreso en 11% adicional.

    Finalmente si quitamos los “estímulos gubernamentales” y las remesas, el ingreso desciende 25% más en general.

    Asi que es claro que además de las deficiencias en la metodología estadística para calcular los deciles, los propios datos traen “errores” que aumentan artificialmente el ingreso.

  10. Claro. Deja mucho que desear la encuesta. Pero no hay absolutamente nada mejor para darse una idea de los ingresos en México, hasta donde yo sé.

  11. Oye Felipe, la tabla de deciles del INEGI de donde la sacaste? Los reportes que veo no coinciden con la información que pones. Saludos.

  12. @Fernando: está en la liga que puse: tabulados básicos: tabulados_enigh14_nvc.XLS, en la tabla 2.3 (INGRESO CORRIENTE TOTAL PROMEDIO TRIMESTRAL PER CÁPITA EN DECILES DE PERSONAS SEGÚN AÑO DE LEVANTAMIENTO Y SU COEFICIENTE DE GINI), la columna del 2014.

  13. Gracias, Felipe; aunque tu excelente ejercicio solo tuviera la utilidad inmediata que le hallé (motivar a mis estudiantes de Educación y otras carreras no matemáticas ni ingenieriles, a aprender estadística para que los engañen) ya tendrías motivos de orgullo, y la certeza de que el esfuerzo valió la pena

  14. corrijo mi post: Gracias, Felipe; aunque tu excelente ejercicio solo tuviera la utilidad inmediata que le hallé (motivar a mis estudiantes de Educación y otras carreras no matemáticas ni ingenieriles, a aprender estadística para que NO los engañen) ya tendrías motivos de orgullo, y la certeza de que el esfuerzo valió la pena

  15. Curiosamente este “anålisis” cojea de forma similar al estudio original que critica. En primer lugar no se menciona el año del estudio, no podemos saber a qué equivalen 20,000 pesos. Tiene además errores de redacción y de metodología. El estudio es de salarios, no de ingresos per capita, de tal forma que la cantidad de hijos no debe contar, de ser así no vamos a concer los salarios.
    No gané casi nada de la lectura de este estudio más allá de que el INEGI tiene errores en muchas áreas, incluido el hecho de que no saben reportar tablas de deciles.
    Cuando te dijeron que el salario promedio era de 8,000 y no lo creiste, ¿pensaste que era poco o mucho? No es clara tu postura ante este hecho. En fin, sigo sin conocer el salario del mexicano.
    Los promedios son por definición representaciones grupales, es fácil engañar con estadísticas, pero eso es problema de quien los presenta y de quien se quiere engañar. Conociendo los promedios y la desviación estándar es fácil imaginar la realidad. Sería imposible saber el salario de TODOS los mexicanos, eso sólo es interés de la Secretaria de Hacienda.

  16. @Alejandro Ese es el punto del artículo: mostrar que el INEGI tiene errores en muchas áreas. Y desafortunadamente los números que presenta la INEGI son los únicos que podemos usar para determinar los salarios promedio, si tú tienes números más útiles, cuáles son?

  17. Excelente estudio y análisis. Lo leeré nuevamente para tratar de comprenderlo a cabalidad. Felipe ¿Que rama del conocimiento estudiaste?

  18. No sé qué hiciste pero los datos de INEGI están bien y tú estás totalmente mal. Que no entiendas ni siquiera qué es un decil me lleva a ignorar el resto de tu nota. La metodología de muestreo que usa la ENIGH es sólida y está en documentos disponibles (hint para la siguiente vez que quieras usar mapas para “probar” cosas: se busca muestra de seres humanos, no de rocas). Toma un par de cursos o lee algunos libros de estadística o economía antes de seguir diciendo tonterías. Tus supuestas habilidades para programar no te sirven para entender lo más básico.

  19. No sabes estadística. Si eres ingeniero o si al menos te dijeron que terminaste Geografía 1 de secundaria, ¡reclámales! te engañaron.

    saludos.

    ¡ah! y revisa la densidad de población en México, no es que no hayan tomado en cuenta al norte… ¡NO HAY CIUDADES! es desierto ¿recuerdas? los puntos están el las poblaciones principales de los estados del Norte y las fronteras :l

    Osea, tampoco sabes geografía. Te sugiero revises todo o des de baja esta página, es una desinformación tremenda.

  20. Tus datos no demuestran absolutamente nada, además ni siquiera demuestras cual es tu metodología.

    El error más grande es cuando tomas los datos de los ingresos como salario. Te recomiendo que tomes la ENOE ahí si tienes un dato real de lo que es referente a salarios.

  21. Gracias por presentar los datos, son de gran ayude.

    Una pequeña sugerencia
    “Curiosamente es fácil ver la media” -> “Curiosamente es fácil ver la mediana”

  22. Gracias Felipe por el analisis! Fue de gran ayuda. Estoy por hacer un estudio que calcule la demanda de hogar usando los ingresos. Me encantaría qualquier tip que tengas! Saludos!

  23. Hola Felipe, esto me ayudó muchísimo. Estoy intentando hacer una comparación entra los ingresos de Mexico y los EEUU. Tienes algunas sugerencias?

  24. Felipe tus numeros estan equivocados. Yo tambien me habia dado cuenta de que los numeros del INEGI no siempre te pueden dar una idea clara de la situación. Pero viendo los datos que aportas veo que son totalmente erroneos, yo no se de donde sacas que en el 9no decil el salario promedio es de arriba de $10,000. si la situacion fuera como pinta tu estudio entonces el 99% de la poblacion estaria en situacion de pobreza.

  25. hi, could you please let me know what R package did you use to draw the map of Mexico ? Thanks!

  26. Los datos están ahí. Quieres que te apunte a 10 personas al azar en los registros del INEGI? Tú lo puedes ver por ti mismo.

  27. El artículo ha sido actualizado, por si alguien quiere echarle un vistazo. Además escribí más código para analizar los datos más eficientemente y lo subí a GitHub.

  28. Excelente trabajo Felipe! Espero que la labor trascienda en la dependencia para que tomen las acciones precisas.

    Por último, difiero que haya un sesgo hacia el sur. La densidad de población en el norte es menor, asi que tomar distintas ciudades en el norte es suficiente para representarlo con relativa corrrespondencia. Excepto Tabasco, ahí si hay muchos datos. Como que fue el estado piloto.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.