Fundación iS+D | ismasd@isdfundacion.org | +34 91 630 09 58

Blog

21 Jul 2021

Los preliminares de la investigación social cuantitativa

¡Saludos, investigadores e investigadoras sociales! Volvemos con una nueva entrada de la serie SPSS e investigación cuantitativa del Blog de la Fundación iS+D de la mano de Inmaculada Rodríguez Moreno y Sergio González Pérez, sociólogos/as, investigadores/as sociales y socios/as fundadores/as de ICS INGENIA INVESTIGACIÓN SOCIAL.

Además, si te interesa conocer más sobre los diferentes programas de investigación que existen, no dudes en echar un vistazo a la serie Software de investigación de nuestro Blog.

Los preliminares de la investigación social cuantitativa

Como sociólogos/as con cierto recorrido en el campo cuantitativo, y como docentes en diversos cursos con el programa estadístico SPSS, siempre se nos pone de manifiesto la misma controversia a la hora de abordar las diferentes etapas de la investigación social cuantitativa, y es la relativa importancia que se le dan a las etapas anteriores al análisis de los datos.

Ciertamente podríamos calificar como etapa “estrella” a la labor de analizar e interpretar los datos recopilados, en donde el investigador o investigadora principal vierte toda su experiencia, su conocimiento sobre la técnica estadística, la temática, así como su creatividad a la hora de interpretar los datos, siendo capaz de obtener unas conclusiones. Pero, reconociendo que puede ser la fase más motivadora y en la que se materializan los objetivos propuestos, se suele cometer el error de considerar menos importantes, casi preliminares, las etapas anteriores, cuando todas ellas son fundamentales para poder realizar un análisis de calidad.

No queriéndonos extender demasiado explicando cuales son todas estas etapas de la investigación cuantitativa, nos vamos a detener en una de ellas, que no por considerarse –normalmente– la más tediosa no resulta igual de esencial; hablamos de la correcta depuración de la base de datos y su preparación para el análisis.

Cuando hablamos de preliminares, nos referimos a algo que es introductorio de otra cosa más importante, y precisamente así es como se le suele considerar la depuración de la base de datos. Por ejemplo, desde nuestra experiencia como docentes, nuestros/as estudiantes están desando aprender técnicas de análisis: bivariadas, multivariables, pruebas estadísticas… Y pasan con cierta resignación una parte tan esencial como es la preparación de los datos. Es entonces cuando les lanzamos la siguiente pregunta: ¿podemos obtener un análisis de calidad si la base de datos cuenta con fallos de grabación o las variables no están correctamente depuradas y recodificadas? La respuesta es no.

El problema sucede igual en una investigación cuando la persona que realiza el depurado es totalmente ajena a los objetivos de la investigación, al tipo de análisis se va realizar o a los resultados que se pretenden conseguir.

Pondremos un ejemplo fácil: en un estudio eminentemente descriptivo, para hacer referencia a porcentajes de respuesta, la depuración suele ser más laxa, pues no se hace necesario invertir escalas y, en algunos casos, incluso no se elimina los “no sabe”, “no contesta”, ya que perfectamente ambas categorías pueden entrar en los porcentajes descritos si así lo desea el/la analista; con eliminar posibles fallos de grabación o datos que no aportan información es suficiente. Pero todo cambia si vamos a realizar alguna operación matemática tan recurrente como puede ser calcular una media aritmética o la desviación típica, o queremos realizar alguna prueba estadística como chi-cuadrado. En estos casos, el no ordenar bien las escalas o no prescindir en el análisis de los “no sabe”, “no contesta”, echarían por tierra todos los resultados.

La investigación, de alguna manera, es circular en algunas fases y no debemos darlas por cerradas demasiado pronto.

¿Nos imaginamos calcular una media de edad en donde el “no contesta” se haya codificado como 999 y no lo hayamos depurado?, ¿o calcular una media de satisfacción cuando el código numérico más alto de la escala se asocia con la menor satisfacción posible (una escala de 1 al 10 donde 1 es totalmente satisfecho y 10 totalmente insatisfecho)? En el primer caso nos darían datos totalmente erróneos, y en el segundo, sería una media difícilmente interpretable.

Yendo más allá, si queremos una preparación más elaborada de la base de datos no solamente nos quedaremos en desestimar aquellos datos que no nos sirven para el análisis, sino que modificaremos las propias variables con el objetivo de llegar a los fines que perseguimos. Volviendo sobre la edad, o también la escala ideológica (esta última suele estar codificada de 1 a 10 siendo 1 la Extrema izquierda y 10 la Extrema derecha), para que estas variables sean más operativas se suelen agrupar. En este caso el/la investigador/a no puede hacer una agrupación sin sentido, sino que buscará realizar grupos internamente homogéneos, pero heterogéneos en comparación con otros grupos, para saber si ciertas ideologías o ciertos hábitos de vida asociados a la edad tienen la clave a la hora de explicar un comportamiento.

Si queremos ser rigurosos en la investigación y ofrecer resultados de calidad, se ha de mostrar sistematicidad en todas sus fases.

Imaginemos meter dentro de un mismo grupo a personas de ideologías muy dispares o personas que, a juzgar por su edad, pueden tener estilos de vida totalmente diferentes (haberse independizado o ser dependiente de los/as padres/madres, estar estudiando o en edad de trabajar…). Si esta agrupación no se hace en base a uno o varios criterios, el cruce de estas variables no nos dará ningún resultado válido.

No está de más añadir, para ir terminado, que la depuración y, sobre todo, las recodificaciones, no debemos darlas nunca por cerradas, siempre podemos volver a la variable original a buscar respuestas, a hacer una recodificación diferente, a pensar de qué manera podemos transformarla para que pierda el menor número de casos y sea lo más representativa posible de la población, o para que las diferencias entre los grupos conformados sean las más grandes posible. La investigación, de alguna manera, es circular en algunas fases y no debemos darlas por cerradas demasiado pronto.

En resumen, se suele cometer el error de considerar la depuración y recodificación de las variables como una tarea preliminar de la investigación a la que no se le da la importancia adecuada. En términos arquitectónicos, no cabría realizar los cimientos de una casa de una manera descuidada y rápida por el simple hecho de que es mucho más estético pintar las paredes de colores bonitos. Daría igual lo moderna que hubiera quedado la casa, tendría errores de base y lo más seguro es que se derrumbara o salieran grietas. En la investigación social pasa igual.

El informe de resultados es la fase visible del proceso, pero si queremos ser rigurosos en la investigación, ofrecer resultados de calidad, y no solo resultados, y, por supuesto, contribuir a que la investigación social sea verdaderamente científica, se ha de mostrar sistematicidad en todas sus fases.

·························

Referencias

Alvira, F. (1983). «Perspectiva cualitativa-perspectiva cuantitativa en la metodología sociológica» en Reis: Revista española de investigaciones sociológicas, Nº 22, págs. 53-76

Hernández Sampieri, R., Fernández Collado, C. y Baptista Lucio, M. P (2010). Metodología de la investigación (5ª Ed.). México: McGraw

Hill Cea D’Ancona, M. A. (1996). Metodología cuantitativa. Estrategias y técnicas de investigación social. Madrid: Síntesis.

       

Inmaculada Rodríguez Moreno y Sergio González Pérez
Sociólogos/as y Socios/as fundadores/as de ICS INGENIA INVESTIGACIÓN SOCIAL
Investigadores/as Asociados/as de la Fundación iS+D

¿Quieres aprender a utilizar SPSS?

Tablas de contingencia y Estadístico Chi-Cuadrado… Análisis factorial… Análisis de conglomerados… Análisis de regresión lineal y múltilple…

Conoce nuestro Curso Online «Análisis de Datos Cuantitativos con SPSS»

Más información



Deja un Comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.