Análisis de datos: 4 pasos

Este artículo arroja luz sobre los cuatro pasos principales involucrados en el análisis de datos. Los pasos son: 1. Establecimiento de categorías o clasificación de datos 2. Codificación 3. Tabulación 4. Análisis estadístico de datos.

Paso # 1. Establecimiento de Categorías o Clasificación de Datos :

La investigación en ciencias sociales generalmente involucra una gran variedad de respuestas a diferentes tipos de preguntas o estímulos presentados a la muestra o "población" de los encuestados. Estas respuestas pueden ser verbales o no verbales.

Claramente, si se deben organizar un gran número de tipos diferentes de respuestas de manera que se puedan usar para responder las preguntas de investigación, o para dibujar generalizaciones, se deben agrupar en un número limitado de categorías o clases. Para tomar un ejemplo simple, suponga que se hace una pregunta a los encuestados: "¿Está usted a favor del examen de tipo objetivo para estudiantes universitarios?"

Las respuestas de los encuestados posiblemente se pueden agrupar en cuatro categorías amplias, como en:

(a) Respuestas de “Sí”.

(b) Respuestas "No".

(d) "No contesté".

Supongamos que otra pregunta formulada a los encuestados es: "¿A qué clase social diría que pertenece?"

Las respuestas de los encuestados se pueden agrupar en las siguientes categorías:

(a) Clase alta.

(b) La clase media.

(d) "No puedo decir".

(e) Otras respuestas (como, "No creo en las clases sociales". "No importa dónde pertenezco", etc.).

Un requisito previo para tomar una decisión sobre las categorías que se instituirán para agrupar los datos es que el investigador debe seleccionar algún principio apropiado de clasificación. La pregunta o hipótesis de investigación, si se ha formulado alguna, proporciona una buena base lógica para seleccionar un principio de clasificación.

Supongamos que la hipótesis en un estudio es:

"Los estudiantes que hayan tenido una experiencia de estudiar en escuelas mixtas tendrán una actitud más favorable hacia el sistema de coeducación".

Aquí, obviamente, uno de los principios de clasificación de respuestas será si el encuestado ha tenido o no experiencia previa en el sistema coeducativo. Otra base para clasificar las respuestas sería el grado de favorecimiento o falta de favor expresado hacia el sistema coeducativo. También se pueden invocar otras bases de clasificación, dependiendo de qué otras asociaciones se deben analizar.

La primera base de clasificación daría dos categorías de respuestas:

(a) Dijo que tenían una experiencia previa de coeducación;

(b) Dijo que no tenían ninguna experiencia previa de coeducación.

Estas dos categorías contienen dentro de sí toda la gama de respuestas (asumiendo, por supuesto, que ningún encuestado se negó a responder o no respondió o dio alguna 'otra respuesta'. Ninguna de las respuestas en el supuesto anterior está más allá del alcance de estas dos categorías. Estas dos categorías juntas forman lo que se conoce como un "conjunto de categorías".

Un 'conjunto de categorías' debe cumplir con los siguientes tres requisitos:

(1) El conjunto de categorías debe derivarse de un principio clasificatorio único. Este requisito es bastante comprensible porque si se emplea más de un principio de clasificación, una sola respuesta puede ser reclamada por más de una categoría.

Así, las categorías no serán independientes unas de otras. Por ejemplo, si tenemos tres categorías que constituyen el conjunto de categorías, por ejemplo, hombre, mujer, niño, que se derivan obviamente de dos principios de clasificación, a saber, sexo y edad respectivamente, entonces cualquier caso (encuestado) puede estar cubierto por más de una categoría en el conjunto de categorías.

Por ejemplo, un niño también puede ser un hombre, una mujer también puede ser un niño y así sucesivamente. El principio de clasificación puede, sin embargo, ser uno compuesto, es decir, compuesto de dos o más criterios, es decir, niño varón, niña, etc.

(2) El segundo requisito es que el conjunto de categorías debe ser exhaustivo, es decir, debería ser posible colocar cada respuesta en una de las categorías dentro del conjunto. 'No hay respuesta' debe omitirse por falta de una categoría apropiada en el conjunto que la incluirá.

Cualquiera que sea la respuesta, debe estar cubierta por alguna categoría dentro del conjunto. Por ejemplo, si se clasificara a las personas del mundo en función de su población racial, el conjunto de categorías constituido por tres categorías, a saber, (a) Caucasoide, (b) Negroid y (c) Mongoloid, claramente no sería ser un conjunto de categorías exhaustivo de acuerdo con el requisito descrito anteriormente, ya que no contiene una categoría única en la que muchos de los indígenas (y algunos otros) puedan encontrar un lugar.

(3) El último requisito es un corolario del primero, a saber, que las categorías dentro del conjunto deben ser mutuamente excluyentes; es decir, las categorías no deben solaparse. Por lo tanto, ninguna respuesta será reclamada por más de una categoría dentro del conjunto.

El establecimiento de categorías para datos característicos de las ciencias sociales no siempre es una tarea fácil. El principio de clasificación a menudo puede ser uno compuesto (a diferencia de simple, unitario). La tarea de extraer todas las categorías mutuamente excluyentes que juntas agotarían el universo total de respuestas, sobre la base de un principio clasificatorio compuesto, es de hecho una exigente y exigente imaginación.

En tales casos, es de gran ayuda reducir los atributos que constituyen el principio compuesto de clasificación a símbolos o códigos y extraerlos mediante la técnica de expansión booleana, toda la gama de categorías posibles que abarca el conjunto de categorías.

Tomemos un ejemplo muy simple. Supongamos que el investigador considera tres atributos, por ejemplo, sexo (hombre de mujer), edad (menor de 21 años o mayor de 21 años) y estado civil (casado o soltero) como constituyentes de su principio de clasificación único (pero compuesto) y los reduce a símbolos como en:

Hombre = S, mujer = S̅

Menores de 21 años de edad = A, Mayores de 21 años de edad = A̅

Casado = M, Soltero = M̅

El conjunto de categorías resultante será la totalidad exhaustiva que consiste en todas las combinaciones posibles de estos tres atributos que comprenden el principio de clasificación de compuestos. Las combinaciones posibles, es decir, las categorías, serán 2 ³ = 2 x 2 x 2 = 8 en número.

Estos son los siguientes:

(1) SAM

(2) S̅ AM

(3) S A̅ M

(4) SA M̅

(5) S̅ A̅ M

(6) S̅ A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

Al decodificar, es decir, al sustituir las connotaciones reales de los símbolos, obtenemos ocho categorías mutuamente excluyentes que se leen como:

(1) Hombres menores de 21 años y casados.

(2) Mujeres menores de 21 años y casadas.

(3) Hombres mayores de 21 años y casados.

(4) Hombres menores de 21 años y solteros.

(5) Mujeres mayores de 21 años y casadas.

(6) Mujeres menores de 21 años y solteras.

(7) Hombres mayores de 21 años y solteros.

(8) Mujeres mayores de 21 años y solteras.

De la misma manera, si el principio de clasificación compuesto está constituido por cuatro atributos, tendremos 2 ⁴ = 2x 2 x 2 x 2, es decir, 16 categorías mutuamente excluyentes. Ahora debería estar claro cómo este método de establecer categorías, en lugar de la intuición, hace que la tarea de clasificación sea mucho más fácil y a toda prueba.

Es obvio que el establecimiento de un conjunto de categorías es relativamente fácil si las respuestas obtenidas de los encuestados durante el estudio son bastante simples y claras, por lo que las categorías pueden definirse fácilmente de manera inequívoca. Aunque esta es la forma en que siempre se deben definir las categorías, la tarea es mucho más difícil con ciertos tipos de contenido.

Supongamos que en un estudio el investigador preguntó a los estudiantes varones: "¿Cómo diría usted que se sienten las alumnas acerca de estudiar en la misma universidad con estudiantes varones como usted?" Es probable que las respuestas varíen desde indicaciones de actitudes altamente favorables (imputadas a las estudiantes ) A las imputaciones de actitudes altamente desfavorables. Supongamos que estas son algunas de las respuestas recibidas de los encuestados.

(1) Les gusta la idea.

(2) 'No creo que les importe'.

(3) 'Piensan que los baja'.

(4) No entro en contacto con ellos, así que no lo sabría.

(5) 'Ellos lo odian'.

(6) "A algunos de ellos les gusta, a otros no".

(7) 'Quieren estudiar aquí para poder decir que no son menos que los hombres'.

(8) "En una universidad exclusivamente para mujeres, extrañarían mucho, por lo que parece que les gusta estar aquí".

Con respecto a las respuestas anteriores, no sería difícil desarrollar un conjunto simple de categorías basadas en el principio clasificatorio de actitudes favorables y desfavorables imputadas a las alumnas. Pero encontramos que las respuestas favorables y desfavorables transmiten diferentes matices de significados.

El estudiante masculino que dice: "Ellos (las alumnas) quieren estudiar aquí para poder decir que no son menos que los hombres" transmite algo diferente de uno que dice: "Les gusta la idea". Del mismo modo, el estudiante masculino que dice, "Creen que les baja" es otra vez decir algo diferente de quien dice: "Lo odian".

Así, vemos que dos atributos, es decir:

(1) Imputación de actitudes favorables o desfavorables hacia las niñas, y

(2) La referencia explícita o la ausencia de referencia a beneficios o daños que apoyan actitudes favorables o desfavorables son dos componentes significativos de un principio compuesto de clasificación.

Las categorías en el conjunto de categorías de acuerdo con los requisitos ideales de un conjunto de categorías discutido anteriormente, pueden indicarse como en:

(1) Actitud favorable imputada a las alumnas, explicada en términos de los beneficios que obtienen al estudiar en la misma universidad con estudiantes varones (por ejemplo, séptima y octava respuestas).

(2) Actitud favorable imputada a las niñas sin una referencia explícita a los beneficios obtenidos de estudiar en el mismo colegio con hombres (por ejemplo, la declaración No. 1).

(3) Actitud neutral o acomodaticia imputada a las niñas (por ejemplo, declaración n. ° 1).

(4) Actitud desfavorable imputada a las niñas, explicada en términos de desventajas (beneficios negativos) que derivan de estudiar en la misma universidad con estudiantes varones.

(5) Actitud desfavorable imputada a las niñas sin referencia explícita a las desventajas o pérdidas resultantes de la coeducación (por ejemplo, declaración n. ° 5)

(6) Otras respuestas, no puedo decir, no hay respuesta, no sé (por ejemplo, declaración n. 4).

La ilustración anterior daría una idea de cuán compleja puede ser una clasificación en ciencias sociales. Trabajar con categorías tan complejas requiere considerable cuidado y esfuerzo en la clasificación. Incluso cuando las categorías se han elaborado con cuidado, su uso presentará mayores problemas que el uso de categorías definidas de manera más precisa y precisa.

Si un estudiante de sexo masculino en el ejemplo anterior dice, "les gusta estar bien aquí, saben por qué" es una pregunta discutible si esta afirmación implica un beneficio o no. Por lo tanto, deberían establecerse reglas adicionales para tratar tales respuestas.

Debe decirse, incluso a costa de una cierta repetición, que aunque en principio es posible usar muchos atributos de respuestas para la formulación de conjuntos de categorías, en la práctica, esto es a menudo innecesario, no económico y no recompensado, ya que no todos estos principios clasificatorios Tener en cuenta el objetivo del estudio.

Pasemos ahora a considerar el problema de seleccionar un principio clasificatorio para categorizar material no estructurado (es decir, información recopilada por herramientas no estructuradas).

En los estudios que utilizan instrumentos estructurados para recopilar datos relevantes para preguntas de investigación o hipótesis claramente formuladas, el principio apropiado para la clasificación de las respuestas está claramente establecido por la naturaleza de las preguntas y las respuestas seguras.

Sin embargo, al trabajar con material o datos no estructurados, el primer problema es llegar a decisiones sobre qué aspectos del material deben clasificarse, es decir, qué principios de clasificación deben usarse para establecer categorías.

En los estudios exploratorios que, por definición, no comienzan con un problema bien formulado o una hipótesis explícita, es difícil llegar a una decisión sobre los principios clasificatorios. En el momento de la recopilación de datos, el investigador no sabe qué aspectos pueden resultar más importantes.

Por lo tanto, debe recopilar una gran cantidad de datos de tipo no estructurado. En el curso del análisis, el investigador se enfrenta al problema de tratar no solo con materiales no estructurados, sino también con un gran volumen de ellos.

Cuando se analizan los datos de un estudio exploratorio, es aconsejable desarrollar hipótesis de trabajo que produzcan principios de clasificación satisfactorios factibles. El investigador debe leer detenidamente todo su material, estando siempre alerta a las pistas latentes en los datos. Estas pistas a menudo se obtienen mediante el estudio de materiales sobre temas o situaciones que contrastan con los que él está estudiando.

Tal estudio ayuda al investigador a ver las diferencias importantes entre las dos situaciones. Otro procedimiento para obtener tales pistas es juntar los casos de uno en grupos que parecen tener un parentesco cercano o que parecen estar juntos y luego preguntarse qué lo llevó a sentir que los casos que colocó en un solo grupo son iguales.

Otro enfoque más que puede estimular pistas para la formulación de hipótesis de trabajo es observar asuntos que parezcan sorprendentes en vista de ciertas expectativas teóricas o sentido común y luego buscar posibles explicaciones de los fenómenos sorprendentes o no anticipados.

Sin embargo, debe recordarse que incluso con hipótesis claras, el análisis de material no estructurado presenta problemas especiales. En primer lugar, siempre existe la posibilidad de que falte información sobre un punto determinado en algunos de los documentos.

También existe la posibilidad de que una gran cantidad de material no tenga una relación directa con la hipótesis. Además, existe el problema de decidir el tamaño de las unidades del material al que se aplicarán las categorías.

Por ejemplo, si un investigador utilizaba registros de casos conservados por agencias de asistencia social, debe decidir qué unidad (por ejemplo, clientes, declaraciones, actos, trabajadores sociales, sesiones con el cliente o el registro completo) es la más adecuada para proporcionar respuestas a sus preguntas. Preguntas específicas de investigación.

Paso # 2. Codificación:

La codificación consiste en asignar símbolos, generalmente números a cada respuesta que cae en una clase predeterminada. En otras palabras, la codificación puede considerarse como el proceso de clasificación necesario para la tabulación posterior. A través de la codificación, los datos sin procesar se transforman en símbolos que pueden tabularse y contarse.

Esta transformación, sin embargo, no es automática, implica un gran juicio por parte del codificador. "Codificador" es el título oficial de una persona a la que se le asigna la responsabilidad de proporcionar códigos específicos a las respuestas después de que las notas grabadas hayan sido enviadas a la oficina.

Debe recordarse, sin embargo, que a menudo la decisión sobre qué respuesta debe asignarse a un código en particular, es realizada por una persona distinta de la que recibe la designación oficial de "codificador".

La codificación puede tener lugar en tres puntos diferentes de un estudio en cada uno de los cuales, diferentes tipos de personas pueden ser responsables de asignar códigos a los datos en bruto. En muchos estudios, se le puede pedir al encuestado mismo que asigne códigos a su propia reacción o situación.

Esto es cierto para muchas preguntas de tipo encuesta y de opción múltiple. Por ejemplo, cuando se le pide al encuestado que indique a cuál de las clases (por ejemplo, grupos de ingresos) pertenece, por ejemplo, (a) por debajo de 3000 rupias pm, (b) Rs. 3001 / - a Rs. 6000 / - pm, (c) Rs. 6001 / - a Rs. 9000 / - pm, (d) Rs. 9001 / y más arriba, el encuestado codifica su respuesta simplemente marcando su posición entre las alternativas dadas.

El segundo punto en el que puede tener lugar la codificación es cuando, en el curso de la recopilación de datos, el entrevistador u observador clasifica las respuestas de los sujetos. Esto es lo que se hace cuando un entrevistador u observador emplea una escala de calificación para describir la respuesta o el comportamiento de una persona.

El punto final en el que puede tener lugar la codificación es, por supuesto, cuando los datos en bruto no categorizados (recopilados especialmente a través de instrumentos no estructurados de recolección de datos) se depositan en la oficina del proyecto y los codificadores oficiales aquí ejercen su juicio para asignar códigos particulares a determinados códigos. Respuestas o datos.

Comparemos brevemente y contrastemos las ventajas y desventajas de la codificación de los codificadores oficiales en la oficina y la codificación de los entrevistadores u observadores realizada en el curso de la recolección de datos en el campo.

Los entrevistadores u observadores están en posición de notar la situación, así como el comportamiento del individuo. Por lo tanto, tienen más información en la que basar sus juicios con respecto a la categorización adecuada de las respuestas en comparación con los codificadores que trabajan sobre la base de registros escritos que pueden no dar una idea completa sobre el significado real de la respuesta.

Otra ventaja de la codificación por parte de los recolectores de datos es que se puede ahorrar tiempo y trabajo.

Por el contrario, la codificación en la oficina por codificadores tiene ciertas ventajas de señal. La codificación de los datos complejos que requieren tiempo para la reflexión debe ser realizada por los encargados de la oficina. En el lugar, los juicios de codificación hechos por los recolectores de datos pueden no ser tan exigentes como los juicios hechos con más tiempo para la deliberación.

El juicio de los recolectores de datos puede estar influido por muchos factores, a saber, las apariencias del encuestado, los acentos y las respuestas a preguntas anteriores, gestos, etc. En segundo lugar, existe el peligro de que los recolectores de datos carezcan de uniformidad al codificar las respuestas.

Por lo tanto, la comparabilidad de los datos obtenidos de un gran número de encuestados se ve obstaculizada. En tercer lugar, los entrevistadores u observadores pueden desarrollar sus propios marcos de referencia personales con respecto al material que están codificando. Esto tendería a hacer que sus categorizaciones no sean confiables, después de un tiempo. Un marco de referencia común es más fácil de obtener y mantener en la operación de codificación de oficina que en el campo.

Discutamos algunos de los problemas importantes relacionados con la confiabilidad en la codificación. Hay muchas cosas que pueden operar para hacer que el juicio de los codificadores no sea confiable. Algunos de los factores pueden surgir de los datos a categorizar, algunos de la naturaleza de las categorías que deben aplicarse y otros pueden emanar de los codificadores mismos.

Ahora consideraremos brevemente algunos de estos factores y las formas en que se pueden proteger.

Muchas de las dificultades que ocurren en la codificación resultan de la insuficiencia de los datos. Con frecuencia, los datos no proporcionan suficiente información relevante para una codificación confiable. Esto podría deberse a procedimientos de recopilación de datos deficientes e inadecuados. Estas dificultades, sin embargo, generalmente se pueden superar mediante una cuidadosa edición de los datos. El proceso que consiste en examinar los datos para mejorar su calidad para la codificación conocida como edición.

Cuando el recolector de datos entrega su material a la oficina del proyecto, existe la posibilidad de eliminar muchas dificultades potenciales de codificación. Un examen cuidadoso de los datos tan pronto como se recopilan y, si es necesario, un interrogatorio sistemático de los entrevistadores u observadores ayuda a evitar muchos problemas de codificación.

La edición no solo ayuda a evitar problemas de codificación posteriores, sino que también puede mejorar sustancialmente la calidad de la recopilación de datos señalando dónde los entrevistadores u observadores pueden haber malinterpretado las instrucciones o no haber registrado los datos con suficiente detalle.

De hecho, la edición debe realizarse en el curso de la prueba previa de la entrevista o el programa de observación que capacita a los entrevistadores u observadores y, de hecho, durante todo el período de recolección de datos. La edición en la oficina de proyectos ayuda a eliminar los problemas de codificación.

Por lo tanto, la edición se debe hacer mientras los entrevistadores u observadores pueden ponerse fácilmente a disposición para ser interrogados. La edición implica un escrutinio cuidadoso de la entrevista o los horarios de observación.

Estos deben ser revisados para:

(1) Integridad: los editores deben ver que todos los elementos estén debidamente rellenados. Un espacio en blanco junto a una pregunta en un programa de entrevistas, por ejemplo, puede significar 'sin respuesta' o 'No sé' o rechazo a respuesta o inaplicabilidad de la pregunta, o la pregunta ha sido omitida por la supervisión, etc.

(2) El editor debe examinar la entrevista u horarios de observación para averiguar si el programador puede comprender fácilmente la escritura a mano, los símbolos o códigos asignados por el entrevistador u observador.

Siempre es recomendable verificar la legibilidad cuando se entrega el material y, si es necesario, hacer que el entrevistador u observador lo vuelva a escribir. Si esto no se hace, la codificación puede quedar bloqueada en una etapa en la que los entrevistadores u observadores no pueden ser fácilmente retirados para ser interrogados.

(3) La edición también implica examinar los horarios para la comprensibilidad. A menudo sucede que una respuesta registrada es perfectamente comprensible para el entrevistador u observador, pero no es inteligible para el codificador porque el codificador no conoce el contexto de comportamiento o respuesta. El cuestionamiento sistemático de los recolectores de datos despejará la confusión y las ambigüedades y mejorará considerablemente la calidad de la codificación.

(4) Los datos también deben examinarse o verificarse para saber si hay ciertas inconsistencias con respecto a las respuestas registradas en el cronograma.

Por ejemplo, un encuestado podría haber dicho en respuesta a una de las preguntas anteriores que nunca había conocido a personas de un grupo en particular y, sin embargo, en respuesta a una pregunta posterior, podría haber dicho algo acerca de visitar a ciertas personas de este grupo en el curso de su rondas Si tal es el caso, hay una necesidad obvia de investigar esta inconsistencia, y aclararla a través de preguntas a los recolectores de datos.

(5) También es necesario verificar el grado de uniformidad con el que los entrevistadores han seguido las instrucciones para recopilar y registrar datos. La codificación puede verse obstaculizada si una respuesta se registra en unidades distintas a las especificadas en las instrucciones.

(6) Cabe señalar que algunas respuestas pueden parecer simplemente irrelevantes para los fines de la investigación. Es probable que esto suceda si una pregunta no está claramente resuelta o no se formula de manera inteligente. Por lo tanto, los datos deben examinarse cuidadosamente con el fin de separar las respuestas inapropiadas de las apropiadas.

El valor de la categorización de los datos depende naturalmente de la solidez de las categorías empleadas. Es necesario que las categorías, además de ser relevantes para el propósito de la investigación, también se definan desde un punto de vista conceptual.

La codificación no será confiable si las categorías no están definidas claramente en términos de indicadores que son aplicables a los datos, aquí y ahora. En la práctica, las categorías se definen mediante ejemplos a partir de los datos disponibles. Es muy útil si las ilustraciones de datos muestran no solo qué tipo de respuestas tipifican la categoría, sino que también ayudan a distinguir el límite entre categorías aparentemente similares.

Es obvio que la calidad de la codificación se ve afectada por la competencia de los codificadores. La formación de codificadores es, por lo tanto, un paso importante en cualquier estudio.

La formación de los codificadores puede proceder por las siguientes etapas:

En primer lugar, los diversos códigos se explican a la habilidad (codificadores) y se ilustran con ejemplos de los datos que se deben clasificar.

En segundo lugar, todos los aprendices-codificadores luego practican en una muestra de los datos, los codificadores discuten los problemas que surgen como un grupo con el supervisor para desarrollar procedimientos y definiciones comunes.

En tercer lugar, las pistas resultantes de la codificación de la práctica se utilizan para efectuar revisiones en las categorías para que sean más aplicables al material y para poner por escrito los procedimientos y definiciones que han evolucionado durante la codificación preliminar.

En cuarto lugar, en algún momento del período de práctica en el que surgen relativamente pocos problemas nuevos, los programadores trabajan en una parte idéntica de los datos sin consultarse entre sí o con el supervisor. La consistencia o la confiabilidad de la codificación se calcula para determinar si es posible comenzar a codificar en serio.

Dependiendo de los resultados de las verificaciones de confiabilidad o consistencia, se puede decidir eliminar las categorías que parecen demasiado poco confiables o dedicar más tiempo a entrenar a los codificadores o eliminar a los codificadores que son más inconsistentes, etc.

Por último, se realizan comprobaciones periódicas para garantizar que los programadores no se descuiden con más experiencia o que no desarrollen métodos idiosincrásicos personales para manejar nuevos problemas en el material. Para garantizar la uniformidad, la decisión que se tome después de que haya comenzado la codificación debe comunicarse a todos los codificadores sin demora.

Obviamente, la consistencia y la conveniencia con las que se asigna un tipo de respuesta a una categoría dada tendrá una importancia importante en el resultado del análisis, por lo tanto, es importante verificar la confiabilidad de la codificación y aumentar el acuerdo entre los codificadores. como sea posible.

Por supuesto, es difícil establecer un nivel de confiabilidad dado como el estándar a alcanzar. Diferentes tipos de materiales presentan diferentes grados de dificultad para lograr confiabilidad. Como regla general, cuanto más estructurado esté el material a codificar y, por lo tanto, más sencillas sean las categorías utilizadas, mayor será la confiabilidad.

Cabe señalar que los tipos de códigos utilizados en un estudio diferirán según si los datos se tabularán por máquina o a mano. Si los datos se ordenan manualmente, una descripción de palabra de las clases es satisfactoria.

También se pueden usar abreviaturas o letras de alpha-bates, por ejemplo, 'Y para Sí, ' N 'para No, etc. La tabulación de máquinas, por otro lado, requiere que las clases se expresen en símbolos numéricos, ya que las máquinas solo pueden ser alimentadas con datos numéricos.

La tabulación mecánica requiere el uso de tarjetas perforadas. Sin embargo, el número de clases diferentes que se pueden mostrar en la tarjeta perforada es limitado. En cualquier caso, todos los códigos utilizados para la tabulación de la máquina también pueden usarse para la tabulación manual.

Si los códigos se colocan en tarjetas perforadas de las cuales dos tamaños son de uso general, es decir, las tarjetas de 80 columnas y las tarjetas de 54 columnas, es conveniente usar diez en menos clases / categorías para la mayoría de los elementos de información o respuesta.

La tarjeta perforada contiene 10 espacios numerados y una X e Y en cada columna, lo que hace un total de 12 códigos que se pueden usar. Es un procedimiento bastante complicado para obtener más de un tipo de elemento en una columna. Por ejemplo, los códigos de natividad y edad no se pueden marcar en una sola columna a menos que solo se utilicen seis grupos de edad para cada uno.

Paso # 3. Tabulación:

La tabulación es una parte del proceso técnico en el análisis estadístico de los datos. El elemento esencial en la tabulación es el resumen de los resultados en forma de tablas estadísticas.

Solo cuando los datos en bruto se dividen en grupos y se hace un conteo de la cantidad de casos que se encuentran en estos diversos grupos, es posible que el investigador determine qué significan sus resultados y transmita sus hallazgos al consumidor en una forma que pueda ser fácilmente entendido

La tabulación, naturalmente, depende del establecimiento de categorías para los datos sin procesar, la edición y la codificación de la respuesta (perforación y ejecución de las tarjetas a través de máquinas para la tabulación mecánica y clasificación y conteo para la tabulación manual).

Los investigadores experimentados generalmente desarrollan planes de tabulación casi al mismo tiempo que elaboran o construyen los instrumentos de recolección de datos y hacen planes de muestreo. Los investigadores inexpertos rara vez se preocupan por los planes de tabulación hasta que se hayan recopilado los datos. Por supuesto, es imposible para el investigador prever el rango completo de tabulación que se deseará posteriormente.

Debe estar lo suficientemente familiarizado con su problema de investigación o con el sujeto de la investigación para poder elaborar tablas que proporcionen respuestas a las preguntas que dieron lugar al estudio. El investigador debe poder preparar planes de tabulación adecuados si utiliza los hallazgos de las investigaciones anteriores que tienen elementos en común con el plan para el cual se están elaborando los planes.

En estudios exploratorios, un procedimiento mejor y más seguro es probar el instrumento de recolección de datos en una muestra de población del tipo que se cubriría en el estudio final. De esta manera, generalmente se pueden obtener algunas pistas con respecto a qué tipo de tabulación sería significativa.

La tabulación, puede hacerse enteramente por métodos manuales; esto se conoce como tabulación de la mano. Alternativamente, se puede hacer por métodos mecánicos que utilizan máquinas automáticas y de energía rápida para la mayor parte de los datos, el proceso se conoce como tabulación mecánica.

El investigador debe decidir antes de dibujar planes detallados de tabulación para su estudio, qué método de tabulación usaría. Esta decisión se basará en varias consideraciones tales como costo, tiempo, personal, etc.

Tanto la tabulación manual como los procedimientos de tabulación mecánica tienen sus respectivos méritos y limitaciones. La alerta del investigador a estos méritos y deméritos es una mejor manera de decidir qué método sería adecuado para su problema.

Revisaremos brevemente los méritos de estos dos métodos de tabulación:

(1) La tabulación mecánica implica mucho trabajo administrativo y operaciones especializadas. Por supuesto, facilita la velocidad, pero la velocidad no siempre es una compensación adecuada para el trabajo administrativo adicional.

(2) Si el número y los tipos de tablas deseados no se deciden antes de comenzar el trabajo de tabulación, La tabulación de la máquina puede ser más conveniente. Pero, si se considera que la tabulación manual es eficiente, el orden en que se realizarían los distintos tipos y conteos se determina antes de la tabulación.

(3) Una ventaja importante de la tabulación de máquinas es que facilita las clasificaciones cruzadas. En estudios a gran escala en los que muchas variables deben estar correlacionadas o clasificadas en forma cruzada, la tabulación de la máquina es razonablemente preferible.

Es por esta razón que la tabulación mecánica se utiliza en estudios que requieren muchas correlaciones entre variables. Pero, si el número total de encuestados es pequeño, un recuento manual de ellos de acuerdo con el principio de clasificación cruzada puede ser relativamente económico.

(4) Cuando hay una gran cantidad de información codificada y se requieren varias tarjetas perforadas para cada caso, puede ser preferible la tabulación manual.

(5) Si se desea mantener los datos en una forma lista para una nueva tabulación en un aviso relativamente corto, las tarjetas perforadas suelen ser útiles. La tabulación mecánica es útil para estudios o encuestas periódicas en los que se requiere que se recopile el mismo tipo de información a intervalos frecuentes.

(6) Es menos probable que el proceso de clasificación y conteo produzca errores si se realiza a máquina que si se hace a mano. Por supuesto, los errores pueden surgir en la tabulación de la máquina y, cuando lo hacen, a menudo son muy difíciles de identificar y verificar.

Cualquier error descubierto en las etapas de codificación, edición o trabajo de campo de la encuesta puede retrasar el trabajo de tabulación de la máquina. Por lo tanto, a menudo es deseable proceder con la tabulación manual junto con el trabajo de campo.

(7) El costo de las operaciones de tabulación es una preocupación importante del investigador. La tabulación de la máquina a menudo implica un costo mucho mayor, ya que la mayoría de las tarjetas perforadas, los cargos por perforación y verificación, los cargos de la máquina por la clasificación y las máquinas de tabulación y los gastos en la contratación de servicios especializados de tipos específicos de operadores de máquinas a menudo suman mucho más que los que están involucrados. tabulación.

(8) Otra consideración importante es el tiempo. En la tabulación mecánica, el trabajo de tabulación como tal se realiza en muy poco tiempo, pero las etapas preparatorias, así como la capacitación, supervisión y posible no disponibilidad de ciertos tipos de máquinas en alquiler que resultan en la dislocación del trabajo, inevitablemente contribuyen al desperdicio. de tiempo.

(9) Las consideraciones de conveniencia difícilmente pueden ser ignoradas. Si la tabulación mecánica exige el envío de datos sin procesar a alguna oficina lejos de la oficina del proyecto, se producen inconvenientes relacionados con el embalaje, el transporte, etc.

(10) Por último, la cantidad de material de comentarios que se registrará y analizará también puede afectar la elección de los métodos de tabulación. En algunas encuestas de opinión, los comentarios literales de los informantes son importantes. La tarjeta de código de mano utilizada solo en la tabulación manual puede proporcionar espacio para dichos comentarios o observaciones.

Las máquinas que manejan el trabajo de tabulación son de muchos tipos. Los desarrollos en este campo han sido extremadamente rápidos durante los últimos años. Algunas máquinas simplemente clasifican y cuentan las tarjetas, otras clasifican, cuentan e imprimen los resultados, otras están equipadas para realizar operaciones estadísticas o cálculos más complicados.

Estas últimas máquinas son extremadamente complejas y deben ser programadas para una operación determinada por un especialista en la línea. Una tabla es una muestra de los datos numéricos organizados sistemáticamente en columnas etiquetadas (verticales) y filas (horizontales).

Una tabla simple o elemental indica los recuentos simples de las frecuencias con las que aparecen las distintas categorías en cada conjunto en los datos, por ejemplo, el número de personas en la muestra que han asistido a la escuela secundaria pero no han pasado, el número de personas que han asistido Colegio pero no graduado y así sucesivamente. La tabla que se muestra a continuación simplemente señala las frecuencias de las visitas de cincuenta encuestados al cine.

En la investigación, a menudo nos interesa descubrir la correlación entre dos o más variables, por ejemplo, educación e ingreso y fertilidad, tablas simples (ilustradas arriba) que muestran la distribución de frecuencia de los encuestados con respecto a una sola característica, por ejemplo, educación o ingreso O la fertilidad, no nos ayudan a ver la relación entre dos o más variables.

La forma de ver la relación es mediante la preparación de tablas cruzadas o tablas de desglose. Dichas tablas hacen posible la agrupación de casos que ocurren conjuntamente en dos o más categorías, por ejemplo, la tabulación del número de casos que son altos en educación, bajos en ingresos y tienen entre 2 y 3 hijos, o el número de casos que son Bajo en educación, bajo en ingresos y con entre 4 y 5 niños y así sucesivamente. La forma más elemental de tabulación cruzada con la que los estudiantes están familiarizados es el horario de la universidad.

Supongamos que un investigador quiere ver la relación entre tres variables, a saber, ocupación, ingreso y fertilidad. Debe emplear un esquema de tabulación que permita todas las combinaciones posibles de las diferentes categorías de estas tres variables.

La tabulación cruzada de los datos en una muestra hipotética de 100 personas puede presentarse como en:

En la tabla anterior, hemos indicado el número de hijos en filas. Esta variable de fertilidad se ha dividido en cinco categorías, es decir, sin problema, 1 a 2 problemas, 3 a 4, 5 a 6, 7 y más. Así que en el margen de la mano izquierda, tenemos estas 5 categorías de fertilidad. Hemos indicado el ingreso de 100 encuestados en columnas.

La variable de ingresos se ha subdividido en cinco categorías, es decir, por debajo de Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Así, tenemos cinco columnas correspondientes a estas categorías.

Nuevamente, dado que tenemos una variable más, es decir, la ocupación a acomodar, las columnas de ingresos se han subdividido en dos partes correspondientes a las dos categorías en que se han dividido las ocupaciones, es decir, la ocupación de cuello blanco y la ocupación de cuello azul .

Así, tenemos diez columnas verticales, correspondientes al ingreso y la ocupación. El número de filas horizontales que tenemos para las categorías de la variable de fertilidad es cinco. Por lo tanto, tenemos diez columnas cruzadas por cinco filas que forman el cuerpo de la tabla.

La intersección de las columnas y filas ha efectuado 50 (cincuenta) celdas o cuadros. Cada una de estas cajas o celdas alberga un número particular de casos que son diferentes de aquellos en otras celdas, ya sea con respecto a los ingresos u ocupación, en la fertilidad o en cualquiera de estos dos o en todos estos. Vamos a leer la tabla para tener una idea de lo que representa.

De la muestra total de 100 casos, hay 25 que tienen entre 3 y 4 problemas. De estos 25, leyendo desde el lado izquierdo, 5 personas (con entre 3 y 4 niños) tienen ingresos por debajo de Rs.200 / - y trabajan en ocupaciones de cuello blanco.

Dos personas (con entre 3 y 4 niños) tienen ingresos por debajo de Rs.200 y están empleadas en ocupaciones de cuello azul. Tomemos ahora la segunda fila. Del total de encuestados, 38 tienen entre 1 y 2 niños. 11 (en la séptima célula) que tienen entre 1 y 2 niños son del grupo de ingresos Rs.601 a Rs.800 y están empleados en la ocupación de cuello blanco.

Este ejercicio debe dejar muy claro que la tabulación cruzada es un paso esencial en el descubrimiento o prueba de las relaciones entre las variables contenidas en los datos.

La tabulación es un medio para presentar los datos de forma resumida de manera que facilite los cálculos estadísticos requeridos. Sin embargo, los datos pueden presentarse de otras maneras, es decir, en lugar de presentarlos en forma tabular, el investigador puede presentarlos en forma de diagramas o gráficas. Dichas representaciones esquemáticas o gráficas tienen el mérito de ser inteligibles para un lector con menos conocimientos.

Pero sufren la limitación de que no son tan útiles como base para los cálculos estadísticos. Pasemos ahora a discutir la siguiente operación, es decir, el análisis estadístico de los datos. La tabulación es un requisito previo o un primer paso en esta dirección.

Paso # 4. Análisis estadístico de los datos :

En la investigación, no nos preocupamos por cada encuestado individual. El propósito de la investigación es más amplio que esto. Es decir, deseamos saber mucho más que simplemente que un encuestado dado, por ejemplo, tiene una actitud extremadamente favorable hacia el desarme y que otro encuestado tiene actitudes moderadamente desfavorables hacia el mismo tema. Pero esta información no es suficiente.

Las investigaciones de ciencias sociales generalmente están dirigidas a proporcionar información sobre una población particular de encuestados, principalmente a través de una muestra. A la muestra de la totalidad se les pueden hacer algunas preguntas relacionadas con el problema de nuestro estudio, o se las puede someter a algún tipo de observación.

Supongamos que le hemos pedido a una muestra de mil estudiantes universitarios que estudian en clases de "posgrado" una serie de preguntas con el fin de obtener información sobre sus hábitos de estudio. Nuestra investigación, por lo tanto, estaría dirigida a proporcionar información sobre la "población" de estudiantes "postgraduados" de los cuales mil casos son una muestra.

Como paso necesario para caracterizar esta "población", deberíamos describir o resumir la información sobre los hábitos de estudio que hemos obtenido en la muestra de los mismos. La tabulación es solo una parte de este paso. Además, debemos estimar la confiabilidad de las generalizaciones de la 'población' a partir de los datos obtenidos. Los métodos estadísticos son útiles para cumplir ambos fines.