PROYECTO PARTE 2

 PROYECTO PARTE 2


    La finalidad de este blog es describir los conocimientos adquiridos en la materia de Estadística I, haciendo y describiendo algunos ejercicios relacionados a la Estadística Descriptiva. Para este proyecto se retomará la información y ejercicios que se hicieron en el Proyecto Parte 1 y se irá detallando cada paso que se hizo durante esa actividad anterior.

En el Proyecto anterior se trabajó con los datos recopilados de la Entidad Financiera Bank America, en la cual se desplegaba la información en una tabla que indicaba las 5 variables utilizadas, la de Sexo, Tipo de Contrato, Salario Anual (dólares), Experiencia Laboral (meses) y Meses desde el Contrato.






A) Se recopiló la información de 40 individuos en donde en el primer ejercicio se clasificaban las variables en cualitativa y cuantitativa.

 


Dentro de las variables cualitativas se colocó a las de Sexo y Tipo de Contrato que sólo ofrecen información descriptiva, pero no datos numéricos, caso contrario de las variables cuantitativas donde se colocaron la Experiencia Laboral (meses), el Salario Anual (dólares) y Meses desde el Contrato. Son continuas porque cuentan con un número ilimitado de valores.


B) Se estudió una distribución de frecuencias absolutas y relativas para los datos de la variable salario anual. Se presentan los resultados mediante el uso de tablas y gráficas de barras. De igual manera, se hizo el cálculo de los Intervalos y la Amplitud.



Se clasificó a los individuos en su rango correspondiente, notando que el total de la frecuencia absoluta (fi) era de 40 indiviuos. Luego se calculó la frecuencia relativa (hi) en la que tomamos los datos de cada frecuencia absoluta y los dividimos entre el total, por ejemplo, del Intervalo $10,000 - $19,000 contamos con 2 de frecuencia absoluta (fi) y lo dividimos entre el total de la fi:

hi = 2 / 40 = 0.05

Al final, los datos de la hi se suman y el total siempre debe ser 1. Así mismo se sacó el porcentaje en donde se tomó la frecuencia relativa y se multiplicó por 100:
% = 0.05*100 = 5%
Así mismo, el total del porcentaje debe ser de 100%.



En la amplitud traté de usar el valor más alto y el más bajo de la tabla de la Entidad Financiera, pero al ver que el resultado de 7339.167 dificultaba y entorpecía la distribución de frecuencias, decidí tomar valores más discretos (cerrados) como 70,000 y 10,000 para emplear una distribución más armónica.





Se presentaron dos gráficas de barras en donde se muestra que la fi y hi más alta fue la del intervalo $20,000 - $29,000.



C) Otro ejercicio que se hizo en el Proyecto Parte 1, fue el cálculo de las medidas de Tendencia Central. Se usó la variable de Salario Anual (dólares), se determinó la media, la mediana y la moda, y se mostraron los datos mediante el uso de una gráfica de barras.



En este ejercicio coloqué los datos de las variable Salario Anual, tomando el orden en que venía representado en la tabla, y también se muestran los datos nuevamente en una segunda tabla, pero ahora con los datos de menor a mayor para representar de mejor manera el análisis de la mediana y la moda.



En las tablas fui indicando algunos datos subrayados en colores para ir indicando que tipo de medida de tendencia central se usó.

En la media se tomaron los datos de los 40 individuos, se sumaron y luego se dividió entre 40.

 x = 1,308,170 / 40 = $32,704.25

En la moda el valor que más se repite es el de $21,000

Mo = $21,900

En la mediana, habían dos individuos que estaban en la mediana, eran el 20 y 21 de los 40, por lo que se sumaron los dos datos y se dividieron entre 2 para obtener la mediana.

Me = (30,730+31050) / 2 = $30,890



Aquí la gráfica de barras correspondiente de las medidas de tendencia central.


D) En este ejercicio se tomó la variable de Tipo de Contrato y se determinaron las frecuencias absolutas, relativas y acumuladas. También en este ejercicio se nos preguntó sobre qué medida de tendencia central se usaría en este tipo de variable.


Este tipo de variable es cualitativo, por lo que la dstribución de frecuencias se hará en base a los 3 tipos de datos ofrecidos por los 40 individuos (indefinido, temporal y anual). 



En la variable de tipos de contratos, se determinó la frecuencia absoluta de los datos, resultando en una frecuencia absoluta de 16, tanto en Indefinido como en Anual y una frecuencia absoluta de 8 en Temporal, para un total de 40.

En la frecuencia relativa se tomaron cada una de las frecuencias absolutas y se divieron entre el total, por lo que las fórmulas y resultados se presentarían de la siguiente manera:

hi = 16 / 40 = 0.4        hi = 16 / 40 = 0.4        hi = 8 / 40 = 0.2

Se obtuvo el respectivo porcentaje de la hi:

% = 0.4*100 = 40%        % = 0.2*100 = 20%


En la Frecuencia Acumulada (Fi), se van tomando los valores de la frecuencia absoluta y se van acumulando hasta al llegar al total, que en este caso, es de 40:

Fi = 16 + 16 = 32        Fi = 32 + 8 = 40

Lo mismo aplica con la Frecuencia Relativa Acumulada en el que se van tomando los datos de las frecuencias relativas y se van acumulando:

Hi = 0.4 + 0.4 = 0.8        Hi = 0.8 + 0.2 = 1


Aquí se presenta la gráfica de barras de la Rrecuencia Relativa como venía indicado en el Proyecto Parte 1.




La variable Tipo de Contrato, al ser una variable cualitativa, la única medida de tendencia central que se utilizó fue la Moda. En este caso se indicó que es bimodal, ya que se cuenta con dos valores que comparten la misma frecuencia del valor 16.


E) En este ejercicio se elaboró una diagrama de tallo y hojas de la variable Experiencia Laboral (meses). Aquí decidí utilizar 2 diagramas, siendo uno más extenso que el otro, asimismo mostraré los datos de la variable, de menor a mayor valor.



Aquí vienen los datos de la variable mostrados como viene indicado en la table de la Entidad Financiera y también se acomodaron de menor a mayor para facilitar la comprensión de la elaboración del diagrama de Tallo y Hojas.




En el diagrama de Tallo y Hojas decidí usar dos tablas, una en la que la información expresada se basaba en los datos descritos en el ejercicio, y otra tabla más extensa en donde se colocan los dígitos de los tallos pero no las hojas, puesto que esas cifras no venían en la variable de Experiencia Laboral.
Este diagrama muestra los datos cuantitativos de una manera gráfica en la que se toma el último dígito a la derecha de las cifras para que vayan conformando las hojas, mientras que los demás dígitos irán formando los tallos. Se tiene que ir colocando los datos de menor a mayor para poder realizar el diagrama.



















Comentarios