domingo, 26 de febrero de 2017

1 UNIDAD INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

1 UNIDAD INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL


ESTADÍSTICA



La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

1.1 BREVE HISTORIA DE LA ESTADISTICA


1.1 BREVE HISTORIA DE LA ESTADÍSTICA 


La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
  • Su origen empieza posiblemente en la isla de Cerdeña, donde existen monumentos prehistóricos pertenecientes a los Nuragas, las primeros habitantes de la isla; estos monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes de encontraban grabados toscos signos que han sido interpretados con mucha verosimilidad como muescas que servían para llevar la cuenta del ganado y la caza.
  • Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y los géneros vendidos o cambiados mediante trueque.
  • Los egipcios ya analizaban los datos de la población y la renta del país mucho antes de construir la pirámides.En los antiguos monumentos egipcios se encontraron interesantes documentos en que demuestran la sabia organización y administración de este pueblo; ellos llevaban cuenta de los movimientos poblacionales y continuamente hacían censos. Tal era su dedicación por llevar simpre una relación de todo que hasta tenían a la diosa Safnkit, diosa de los libros y las cuentas. Todo esto era hecho bajo la dirección del Faraón y fue a partir del año 3050 a.C.
  • En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Números, el censo que realizó Moisés después de la salida de Egipto. Textualmente dice: "Censo de las tribus: El día primero del segundo año después de la salida de Egipto, habló Yavpe a Moisés en el desierto de Sinaí en el tabernáculo de la reunión, diciendo: "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel. En el llibro bíblico Crónicas describe el bienestar material de las diversas tribus judías.
  • En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.
  • Posteriormente, hacia el año 500 a.C., se realizaron censos en Roma para conocer la población existente en aquel momento. Se erigió la figura del censor, cuya misión consistía en controlar el número de habitantes y su distribución por los distintos territorios.
  • En la Edad Media, en el año 762, Carlomagno ordenó la creación de un registro de todas sus propiedades, así como de los bienes de la iglesia.
  • Después de la conquista normanda de Inglaterra en 1.066, el rey Guillermo I, el Conquistador, elaboró un catastro que puede considerarse el primero de Europa.
  • Los Reyes Católicos ordenaron a Alonso de Quintanilla en 1.482 el recuento de fuegos (hogares) de las provincias de Castilla.
En 1.662 un mercader de lencería londinense, John Graunt, publicó un tratado con las observaciones políticas y naturales, donde Graunt pone de manifiesto las cifras brutas de nacimientos y defunciones ocurridas en Londres durante el periodo 1.604-1.661, así como las influencias que ejercían las causas naturales, sociales y políticas de dichos acontecimientos. Puede considerarse el primer trabajo estadístico serio sobre la población.
Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-1.662) ni de C. Huygens (1.629-1.695) sobre estos mismos temas. Un poco más tarde, el astrónomo Edmund Halley (1.656- 1.742) presenta la primera tabla de mortalidad que se puede considerar como base de los estudios contemporáneos. En dicho trabajo se intenta establecer el precio de las anualidades a satisfacer a las compañías de seguros. Es decir, en Londres y en París se estaban construyendo, casi de manera simultánea, las dos disciplinas que actualmente llamamos estadística y probabilidad.
En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la generalización del método para estudiar fenómenos de las ciencias naturales y sociales. Galton » (1.822-1.911) y Pearson (1.857-1936) se pueden considerar como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística inductiva.
Los fundamentos de la estadística actual y muchos de los métodos de inferencia son debidos a R. A. Fisher. Se intereso primeramente por la eugenesia, lo que le conduce, siguiendo los pasos de Galton a la investigación estadística, sus trabajos culminan con la publicación de la obra Métodos estadísticos para investigaciones. En el aparece la metodología estadística tal y como hoy la conocemos.
A partir de mediados del siglo XX comienza lo que podemos denominar la estadística moderna, uno de los factores determinantes es la aparición y popularización de los computadores. El centro de gravedad de la metodología estadística se empieza a desplazar técnicas de computación intensiva aplicadas a grandes masas de datos, y se empieza a considerar el método estadístico como un proceso iterativo de búsqueda del modelo ideal
Las aplicaciones en este periodo de la Estadística a la Economía conducen a una disciplina con contenido propio: la Econometría. La investigación estadística en problemas militares durante la segunda guerra mundial y los nuevos métodos de programación matemática, dan lugar a la Investigación Operativa

1.2 CONCEPTO DE ESTADISTICA


1.2 CONCEPTO DE ESTADÍSTICA 

La Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos. A menudo se llaman estadísticas a las listas de estos datos, cosa que crea una cierta ambigüedad, que no debería originarnos confusiones. La Estadística no son sólo los resultados de encuestas, ni el cálculo de unos porcentajes, la Estadística es un método científico que pretende sacar conclusiones a partir de unas observaciones hechas.

¿Cuándo empezó la Estadística? La Estadística actual es el resultado de la unión de dos disciplinas que evolucionaron de forma independiente hasta confluir en el siglo XIX: x el Cálculo de Probabilidades, que nació en el siglo XVII como la teoría matemática de los juegos de azar, x la “Estadística”, o ciencia del Estado, que estudia la descripción de datos, y que tiene unas raíces más antiguas, de hecho, tan antiguas como la humanidad (censos de población). La interacción de ambas líneas de pensamiento da lugar a la ciencia que estudia cómo obtener conclusiones de la investigación empírica mediante el uso de modelos matemáticos.

1.3 ESTADÍSTICA DESCRIPTIVA


1.3 ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva es la rama de las Matemáticas que recolecta, representa y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto.



La estadística descriptiva: se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.

1.4 ESTADÍSTICA INFERENCIAL



se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas demodelamiento incluyen anova, series de tiempo y minería de datos.
IMPORTANCIA DE LA ESTADISTICA INFERENCIAL 


La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de datos importantes para el estudio de situaciones que se presentan a diario y   permite dar respuesta a los problemas de una forma útil y significativa.
 La Estadística Inferencial se centra en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.

 En caso de que no sea factible realizar un estudio completo   por cuestiones de tiempo, recursos o costo, se puede calcular un tamaño de muestra para medir solo algunos elementos de la población, posteriormente se infiere que el resto de la población se comporta igual que la muestra tomada.

1.5 BREVE INTRODUCCIÓN A LA INFERENCIA ESTADISTICA


1.5 BREVE INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA


El principal objetivo de la Estadística es inferir o estimar características de una población que no es completamente observable (o no interesa observar en su totalidad) a través del análisis de una parte de ella a la que llamamos muestra. Las razones por las que generalmente se trabaja con muestras son principalmente:
- Económicas.
- Tiempo: si la población es muy grande llevaría tanto tiempo analizarla que incluso la característica de interés podría variar en ese período. Por ejemplo, la tasa de paro.

- Destrucción: la medición de cierta característica podría llevar a la destrucción del individuo. Por ejemplo, al estudiar la supervivencia de ciertos animales a un tratamiento.

1.6 TEORÍA DE DECISION EN ESTADISTICA

1.6 TEORÍA DE DECISIÓN


Estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se sirven de la inspección y los experimentos, se denominan teoría descriptiva de decisión; los estudios de la toma de decisiones racionales, que utilizan la lógica y la estadística, se llaman teoría preceptiva de decisión. Estos estudios se hacen más complicados cuando hay más de un individuo, cuando los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de los distintos resultados son desconocidas. La teoría de decisión comparte características con la teoría de juegos, aunque en la teoría de decisión el ‘adversario’ es la realidad en vez de otro jugador o jugadores.


Al hacer un análisis sobre esta teoría, y mirándola desde el punto de vista de un sistema, se puede decir que al tomar una decisión sobre un problema en particular, se debe tener en cuenta los puntos de dificultad que lo componen, para así empezar a estudiarlos uno a uno hasta obtener una solución que sea acorde a lo que se esta esperando obtener de este, y sino, buscar otras soluciones que se acomoden a lo deseado.


La teoría de decisión, no solamente se puede ver desde el punto de vista de un sistema, sino en general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que muchas personas piensan que la vida es como una de las teorías; La teoría del juego, que para poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de este, para que no surjan equivocaciones al empezar la partida.

1.7 COMPONENTES DE UNA INVESTIGACIÓN ESTADISTICA

1.7 COMPONENTES DE UNA INVESTIGACIÓN ESTADÍSTICA


El estudio estadístico de una situación con propósitos inferenciales se centra 
en dos conceptos fundamentales: población y muestra, los cuales serán 
definidos a continuación: 

Población. Es el conjunto formado por todos los valores posibles que puede
 asumir, la variable objeto de estudio. 
Así por ejemplo, en un estudio sobre la preferencia de los votantes en
 una elección presidencial, la población consiste en todas las respuestas de los
 votantes registrados. Pero el término no sólo está asociado a la colección de
 seres humanos u organismos vivos; y tenemos así que, si se va a hacer una 
investigación de las ventas anuales de los supermercados, entonces las ventas
 anuales de todos los supermercados constituyen así mismo la población. 

Es bueno tener en cuenta que el término población se interpreta de dos maneras 
cuando se hace un estudio estadístico, a saber: 

1. La interpretación propia en el Análisis Estadístico, que corresponde
 a la que hemos presentado anteriormente. 

2. Como el conjunto de objetos sobre los cuales actúa la variable considerada. 


Por tanto, no es extraño escuchar expresiones tales como, "se hizo un estudio 
de los niveles de ingreso de la población trabajadora colombiana", entendiéndose 
con ello que el elemento estadístico objeto de análisis fue el registro numérico
 de los ingresos. 

Muestra. Es cualquier subconjunto de la población, escogido al seguir ciertos 
criterios de selección. 
La muestra es el elemento básico sobre el cual se fundamenta la posterior
 inferencia acerca de la población de donde se ha tomado. Por ello, su 
escogencia y selección debe hacerse siguiendo ciertos procedimientos que son
 ampliamente tratados en la parte de la estadística llamada Teoría de muestreo. 

El concepto de muestra tiene también las dos connotaciones que hemos señalado 
para la población. 

Las características de una población se resumen para su estudio generalmente
 irá mediante lo que se denominan  parámetros; éstos a su vez se toman o consideran 
como valoresverdaderos de la característica estudiada. Por ejemplo, la proporción de 
todos los clientes que declaran cierta preferencia por una marca particular de un 
 producto dado, es un parámetro de la población de todos los clientes; es la
 verdadera proporción de la población. 
Igualmente, la media aritmética de las cuentas corrientes de los clientes
 de un banco determinado constituye un parámetro de la población de las cuentas 
de los clientes de ese banco. 

Cuando la característica de la población estudiada se reduce a una muestra el 
resumen de esa característica se hace mediante una esta (medida) o estadígrafo.
 Así por ejemplo. si se toman 100 de todos los posibles clientes y se les entrevista 
para ver si están a favor de una marca particular de un producto, estos 100 
clientes la constituyen una muestra.. Si hay 70 clientes que prefieren dicha marca 
entonces la proporción muestral será 0.70 y constituirá un  estadígrafo; de igual 
manera si se  escogen 1,000 cuentas del total de las cuentas comentes; 
las 1,000 observaciones conforman una muestra y el promedio aritmético de estas
 cuentas un estimador.  


La inferencia estadística se orienta a sacar conclusiones acerca del parámetro 
 o parámetros poblacionales con base en el valor de un estimador obtenido a partir 
de los datos muestrales extraídos de esa población. Para llegar a ese objetivo a 
través de un proceso racional y eficaz, se aconseja que se tengan en cuenta los 
siguientes pasos: 

1. Formulación  del problema. En este punto se debe especificar de manera 
clara la pregunta que se debe responder y la población de datos asociada a la
 pregunta. Los conceptos deben ser precisos y deben ponerse limitaciones 
adecuadas al problema motivadas por el tiempo, dinero disponible y la habilidad 
de los Investigadores.  
Algunos conceptos como, artículo defectuoso, económico, salario, pueden variar en 
cada caso y para cada problema debemos coincidir con las ideas señaladas en el estudio.


2. Diseño del experimento. Este aspecto es de gran importancia, puesto 
que la recolección de datos requiere dinero y tiempo. Es siempre nuestro 
deseo obtener máxima Información con el mínimo costo (dinero y tiempo) 
posible. Incluir excesiva Información en la muestra es a menudo costoso y 
antieconómico. Incluir poca también es poco satisfactorio. Esto implica, entre otras
 cosas, que debemos determinar el tamaño de la muestra o la cantidad o tipo de
 datos que nos permita resolver el problema de la manera más eficiente.  

3. Recolección de datos. Esta parte, por lo general, es la que exige más
 tiempo en la Investigación. Esta recolección debe ajustarse a reglas estrictas ya
 que de los datos esperamos extraer la Información deseada.  

4. Tabulación y descripción de los resultados. En esta etapa, los datos 
muestrales se exponen de manera clara y se ilustran con representaciones 
tabulares y gráficas (diagramas. histogramas, etc.); además se calculan  las
 medidas estadísticas apropiadas al proceso inferencial que haya sido escogido. 

5. Inferencia estadística y conclusiones. Este último paso constituye tal
 vez  la contribución más importante de la estadística al proceso inferencial. Aquí 
se fija el nivel de confiabilidad para la inferencia; esto es  debido a
 que las conclusiones derivadas de inferencias estadísticas jamás se pueden tomar 
con un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad; en
 términos de probabilidad denominados  nivel de confianza y nivel de significancia.
 El proceso Inferencial nos llevará a una conclusión estadística que servirá de 
orientación a quien o quienes deban tomar la decisión (administrativa o clínica)
 sobre el tema objeto de estudio. 

1.8 RECOLECCIÓN DE DATOS

1.8 RECOLECCIÓN DE DATOS

En este subtema hablare acerca de métodos que podemos emplear para hacer una buena recolección de datos, pero primero haré una pequeña definición de que lo que es recolección de datos: es actualmente existen varios métodos y mecanismos que nosotros podamos utilizar para llevar el correcto análisis de un producto de calidad los mecanismos más usados son: el cuestionario, la encuesta, la observación, el diccionario de datos y por último el diagrama de flujo. Todas estas herramientas podemos llevarlas a cabo en cierto momento porque no todas aplican en ciertas ocasiones, con esto quiero decir algunos de estos mecanismos no son en algunas ocasiones los mejores para obtener información. A continuación mencionare de los instrumentos para recolección de datos que explique anteriormente.


Necesitamos la recolección de datos porque;
1.Proporcionan la introducción imprescindible para un estudio de investigación.
2.Medir el desempeño en un servicio o proceso de producción.
3.Ayudar en la formulación  de alternativas para la toma de decisiones.

4.Satisfacer nuestra curiosidad.

1.9 ESTADISTICA PARAMETRICA (POBLACION Y MUESTRA ALEATRORIA)


1.9 ESTADÍSTICA PARAMÉTRICA  (POBLACIÓN Y MUESTRA ALEATORIA)

a) Estadística paramétrica es la que requiere que los elementos que integran las muestras contengan parámetros medibles.
La estadística paramétrica clásica plantea tres tipos de problemas:
•1. Estimación puntual en la que pretendemos dar un valor al parámetro a estimar.
•2. Estimación por intervalos (buscamos un intervalo de confianza).
•3. Contrastes de hipótesis donde buscamos contrastar información acerca del parámetro.

1.10 APLICACIONES

Aplicaciones De La Estadística

Aunque comúnmente se asocie a estudios demográficos, económicos y sociológicos, gran parte de los logros de la estadística se derivan del interés de los científicos por desarrollar modelos que expliquen el comportamiento de las propiedades de la materia y de los caracteres biológicos. La medicina, la biología, la física y, en definitiva, casi todos los campos de las ciencias emplean instrumentos estadísticos de importancia fundamental para el desarrollo de sus modelos de trabajo.

Campos de aplicación

La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos:
  • En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.
  • En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la sociología aplicada.
  • En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos.
  • En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera.

Presentación de datos

Los datos estadísticos se presentan generalmente expresando el valor de la frecuencia absoluta que toman las variables significativas de un estudio, ya correspondan a una población o a una muestra. La frecuencia absoluta de un valor o de una modalidad de una variable estadística es el número de datos observados que presentan ese valor o modalidad. El cociente entre la frecuencia absoluta de un valor o modalidad y el número total de datos es llamado frecuencia relativa. También suelen presentarse los datos en forma de porcentaje (es decir, en forma de razón de denominador 100).
Una razón se obtiene como el cociente entre dos cantidades numéricas comparables. Si el cociente se refiere a dos cantidades que se indican en unidades distintas, la razón recibe el nombre de tasa. Un ejemplo de tasa es la densidad de población, que se define como el número de habitantes por kilómetro cuadrado y que se aplica habitualmente en los estudios demográficos.
Dada una suma de varios sumandos, si el cociente hace referencia a la división numérica entre uno de los sumandos y la suma total, la cantidad expresada se denomina proporción.

Números índices

Otros métodos de presentación de datos utilizados en estadística se basan en el empleo de números índices.Tales números reflejan la evolución que experimenta con el paso del tiempo una variable estadística de interés. Así, se toma como referencia del índice el valor de la variable en un instante dado, de manera que sus valores posteriores se expresan como una razón de cambio con respecto a dicha referencia (a menudo, en forma de porcentaje).
Un ejemplo típico de empleo de números índices es el índice bursátil, cuya definición obedece a criterios diferentes en cada país (índice Dow Jones, en la Bolsa de Nueva York; índice Nikkei, en Tokio, etcétera).

Estadísticas comunes

Varios estudios estadísticos comunes que aparecen con frecuencia en los medios de comunicación son los siguientes:
  • Encuesta de Población Activa (EPA), elaborada por el Instituto Nacional de Estadística (INE) con periodicidad trimestral, según recomendaciones de la Organización Internacional del Trabajo (OIT), para obtener y clasificar datos sobre la actividad de la población. Esta encuesta se realiza por muestreo, y los resultados se ordenan por edad, sexo, nivel de estudios, profesión y otros parámetros.
  • Índice de Precios al Consumo (IPC), que mide por medios estadísticos la evolución exprimentada por los precios de los bienes y servicios consumidos por la población española. Se basa en la Encuesta de Presupuestos Familiares (EPF), y selecciona varios centenares de artículos, clasificados en ocho grupos, que se consideran representativos de la evolución de los precios. Los artículos seleccionados componen lo que se denomina cesta de la compra, considerada en la encuesta.
  • Producto Interior Bruto (PIB), que registra la producción nacional de un país en bienes y servicios asociados a procesos considerados productivos.
  • Poder adquisitivo, que maneja combinadamente datos del Salario Mínimo Interprofesional (SMI) y el IPC.
Gráfico de sectores, o circular, que refleja estadísticamente la aplicación de las matemáticas según el resultado de una encuesta de opinión.

INTEGRANTES DEL EQUIPO



ALEJANDRO ZARATE SANTIAGO 

REY LUIS SANCHEZ BLAS 

FRANCISCO JAVIER ESTEVA REGALADO