[MÚSICA] [MÚSICA] En el momento de analizar datos o evaluar críticamente datos ambientales publicados, debemos tener en cuenta una serie de conceptos estadísticos clave. La primera pregunta que tenemos que hacernos es cómo se obtuvieron los datos. La fuente de datos puede ser propia o de terceros. Independientemente de la fuente, el relevamiento pudo alcanzar a todos los individuos de interés, es decir, a una población y en ese caso hablamos de censos, o bien podría incluir a una parte de la población, en cuyo caso hablamos de muestra. En la práctica rara vez se hacen censos debido al tamaño de las poblaciones, que suelen ser muy grandes y hasta infinitas, o bien a las limitaciones de recursos para abordarla. Tanto la muestra como la población se conforman de unidades de análisis, que son los objetos descritos por los datos. La siguiente pregunta que naturalmente surge es, ¿cómo fueron seleccionadas las unidades de análisis que conforman la muestra? La manera idónea es producir una muestra aleatoria de tamaño N donde es posible cuantificar la probabilidad de que un individuo forme parte de la muestra. El azar nos asegura de representatividad, you que no tiende a favorecer determinados resultados, y además nos permite efectuar inferencia estadística, es decir, generalizar los resultados obtenidos en una muestra aleatoria a la población a partir de la cual se extrajo dicha muestra. Es necesario que exista coherencia entre la muestra y la población, de lo contrario, los resultados suelen ser erróneos. Por ejemplo, si yo trabajo con una muestra de residentes de Gran Buenos Aires, no puedo generalizar acerca de los argentinos porque no hay coherencia entre la muestra y la población sobre la que se generaliza. El siguiente elemento relevante en un análisis estadístico es reconocer las variables. Son las características que se registran, se miden, se observan en las unidades de análisis, mientras que la observación o dato es el valor que toma una variable en una unidad de análisis. Por ejemplo, para un estudio sobre residuos sólidos urbanos, que pertenece al componente tres del Marco para el Desarrollo de las Estadísticas Ambientales, Podríamos obtener información recopilada de terceros, como es el caso de la Coordinación Ecológica Metropolitana conocida como CEAMSE. Esta imagen muestra la cantidad de residuos sólidos urbanos recolectados que registra el CEAMSE en 2017. Observá que lo que se midió fue el peso de los residuos urbanos recolectados medido en toneladas. Peso entonces es la variable y tonelada es su unidad de medida. ¿A qué se le midió la cantidad de toneladas de residuos? A cada localidad a lo largo del tiempo. Entonces, cada localidad resulta ser la unidad de análisis. Y la forma de recopilación de los datos responde a un censo, you que contamos con la información sobre toda la basura recolectada en los municipios. También identificamos que la cantidad de residuos recolectados en capital federal durante enero fue de 88746.8 toneladas. Ese es un dato. Finalmente quisiera presentar los conceptos estadísticos de error no muestral o sesgo versus error muestral, ambos relacionados con el proceso de muestreo. Un método de muestreo está sesgado si produce resultados que sistemáticamente difieren de la población de interés. Ocurren por ejemplo por la falta de exactitud de los instrumentos de medición o por la tendencia sistemática a excluir cierto tipo de individuos en el proceso de muestreo. Los errores en el proceso de inferencia introducido por estos sesgos no se minimizan por aumentar el tamaño de la muestra. Por otra parte, puede haber errores debidos al azar. A esos errores se los denomina errores muestrales y aparecen como resultado de analizar solo a una parte de la población. Es natural admitir que los resultados obtenidos a partir de una muestra, aun en ausencia de sesgos, no serán exactamente iguales a los que se hubieran obtenido si se hubiese efectuado un censo. Sin embargo, las diferencias no son sistemáticas sino aleatorias, y, a diferencia de los errores no muestrales, disminuyen cuando aumenta el tamaño de la muestra. Adicionalmente, si la muestra es probabilística, es posible controlar su magnitud y estimarlos. En resumen, en esta primera lección introducimos los conceptos claves de población y de muestra, las formas de recopilar datos mediante censos o mediante muestreos, la unidad de análisis, la variable, la observación o dato. Estos elementos, que forman parte de la metodología de una investigación, nos permitirán contextualizar los análisis estadísticos dándole valor a los resultados numéricos. [MÚSICA] [MÚSICA]