Desde las preguntas hacia el tratamiento de datos

En las diferentes ocasiones en las que he impartido la materia de estadística la presentación de las diferentes metodologías del manejo de los datos la he hecho desde los datos, para que una vez construidas por ejemplo las tablas de distribución de frecuencias se pudieran establecer algunas proposiciones válidas.
Por ejemplo

De una tabla como esta de la variable de la edad de las mamases de bebés prematuros

tabla de frecuencias

Establecer que el valor promedio de la edad de las mamás con bebés prematuros es 26.16 años, que la edad más frecuente en la que las mamás tienen bebés es entre 21 y 24 años, que la desviación estándar de la edad con respecto a la media es de 6.51 años, que la diferencia de edad entre la mamá más joven y la de mayor edad es de 30 años, etcc.

El día de hoy partí de las preguntas, una vez que han sido ilustrados los procedimientos de la construcción de las tablas y del cálculo de las medidas de tendencia central y de variabilidad.

Las preguntas elaboradas las pueden ver en el siguiente documento

Preguntas sobre el nacimiento de bebés prematuros

y los datos para responderlas en el archivo  Datos bebés prematuros

La dinámica de la clase cambió radicalmente, había más dudas porque había incertidumbre de cómo hacerlo.

Diseño Inverso es la clave, qué quiero y luego ver cómo le hago para resolverlo.

Anuncios

Y la transferencia siguiendo patrones hacia lo complejo

La solución de los sistemas con igual número de variables y de incógnitas se presenta desde diversas metodologías, así encontramos el método de igualación, el de sustitución o el de eliminación.

En ellos se va siguiendo la lógica de si A=B y B=C entonces si igualo A=C, si sustituyo A=C .. cuando se añade una nueva variable el procedimiento se complica porque ya no solo A=B o B=C sino quizás hay A = D y B=D y C= A… más ecuaciones, y pasos intermedios de igualación, sustitución o eliminación.

Los determinantes, -números calculados de arreglos matriciales- hacen su aparición, el cálculo de uno 2X2, sencillo, el de 3X3 con un arreglo simple posible, el 4X4  más complicado a través de cofactores y de simplificación de determinantes o ya expresado en alguna fórmula de 19 términos cómo puede verse en el siguiente video

Y finalmente utilizado en los procedimientos generalizados para los sistemas dos por dos, o tres por tres el cálculo para un sistema cuatro por cuatro, utilizando el Excel como el calculador de los valores para el determinante

Así aparece sencillo seguir el patrón y solucionar cualquier sistema del mismo número de incógnitas y de ecuaciones, hasta el límite del Excel

 

Las flores concoides

Las relaciones entre dos variables, representadas y graficadas a través de una tabulación y de sus gráficas suelen ser asociadas a rectas, parábolas, hipérboles. Actualmente nos podemos auxiliar en software gratuito que además del trabajo algebraico, dibuja el trazo de las funciones. Geogebra es utilizado ampliamente por profesores de matemáticas, nos permite graficamente ir evaluando los conceptos que se van desarrollando como la periodicidad, la continuidad, la simetría, así como las operaciones y combinaciones de las funciones.

Las gráficas de las relaciones y la facilidad de parametrizarlas nos devela por ejemplo que las flores son concoides y que responden a una relación matemática.
ecuacionmargarita

El parámetro C que acompaña al valor del ángulo determina el número de pétalos de la margarita… cómo lo podemos ver en el siguiente video

Belleza en las flores, belleza en las relaciones matemáticas, ¿cuál fue primero, la flor o la relación?

Moodle, pregunta calculada y masiva

Etiquetas

,

En la entrada anterior Lo digital vs el “aprender haciendo” se plantea el problema que crea la digitalidad en la elaboración personal y podríamos decir “a mano” de las tareas o exámenes escolares.

Las mismas tecnologías digitales proporcionan también una posible solución, como sería la posibilidad de generar problemas parametrizados que pueden generar una ilimitada cantidad de problemas si cada uno de estos parámetros, toma un valor aleatorio de acuerdo a una distribución de probabilidad.

En la generación de preguntas de Moodle existe la posibilidad de crear preguntas cuya respuesta debe ser calculada, de igual forma se pueden generar los valores aleatorios para los parámetros utilizados y así queda una plantilla de pregunta con su respuesta calculada por la máquina.

Esto agiliza la elaboración de tareas personalizadas y por supuesto el cálculo de las respuestas correctas.

Esta masificación de problemas y solución desde la computadora digital puede ser una alternativa para que el alumno sea quién este “haciendo” y sistematizando los procedimientos de solución.

En este documento he descrito la metodlogía de trabajo que me ha servido para poder crear preguntas parametrizadas masivas con Moodle.

Moodle, pregunta calculada y masiva

Lo digital vs el “aprender haciendo”

Estoy convencida que se aprende cuando se hace y  no sólo viendo como se hace. Si bien el modelado para proceder es vital, cuando uno lo hace por mutuo propio la acción está indicada a través de procesos mentales intelectuales, emotivos y de intención.

Ahora bien, cómo docente que es lo que actualmente veo que sucede.

Las tareas las elabora una persona y otra con procedimientos sencillos la copia y envía un documento cómo si fuera propio, así es imposible distinguir el original de la copia. En una ocasión aunque solicité que personalizaran sus documentos con nombre y portada, un alumno me envió el documento con la portada de su compañero, aún y viéndose descubierto y frente a sus demás compañeros se atrevió a decir que él lo había hecho.

La situación es tal que también les comparto que habiendo encargado el semestre pasado un trabajo sobre una base de datos en bruto, recibí más de 6 trabajos idénticos  hasta en las séptima y octava cifras significativas… y no sólo entre sus trabajos sino idéntico al de una alumna que lo había hecho un semestre antes.

Actualmente cambio los exámenes que elaboro, hago versiones en las que es diferente el orden de las preguntas, también modifico las cantidades involucradas en las fórmulas y lo que sucede es que invariablemente hay respuestas idénticas aunque para otros incisos, lo que pone en evidencia que ni siquiera leen lo que van a copiar.

Ante este problema hay aún algo más que lo hace aún más acuciante, el de copiar y pegar sin leer, en esta imagen que les incluyo se muestra lo que un alumno respondió a una pregunta planteada y  cómo fue respondida.

bgoogle

Ante la respuesta completamente fuera de contexto y de asunto, le pregunté ¿porqué respondiste esto?, y me explicó con aplomo: “eso respondió Google” y todavía peor, sus compañeros de equipo también copiaron y pegaron su respuesta sin leerla tampoco.

Finalmente les comento que subí un video en Youtube en el que se modela la construcción de una plantilla para la solución de un sistema de ecuaciones de tres incógnitas por determinantes y he recibido correos en los que me preguntan dónde está la plantilla, es decir la hoja ya elaborada, no les basta el cómo hacerlo, lo quieren ya hecho.

O bien un docente lo deja al código ético personal y cierra los ojos o bien empieza a elaborar material individualizado  o/y  deja de importarle sí lo hizo o no.

Los exámenes altamente vituperados parecen ser los que en un momento y en una evidencia comprobable logran hacer que el alumno “haga” y que podamos observar cómo es que lo va haciendo.

¿Tú qué opinas?

Las huellas del docente………..

En el trabajo de aula, cuando el docente y los alumnos tienen un espacio y un tiempo dedicado a llevar a cabo ciertas actividades con el propósito de hacer una diferencia entre el conocimiento con el que un alumno ingresa y sale ese día y de ese lugar  es seguro que debería suceder algo.

La propuesta docente deviene y deriva de un compromiso acerca de que esto suceda y la respuesta es variable dependiendo de las circunstancias de la materia en cuestión y de la disposición de los alumnos de realizar esfuerzos cognitivos de comprensión y de ejercicio repetitivo que permita adquirir pericia y avance que pueda decirse que sí se asimiló.

¿Habrá quienes puedan asistir durante treinta y dos sesiones de dos horas cada una sin dejar rastro o huella de todo esto?

¿Hay celo de compartirlo por parte del docente?

Dejo por aquí el enlace al repositorio de química general del trabajo que hice este semestre. Me quedan aún pendientes ….

http://repositorioquimica.wordpress.com/

Tan importante es la investigación, como la docencia en sí… deja huellas

Factor unitario, regla de tres o fórmulas…..

Los problemas de estequiometría química se solucionan a partir de conversión de unidades que pueden ser resueltas a partir del factor unitario, de una regla de tres o de la fórmula correspondiente y de la relación entre los moles de los reactivos entre ellos o de los moles entre los reactivos y productos.

Un diagrama útil para prácticamente todas las ocasiones sería así.

estequimetriasoluciones

Al identificar los datos que se tienen, y las preguntas que se hacen puede el diagrama anterior ubicar las unidades de los mismos y lo que es necesario convertir para aplicar la relación estequiométrica de la reacción en cuestión.

imagenplantilla

Entre las diferentes formas de resolvernos nos encontramos la que utiliza el factor unitario de conversión de unidades, la regla de tres o la aplicación de una fórmula.

Ejemplo.

El metal hierro reacciona con el gas cloro según la reacción

2 Fe(s) + 3 Cl2 —–► 2 FeCl3

¿Cuántos gramos de FeCl3 se obtienen cuando reaccionan 515 g de Cl2 con un exceso de Fe?

1.- Solución con el factor unitario

forma1

2. Reglas de tres

forma2

3.-Uso de fórmulas

forma3

¿Cuál de ellas prefiere?,

Entre mis alumnos lo que observo es que prefieren la seguridad de las fórmulas, en mi opinión la regla de tres es la que da razón de la proporción directa y es más sencilla de explicar pero la que es más elegante, clara, concreta y limpia sin duda es la primera.

La simulación de eventos equiprobables

La ley de los grandes números asegura que al aumentar el número de ensayos, el comportamiento de la frecuencia del valor de una variable converge al calculado por la probabilidad clásica del número de eventos favorables entre los eventos posibles.

Para observar la operación de la ley habríamos que realizar cada vez más y más y más ensayos hasta que su demostración fuera emergiendo del esfuerzo de hacerlo nuevamente …..

La programación de la generación de números aleatorios puede ofrecernos los valores de variable que sigue alguna distribución de probabilidad conocida y de acuerdo a los parámetros que la definen. En el Excel la función que genera un número aleatorio entre límites, lo hace bajo el principio de que cualquiera de ellos es igualmente probable, es decir de acuerdo a una distribución uniforme (discreta o continua)

Entonces si tenemos eventos que son equiprobables, para simular cualquiera de ellos basta con generar el número aleatorio y numerar todos los eventos del espacio muestral. Para hacer n simulaciones, éstas sólo estarían limitadas a la cantidad de celdas en las que se formula la evaluación del número aleatorio y a la eventual consulta o búsqueda del evento representado por ese número aleatorio.

En la siguiente imagen se representan los 64 resultados posibles de sacar de tres urnas (A,B,C) una bola de cuatro numeradas del 1 al 4.

Piense un número cualquiera, dé doble click a la imagen y ese será un resultado posible de haber realizado el experimento.
arbolmuestral

Puede haber diferentes variables aleatorias, por ejemplo una que represente a la suma de los números de las bolas extraídas, otra al de las multiplicaciones, otra al valor máximo, otra al valor mínimo..

En la siguiente dirección se encuentra el archivo en Excel que simula el experimento 100 veces y que calcula y reporta el comportamiento de la variable en histograma.

Hoja en Excel para probar esta simulación

Y en este video cómo se realizó

Si no son equiprobables, con la función acumulada se genera el número aleatorio como lo propone el método de MonteCarlo.
 

Medias, modas, medianas……

Entre medias, modas y medianas, con cuál te quedas?

Una la más reprentativa, otra la más frecuente y la última la más justa que divide en partes iguales a los menores o mayores que ella.

En este enlace Robert Kelley nos explica la robustez de cada una de ellas, y cómo se ven afectados sus valores cuando hay valores atípicos u outliers, o de frecuencia.

Si bien la reyna de las medidas de tendencia central es la media les dejo algunos casos en los que podría no ser la medida a elegir.

Problema cuando en la comparación de poblaciones las medias son iguales.

El problema de las tasas de delito. Al evaluar, durante seis meses, las tasas de delito entre dos ciudades (Ciudad A y Ciudad B), un investigador encontró que en la Ciudad A, el promedio (media aritmética) de automóviles robados fue de 25, la mediana de 20 y la moda de 15 automóviles. En la Ciudad B también el promedio de automóviles robados por día fue de 25, pero la mediana fue de 30 y la moda de 35. Sobre la base de la información anterior ¿en qué ciudad te sentirías más seguro para estacionar su automóvil en la calle? Justifica tu respuesta.

Problema cuando no conocemos el rango de la variable
El problema de la edad de las personas.

Si la edad promedio (media aritmética) de un grupo de 15 personas, que asistieron a una reunión, es de 18 años:
a) ¿Cuál cree Usted que sea el rango de edad de las personas?
b) Proponga la edad de cada persona, de tal forma que cumpla con el promedio dado.
c) Después de haber realizado el inciso b, ¿sigue Usted sosteniendo la respuesta dada en a)?

Problema de percepción añadida a una información solicitada.
El problema de los salarios. Piense en una compañía que tiene nueve empleados con salarios de $12.000.000 al año cada uno, y con un supervisor que gana $ 24.000.000 anualmente. Si quiere describir el salario típico de la empresa, ¿qué estadísticas usaría? ¿Y qué pasa si usted es una persona del departamento de personal que recluta gente para la compañía, y quiere causar una buena impresión en un candidato?

Problema debido a los valores atípicos
Distancias Medias. Los 9 empleados de una nueva empresa viven a diferentes kilómetros de la carretera interestatal
1 Km 3empleados, 4 km 2 empleados, 5 km 1 empleado, 6 km 2 empleados, 26 km 1
Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste en gasolina, ¿en qué lugar pondrías la empresa para minimizar el coste?

¿Tendría caso calcular medidas de variabilidad en relación a las modas o medianas?

Les dejo este video, en tan solo minuto y medio explica los algoritmos de cálculo de las tres medidas de variabilidad.

Tablas para la Normal, calculadoras o funciones

El cálculo de las probabilidades de las funciones de variables continuas a partir de; áreas bajo la curva entre dos límites, condiciones de simetría, conceptos de complemento, tablas con áreas de cola izquierda, de área derecha o entre límites complica los escenarios de cálculo.

Tradicionalmente se utilizan las tablas que vienen anexas en los libros de estadística,  o las que se pueden encontrar y conseguir en Internet.
Por otra parte también encontramos las funciones en las hojas de cálculo o bien calculadoras que además de darnos los resultados numéricos de las probabilidades también nos pueden proporcionar a partir de las probabilidades inversas los valores de Z o de la variable en estudio.

Consideremos las complicaciones en las que se ve inmerso un docente para explicar el uso de las tablas a partir del documento que localizé en este sitio y en el que el documento detalla los casos y los pasos a realizar en el caso de utilizar una tabla de la variable estandarizada cuya función de probabilidad está caluclada con las colas izquierdas (desde menos infinito hasta el valor de Z).

Además de que hace falta que para utilizarla es necesario hacer la conversión estandarización de la variable conociendo su media y su desviación.

Uso de la tabla de la distribución normal típica – EVA

Veamos ahora el primer ejercicio propuesto en el documento anterior,  utilizando la calculadora de Rossman basta con seleccionar el operador < e introducir el valor de x o Z en 0.92 para que se calcule la probabilidad y se despleigue la imagen con el área correspondiente sombreada.

P(Z <= 0.92)roossman1

¿Qué podría justificar en un curso de estadística actual el uso de las tablas?

Videos para explicar el uso de la caluladora de Rossman