El psicólogo Pedro Alonso Cabrera recomienda en el estudio Aprendizaje vicario, efecto mimético y violencia de género que los medios de comunicación no publiquen noticias sobre asesinatos machistas para evitar que otros agresores imiten estos comportamientos. El especialista ha concluido que el 88,89 % de los casos se producen en un periodo que se extiende no más allá de cuatro días de que se haya producido un suceso de similares características. Sólo un 11,11 % se dan de manera aislada.La noticia sobre este informe ha merecido comentarios de todo tipo en el propio periódico y en algunos blogs. Algunos la reproducen sin más pero Víctor R. Ruiz cuestiona la significación estadística del resultado en su Cuaderno de Bitácora:
No soy experto en estadística, pero si las muertes se distribuyeran durante el año de forma aleatoria, la media de días entre muertes se obtendría diviendo 365 entre el anterior total. De hecho, 365/79 = 4,6 días por muerte. Habrá ocasiones en los que sucedan en cortos espacios de tiempo, y otras veces, más largo. Por tanto, la afirmación «el 88,89 % de los casos se producen en un periodo que se extiende no más allá de cuatro días» entra dentro de lo razonable. Si esto es así, a partir de eventos distribuidos aleatorialmente no podemos concluir de ninguna forma que las noticias produzcan un efecto mimético.¿Quién tiene razón? Me puse a revisar un poco los datos y les expongo a continuación los resultados, a ver si están de acuerdo conmigo. Aunque el estudio original es ilocalizable en estos momentos, en LaProvincia.es nos pone un gráfico de donde pueden extraerse todos los datos necesarios. Lo copio a continuación por si desaparece con el tiempo (pulsar encima para ampliar):
Cronograma de muertes de mujeres por violencia machista en el año 2008 |
Según este procedimiento, seguido aparentemente por el autor del trabajo, el 89% (72 de 81 casos) de las muertes forman parte de series lo cual demuestra el efecto contagio.
Lo malo (o lo bueno, según se mire) es que eso no es cierto.
En mi opinión, en el recuento se comete un error grave: la primera muerte de cada serie se incluye en el recuento se "muertes por contagio" cuando es evidente que no debe hacerse si la muerte anterior se produjo hace más de 4 días. En el caso comentado, la muerte del 3 de enero no puede añadirse al recuento, tampoco la del 17 o la del 31 de enero. En cambio, sí puede incluirse la del 22 de enero porque la anterior se produjo el 18. Por extensión, cuando se producen dos muertes el mismo primer día, como en el caso del día 22 de junio, es dudoso que la segunda deba añadirse al recuento porque la noticia no se conoce inmediatamente y es probable que el efecto contagio no haya podido producirse. En estos casos, sería necesario saber la diferencia en horas entre las muertes y cuando se publicó, algo que no sabemos ni tengo tiempo de buscar por lo que haré los cálculos con ambas opciones.
Con esta consideración, el porcentaje de "muertes dentro de los cuatro días siguientes" baja del 89% al 58% o al 64% (47 o 52 casos) y, como es lógico, el 11% que se produce de forma aislada según el autor, sube al 42% o al 36% según se consideren las segundas muertes el primer día de cada serie.
La siguiente pregunta es ¿cuál sería el porcentaje esperado si los eventos fueran aleatorios?
Como mi capacidad estadística es muy limitada, acudí a Excel para hacer algunas simulaciones de series y estimar dichos porcentajes empíricamente. Para ello basta con hacer lo siguiente:
- se generan números aleatorios entre 1 y 365 en 81 celdas; cada número supone una muerte. Lógicamente pueden producirse una o más muertes en cualquier día del año.
- se ordena la serie de menor a mayor (cronológicamente)
- se cuentan los casos que distan 1, 2, 3 o 4 días del caso anterior.
- se divide el recuento entre el total (81) y ya tenemos una estimación de la cantidad de casos que cabe esperar en ese intervalo de 4 días de forma aleatoria.
Aquí acudimos a una página donde podemos hacer el test online y la respuesta es que no hay diferencias significativas entre los porcentajes (ni al 95% ni al 90% de nivel de confianza). La conclusión es que los datos aportados no apoyan la hipótesis de que el contagio exista en las circunstancias que el autor parece manejar (cuatro días de margen temporal). Tal vez haya entendido algo mal ya que no tengo acceso al informe original pero, mientras aparece, la recomendación de no publicar las noticias de las muertes no tiene fundamento en los datos aportados. Sería bueno poder analizar una serie más larga (la mencionada es del año 2008) pero desconozco donde localizar los datos.
No comments:
Post a Comment