Alpha's Manifesto

A black and white figure's thought-hive

Link del día: Aprendan estadística o los mato a todos

Este link que me llegó del nuevo Delicious trata de un rant de Zed Shaw titulado Programmers need to learn statistics or I will kill them all. Trata de las frustraciones que él encuentra al momento de discutir resultados de tests y generalizaciones con determinados programadores con los que ha trabajado.

Si bien no deja de ser un rant y por eso no es realmente informativo, es un buen punto de partida para entender por qué el conocimiento básico que tenemos de estadística (si no todos, probablemente una gran mayoría). Creo que muchos hemos pecado de cometer las mismas acciones que él cuenta en su artículo, como dar un número grande de pruebas, sacar un promedio y entender que ese es el promedio de los casos, cuando hay muchos otros factores que afectan y muchos otros datos que aportan información y nunca se tienen en cuenta. Para sacar una frasecita de su artículo: “El punto es que si ustedes dan un promedio sin mostrar la desviación estándar, perdieron completamente el punto de siquiera intentar medir algo“.

Soy un zorrinito promedio.

Link del día: La ley de Benford y el mundo de los negocios

Esto no es ninguna novedad, pero para mí sí lo es: La ley de Benford es una ley estadística que dice que en muestras númericas del mundo real, hay una distribución determinada de la aparición de los primeros dígitos en esos números. Es decir, que si midiéramos a todos los seres humanos, el número que más aparecería en esas mediciones, los números que empiezan con 1 tendrían cierta distribución, los que empiezan con 2 tendrían otra, etc.

Esto ha sido comprobado con una buena cantidad de ejemplos (incluso con mismas muestras y distintos sistemas métricos). Por supuesto, hay mucha controversia al respecto pero no quiero hablar de ella ahora.

Lo interesante es el tipo de aplicaciones que esto tiene. A veces se usa como regla heurística para determinar fraudes en aplicaciones online. ¿Quién lo usa? Apple por ejemplo…. podría. Este post de Rob Conery no me deja del todo claro si Apple hace actualmente uso de esta técnica o no, pero está claro que es totalmente aplicable. Su post está titulado apropiadamente: Could Benford’s Law have saved an Apple ID?… maybe.

Checkeen el testeo estadístico y la forma en la que se aplica, es altamente ingeniosa, pero lo más curioso es cómo puede aplicarse una (o más de una) simple regla estadística para, a modo de un quick datamining, determinar cuáles situaciones están realmente fuera de lo esperado y detectarlas como fraude. Esto es aplicable a muchos otros campos, y por supuesto, no sólo a ventas online.

Soy un zorrinito fraudulento.