Alpha's Manifesto

A black and white figure's thought-hive

Correlation ≠ causation

But causation ⇒ correlation

Correlation vs causation

In my earlier post I explained how certain type of machine learning models, specifically neural networks, find the correlations between two sets of values. For predictive models, we feed correlated variables to train our models. However, sometimes, we don’t know if or how variables correlate, and part of the machine learning intelligence is to actually find that out.

(Read more →)

Link del día: Social Datamining

Este es mi tercer post hablando sobre un artículo publicado sobre la gente de OkCupid. ([1], [2]). Para quien no lo sepa, es un sitio de citas (dicen ellos, el más grande que hay), con un blog realmente fantástico y con un valor científico muy importante (o eso considero yo). Ellos hacen análisis basados en la relaciones que su sitio maneja, y personalmente creo que sus estudios pueden bien ser de ayuda para la sociología u otras ciencias.

En este caso en particular, quiero aproximar este siguiente post desde el punto de vista de la ingeniería social. Ellos analizaban el siguiente problema: en una primera cita hay mucho que uno quiere conocer de la otra persona, pero son cosas que no se pueden preguntar porque son preguntas invasivas, o porque simplemente incomodarían a la otra persona.

El datamining y las probabilidades entran en acción. Analizando el total de la gente, han logrado separa bajo distintos factores aquellas preguntas que sí se pueden analizar, y cuál es el factor de correlación con las que no se pueden contestar. Por ejemplo, que alguien te responda que le gusta el sabor de la cerveza implica un 60% de posibilidades de sexo en una primera cita (a muchos les hubiera gustado saber esto antes, verdad?)

Llevenló al aspecto de la seguridad. ¿Cuántas cosas sore la seguridad interna de un sistema o empresa podríamos saber haciendo otro tipo de preguntas?

Sin más explicación, los dejo con el artículo: The Best Questions for a First Date.

Soy un zorrinito social.

Link del día: Herramientas para Twitter

De parte de MonikaMDQ (más precisamente en su perfil de Twitter) me enteré de un artículo llamado 50 applicaciones para extraer datos de Twitter. Más allá de los típicos sistemas para sacar gráficos de cuánto posteamos y demás, están los que generan gráficos sociales, están algunos que hasta determinan perfiles psicológicos basados en lo que se comenta, et cetera.

Las que más me llamaron la atención a mí fueron Twitter Analyzer, Twitnest, TwitterCharts, y Tweetpsych. Lástima que no tengo tantos seguidores ni tanto material como para hacer inspecciones reales o algún datamining sobre lo que hay por ahí.

Soy un zorrinito twitt.