facebook report de Wolfram | Alpha es un reporte bien interesante
Contiene gráficas de sencilla lectura y agrupa los datos de manera inteligente
Quienes hayamos gozado con los datos de edades y sexo para los fans de páginas en facebook, esto es una versión alrededor de las personas y no de las marcas, equipos o sitios web.
Tengamos bien claro que algunos de los datos son falseados, algunos otros nunca llegan a ser ingresados o corregidos y también estarían bloqueados los datos que así se consideren por cuestión de privacidad para nuestros contactos.
Acerca de tus contactos (amigos, familiares, compañeros de trabajo, conocidos, amigos online)
Empecemos revisando los nombres más comunes de nuestros contactos:

Son datos que de un vistazo se sienten verdaderos. Pero ubiquemos por ejemplo «Reggae», es evidente que algunos seguidores de este género musical se lo han colocado de nombre y seguramente algunos sitios web han creado un perfil llevando esta palabra de nombre.
El mismo ítem que con el nombre lo encontramos para el caso de apellidos («Reggae» y «Roots») además «Peru» seguramente no revela un fuerte nacionalismo sino localía de marcas o grupos (Ej: Patinadores Peru, Moda Peru, La Taberna Peru)
Ya desde este punto vemos que se requiere la colaboración entre gran poder analítico y de almacenamiento de data con las habilidades e intuición humana experta.
Bastaría con poder eliminar elementos de las listas para dar paso a los siguientes que podrían ser significativos. Además este filtro podría ser genérico para todo el reporte o parte de él.
Ya les estaba adelantando acerca de los datos que no son completados o los que se bloquean desde las opciones de privacidad. Veamos el la sección de descripciones. Aquí se consideran los idiomas hablados, la óptica política y la religión.

Vemos la muestra es muy pequeña con respecto al universo de datos. Además descriptivos similares no están agrupados («Español» y «Spanish»), claro que podríamos pensar que «Spanish» indicaría el español como una segunda o tercera lengua hablada por angloparlantes.
En la óptica política «Liberal» podría ocupar ese primer lugar pero este segmento suele estar más «orgulloso» de proclamarlo. La muestra no es significativa.
Para el caso de las religiones volvemos a tener el problema de la fragmentación para descriptivos similares y la muestra no es significativa.
Inquietud en el ámbito comercial: La publicidad en facebook ofrece una segmentación maravillosa, pero vemos que el idioma no está claramente identificado. Sería interesante conocer si facebook opera las equivalencias. Nuestros amigos de Wolfram | Alpha sí podrían mejorar su reporte en ese sentido.
Veamos las edades

Es de esperarse que una persona de 26 años tenga mayor cantidad de amistades agrupadas en su misma edad. Y que se de una dispersión gradual mientras la medición se aleja de ese punto de evaluación. Tenemos así una campana de Gauss, la veríamos mejor graficada tomando la evaluación para cada edad y dejando el sector más significativo de la gráfica. Aquí también tenemos que considerar la edad que se le haya asignado a perfiles comerciales y las edades falsas. He encontrado varios perfiles con la edad a 103 y 110 años.
Sexo: Mujeres y hombres

La gráfica de distribución por género puede ser bastante poblada para uno de los sexos. Pero cuando mostramos por edad la lectura podría ser más clara. Además tenemos que volver a considerar la gráfica de la distribución de la edad de nuestros contactos. Si tenemos dos contactos de 70 años, un hombre y una mujer entonces este 50% – 50% es un resultado verdadero pero más que todo teórico. Si tenemos un contacto mujer de 65 años entonces ese 100% causa mucho ruido en la gráfica. La gráfica más adecuada para ambas métricas de manera simultánea sería «pintar» el fraccionamiento por género sobre la gráfica de distribución por edades.
¿Dónde viven tus contactos?
Amigos, familiares… es común que sea en zonas aledañas a la vivienda de uno. Sin embargo, las fronteras entre países y las distancias pierden importancia con la interacción en internet y más aún en la principal red social.

¿Solteras? ¿Casados? ¿Relación abierta? ¿Comprometidos?

Centrándonos en el sector de muestra más significativa, la soltería predomina. Los compromisos más o menos se mantienen. Los matrimonios luego desplazan a compromisos o al «estar en una relación». Esta gráfica a nivel de miles de personas y segmentadas por intereses, ciudades, podría revelar más acerca del comportamiento humano en sociedad.
Tejido social

Tomado de Softonic (Wolfram Alpha lo sabe todo de tu Facebook)
Esta gráfica tiene una correlación con los clusters de contactos. Cada grupo son contactos mutuos entre sí, agrupaciones de amigos (la escuela, trabajo actual, trabajos anteriores, grupos de juegos, asociaciones, clubes). No se determina a partir de esos grupos con nombre propio sino a partir de las relaciones entre las personas (perfiles). Los puntos aislados indican personas que no están dentro de otro grupo (ej. si tenemos como contacto al presidente de nuestro país, alguna megaestrella del espectáculo, un solo amigo en Rusia, solo dos amigas dedicadas a la física nuclear, o simplemente parientes lejanos).
Los mismos cúmulos tienen zonas (lóbulos). Por ejemplo si tenemos 200 contactos que son dueños de autos Mini entonces los lóbulos pueden corresponder a países.
Acerca de lo que realizas tú
¿Qué haces en facebook?

Algunos perfiles podeían tener mucha actividad. Así como algunos solo realizan «likes» en los muros de sus contactos. Esta actividad podría ser de compartir enlaces (páginas web, videos, fotos de la web) o tal vez hablar de nosotros mismos, dar un mensaje («statuses»). También se consideran fotos y videos subidos.
¿Durante qué horas estamos en facebook?

tomado de Softonic (Wolfram Alpha lo sabe todo de tu Facebook)
La gráfica revela las horas de sueño, la actividad diurna, el descanso de tarde y la vida nocturna de fin de semana. Cada persona es distinta. Aquí otro perfil algo distinto.

Actividad por las madrugadas
¿Cuándo compartimos más fotos?

Agrupado por meses y años se detalla la cantidad de fotos subidas al facebook
¿Qué es lo que decimos?

Y se debería permitir el filtrado de:
- conjunciones/preposiciones (al, y, pero, ni)
- adjetivos posesivos (sus, tus)
- verbos genéricos: hacer, estar, ser
- otros: ti, lo, tal
Otra vez vemos la ineludible y necesaria de la cooperación entre máquina y ser humano para el análisis.
También se cuenta con…
Acerca de lo que has hecho:
- Cantidad de Likes y Comentarios que has realizado.
- El mapa con las ubicaciones en las que has hecho check-in
- Uso de aplicaciones durante las horas de la semana
- Distribución de uso de interfaces (Web, iPhone, iPad) durante las horas de la semana
Más información acerca de las fotos:
- Total de álbumes y fotos
- Promedio de personas etiquetadas
- Foto más comentada
- Foto con mayor cantidad de likes
En general de tu red social y personas con mayor interacción:
- Las personas que más le dan like a lo que compartes, los que vuelven a compartir lo que dejas en tu muro
- Clusters de amigos, a partir de las listas que hayamos formado y los default de facebook (ciudad, escuela, universidad)