Archivo de la categoría: Social Media

La Ciencia de los Datos del mundo Facebook – Parte 1: Amigos

Wolfram Alpha, es un “buscador” que apunta a sofisticadas funcionalidad y métodos científicos. Una acción acertada para ampliar su popularidad ha sido Personal Analytics for Facebook, herramienta con la que basta un click para realizar un análisis exhaustivo de nuestro perfil, preferencias, amigos, etc.

Referencia: Artículo Facebook report de Wolfram | Alpha

 

Afirman que más de un millón de personas han utilizado el servicio, claro, desde ya habría que tener conciencia que a pesar de la elevada cantidad el perfil de la muestra tiene una tendencia a la curiosidad por los temas digitales y cercano a las redes sociales. Y dejamos también resaltado que la muestra de facebook dista demasiado de ser una muestra del mercado masivo.

 

Antes de seguir le damos las gracias a Stephen Wolfram por la publicación y el excelente proyecto.

Fuente: Data Science of the Facebook World en el Blog de Wolfram Apha

 

 

A partir de este punto, y con las consideraciones mencionadas, afirmaremos los datos que Wolfram Alpha publica.

 

Cantidad de amigos

Mediana de la cantidad de amigos en facebook

La mediana de cantidad de amigos en Facebook es 342

 

Distribución de la cantidad de amigos de los usuarios + sus amigos

Distribución de la cantidad de amigos de los usuarios + sus amigos

Cuando se considera a los amigos de la muestra hay presencia de una mayoría sin amigos o contactos en la red. Wolfram afirma que el pico en 200 amigos podría deberse al sistema de sugerencia de amigos de Facebook. [Observación] Podríamos también especular que existen perfiles de marcas, proyectos, y perfiles fantasma que se quedan sin agregar contactos.

 

Cantidad de amigos VS edad

Distribución de la cantidad de amigos de acuerdo a la edad

 

Acerca de la cantidad de amigos, un buen análisis es el contraste con la edad de las personas analizadas. [Observación] Se advierte que se trata de las edades reportadas, muchos no colocan su edad verdadera, otros ni siquiera colocan su edad, y existen muchos perfiles con edad 0 o 101 años. A pesar de ello el análisis es preciso al colocar por debajo de los 20 años la condición con mayor cantidad de amigos, que no baja de cien y que llega casi a los 900 en algunos casos.

 

Wolfram afirma que los usuarios de facebook han ingresado en sus últimos años de adolescencia y su red a ido madurando naturalmente con ellos. Resalta que las personas no eliminan amistades con frecuencia, así que este efecto de envejecimiento de la red de amigos se impone. Agrega que con los años el ritmo de agregar amigos disminuye.

 

¿De qué edades son sus amigos?

edades de los amigos en las diferentes edades

A los 15 los amigos son los que ya tienen 20s. A los 20 es muy centrado en esta edad. A los 25 hay tolerancia tanto a pocos años menores y pocos años mayores. A los 30 aumenta la tolerancia. A los 35 se aprecia un apego hacia las edades menores. A los 40 es pronunciada la extensión hacia personas de menor edad. Para los 50s o 60s destacan picos puntuales como los 25s o 30s, edades de hijos o compañeros de trabajo. Tampoco podemos ser prejuiciosos. Con los datos hay que ser muy abiertos. A los 70s por la poca cantidad procesa por Wolfram Alpha ellos mismos afirman no tener una muestra representativa y con tan poca cantidad de datos lo obtenido carece de significado

 

Edades de los amigos con respecto a la edad de la persona

edades de los amigos con respecto a la edad de la persona

Aquí vemos como va variando, desde la focalización hasta un espectro mucho más abierto, la condición de la edad para los amigos a través de las diversas edades de las personas. Wolfram afirma que en el caso de los niños existe la anomalía de que sus amigos no son centrados en su edad.

 

[Observación] Sugerimos que esto se debe a que los padres suelen ser quienes les han creado su perfil y ellos mismos se han agregado así como a sus tíos, primos adultos, abuelos. O que agregar a estas personas mayores del círculo familiar suele ser común para los adolescentes más jóvenes.

 

Estado sentimental / En alguna relación de pareja?

Relación de pareja VS. Edad

relación de pareja VS edad

Vemos la soltería que va decreciendo desde la adolescencia hacia los 20s y 30s. Se mantiene entre los 35 hasta el fin de la vida. Estar en una relación y remarcarlo crece entre poco antes de los 20 y los 25, es importante hasta los 30 o un poco más. El compromiso es un estado muy breve, más presenta tiene el matrimonio. Desde los 24 hasta los 35 la ola de matrimonios es fuerte, para luego constituirse en una estado permanente. La viudos aparecen ligeramente en los 50s pero ya con mayor fuerza en los 60s.

[Observación] Debemos tener en cuenta no solo el estado sino la necesidad o motivación para comunicarlo. En la adultez no predomina un apuro por comunicarlo rápidamente como en la adolescencia. Y se prefiere publicar estar soltero a divorciado. Un estado de viudez no sería publicado sino mucho después de establecido este estado.

 

Cada estado de relación de pareja VS edad

cada estado de relación de pareja VS edad

Un mayor detalle se obtiene al cruzar el dato de la relación con el sexo de la persona.

Los hombres muestran su soltería y aún más alrededor de los 20, va disminuyendo hacia los 30 y 40. Y sigue disminuyendo incluso en una edad más avanzada. En el caso de las mujeres la soltería disminuye con una tendencia estable desde la adolescencia y juventud. Pero se estabiliza tempranamente poco antes de los 35.

Muchas mujeres comunican estar en una relación a los 23, mientras que los hombres lo hacen a los 27, en el caso de los hombres la campana de distribución es abierta con respecto a la distribución en las mujeres.

Para el caso de compromisos y uniones civiles la evolución es muy paralela con el espacio de 2 o 3 años entre mujeres y hombres.

Wolfram compara estos resultados con los del censo en Estados Unidos, y las diferencias se justifican en las bromas de los niños acerca de estar ya casados y los datos de la población rural menos presente en Facebook.

[Observación] No es tarde para tener mucho cuidado con los datos de distintas sociedades, cada cual con su idiosincrasia y momento actual.

 

Población vs. Edad

población VS edad

Lo más representativo de Facebook está muy cercano a los 20s, Es un contraste alto en Estados Unidos, también se podría esperar esto en sociedades más longevas como en Japón. Y una mejor correspondencia en países o poblaciones jóvenes.

 

Cantidad de amigos con respecto a la edad y el sexo

cantidad de amigos VS edad y sexo

Wolfram destaca que los niños varones son menos electivos y aceptan más amigos, en contraste con las niñas. Luego esta diferencia desaparece en los tempranos 20s.

Wolfram se pregunta el porqué de una alta cantidad de amigos para las personas de Brasil. Es que se suma su actitud de amistad, a la densidad demográfica y la red social precedente Orkut, en la que se tenían entre 4,000 a 5,000 amigos (“desconocidos”) en promedio. En Rusia y China predomina el contacto a través de otras redes sociales.

 

Qué interesante lo de la “paradoja de la amistad”, que consiste en que al medir a los amigos de ciertas personas algunos contactos muy populares se volverán a contar. Entonces a partir de una muestra de personas siempre su círculo tendrá más amigos que ellos. El método utilizado por Wolfram para despejar este sesgo me parece sin duda efectivo pero al menos misterioso, pues reduce el peso en el conteo de amigos en proporción inversa a la cantidad de amigos que se tiene. La operación dependería del análisis puntual que se esté realizando.

 

Dejamos para una próxima entrega un análisis de las redes en sí, los clústers de amigos

 

facebook report de Wolfram | Alpha

facebook report de Wolfram | Alpha es un reporte bien interesante

Contiene gráficas de sencilla lectura y agrupa los datos de manera inteligente

Quienes hayamos gozado con los datos de edades y sexo para los fans de páginas en facebook, esto es una versión alrededor de las personas y no de las marcas, equipos o sitios web.

Tengamos bien claro que algunos de los datos son falseados, algunos otros nunca llegan a ser ingresados o corregidos y también estarían bloqueados los datos que así se consideren por cuestión de privacidad para nuestros contactos.

 

Acerca de tus contactos (amigos, familiares, compañeros de trabajo, conocidos, amigos online)

 

Empecemos revisando los nombres más comunes de nuestros contactos:

facebook report - Wolfram | Alpha - most common friend names
facebook report – Wolfram | Alpha – most common friend names

Son datos que de un vistazo se sienten verdaderos. Pero ubiquemos por ejemplo “Reggae”, es evidente que algunos seguidores de este género musical se lo han colocado de nombre y seguramente algunos sitios web han creado un perfil llevando esta palabra de nombre.

El mismo ítem que con el nombre lo encontramos para el caso de apellidos (“Reggae” y “Roots”) además “Peru” seguramente no revela un fuerte nacionalismo sino localía de marcas o grupos (Ej: Patinadores Peru, Moda Peru, La Taberna Peru)

Ya desde este punto vemos que se requiere la colaboración entre gran poder analítico y de almacenamiento de data con las habilidades e intuición humana experta.

Bastaría con poder eliminar elementos de las listas para dar paso a los siguientes que podrían ser significativos. Además este filtro podría ser genérico para todo el reporte o parte de él.

 

Ya les estaba adelantando acerca de los datos que no son completados o los que se bloquean desde las opciones de privacidad. Veamos el la sección de descripciones. Aquí se consideran los idiomas hablados, la óptica política y la religión.

facebook report - Wolfram | Alpha - friends' descriptions
facebook report – Wolfram | Alpha – friends’ descriptions

Vemos la muestra es muy pequeña con respecto al universo de datos. Además descriptivos similares no están agrupados (“Español” y “Spanish”), claro que podríamos pensar que “Spanish” indicaría el español como una segunda o tercera lengua hablada por angloparlantes.

En la óptica política “Liberal” podría ocupar ese primer lugar pero este segmento suele estar más “orgulloso” de proclamarlo. La muestra no es significativa.

Para el caso de las religiones volvemos a tener el problema de la fragmentación para descriptivos similares y la muestra no es significativa.

Inquietud en el ámbito comercial: La publicidad en facebook ofrece una segmentación maravillosa, pero vemos que el idioma no está claramente identificado. Sería interesante conocer si facebook opera las equivalencias. Nuestros amigos de Wolfram | Alpha sí podrían mejorar su reporte en ese sentido.

 

Veamos las edades

facebook report - Wolfram | Alpha - friends' ages
facebook report – Wolfram | Alpha – friends’ ages

Es de esperarse que una persona de 26 años tenga mayor cantidad de amistades agrupadas en su misma edad. Y que se de una dispersión gradual mientras la medición se aleja de ese punto de evaluación. Tenemos así una campana de Gauss, la veríamos mejor graficada tomando la evaluación para cada edad y dejando el sector más significativo de la gráfica. Aquí también tenemos que considerar la edad que se le haya asignado a perfiles comerciales y las edades falsas. He encontrado varios perfiles con la edad a 103 y 110 años.

 

Sexo: Mujeres y hombres

facebook report - Wolfram  Alpha - friends' gender
facebook report – Wolfram Alpha – friends’ gender

La gráfica de distribución por género puede ser bastante poblada para uno de los sexos. Pero cuando mostramos por edad la lectura podría ser más clara. Además tenemos que volver a considerar la gráfica de la distribución de la edad de nuestros contactos. Si tenemos dos contactos de 70 años, un hombre y una mujer entonces este 50% – 50% es un resultado verdadero pero más que todo teórico. Si tenemos un contacto mujer de 65 años entonces ese 100% causa mucho ruido en la gráfica. La gráfica más adecuada para ambas métricas de manera simultánea sería “pintar” el fraccionamiento por género sobre la gráfica de distribución por edades.

 

¿Dónde viven tus contactos?

Amigos, familiares… es común que sea en zonas aledañas a la vivienda de uno. Sin embargo, las fronteras entre países y las distancias pierden importancia con la interacción en internet y más aún en la principal red social.

facebook report - Wolfram | Alpha - friends' hometown
facebook report – Wolfram | Alpha – friends’ hometown

 

¿Solteras? ¿Casados? ¿Relación abierta? ¿Comprometidos?

facebook report - Wolfram | Alpha - friends' relationship statuses
facebook report – Wolfram | Alpha – friends’ relationship statuses

Centrándonos en el sector de muestra más significativa, la soltería predomina. Los compromisos más o menos se mantienen. Los matrimonios luego desplazan a compromisos o al “estar en una relación”. Esta gráfica a nivel de miles de personas y segmentadas por intereses, ciudades, podría revelar más acerca del comportamiento humano en sociedad.

 

Tejido social

Tejido social
Tejido social
Tomado de Softonic (Wolfram Alpha lo sabe todo de tu Facebook)

Esta gráfica tiene una correlación con los clusters de contactos. Cada grupo son contactos mutuos entre sí, agrupaciones de amigos (la escuela, trabajo actual, trabajos anteriores, grupos de juegos, asociaciones, clubes). No se determina a partir de esos grupos con nombre propio sino a partir de las relaciones entre las personas (perfiles). Los puntos aislados indican personas que no están dentro de otro grupo (ej. si tenemos como contacto al presidente de nuestro país, alguna megaestrella del espectáculo, un solo amigo en Rusia, solo dos amigas dedicadas a la física nuclear, o simplemente parientes lejanos).

Los mismos cúmulos tienen zonas (lóbulos). Por ejemplo si tenemos 200 contactos que son dueños de autos Mini entonces los lóbulos pueden corresponder a países.

 

Acerca de lo que realizas tú

 

¿Qué haces en facebook?

facebook report - Wolfram | Alpha - activity type
facebook report – Wolfram | Alpha – activity type

Algunos perfiles podeían tener mucha actividad. Así como algunos solo realizan “likes” en los muros de sus contactos. Esta actividad podría ser de compartir enlaces (páginas web, videos, fotos de la web) o tal vez hablar de nosotros mismos, dar un mensaje (“statuses”). También se consideran fotos y videos subidos.

 

¿Durante qué horas estamos en facebook?

facebook report - Wolfram  Alpha - rmost active time
facebook report – Wolfram Alpha – rmost active time
tomado de Softonic (Wolfram Alpha lo sabe todo de tu Facebook)

La gráfica revela las horas de sueño, la actividad diurna, el descanso de tarde y la vida nocturna de fin de semana. Cada persona es distinta. Aquí otro perfil algo distinto.

facebook report - Wolfram | Alpha - rmost active time
facebook report – Wolfram | Alpha – rmost active time

Actividad por las madrugadas

 

¿Cuándo compartimos más fotos?

facebook report - Wolfram | Alpha - most photo activity
facebook report – Wolfram | Alpha – most photo activity

Agrupado por meses y años se detalla la cantidad de fotos subidas al facebook

 

¿Qué es lo que decimos?

facebook report - Wolfram | Alpha - word cloud
facebook report – Wolfram | Alpha – word cloud

Y se debería permitir el filtrado de:

  • conjunciones/preposiciones (al, y, pero, ni)
  • adjetivos posesivos (sus, tus)
  • verbos genéricos: hacer, estar, ser
  • otros: ti, lo, tal

Otra vez vemos la ineludible y necesaria de la cooperación entre máquina y ser humano para el análisis.

 

También se cuenta con…

Acerca de lo que has hecho:

  • Cantidad de Likes y Comentarios que has realizado.
  • El mapa con las ubicaciones en las que has hecho check-in
  • Uso de aplicaciones durante las horas de la semana
  • Distribución de uso de interfaces (Web, iPhone, iPad) durante las horas de la semana

Más información acerca de las fotos:

  • Total de álbumes y fotos
  • Promedio de personas etiquetadas
  • Foto más comentada
  • Foto con mayor cantidad de likes

En general de tu red social y personas con mayor interacción:

  • Las personas que más le dan like a lo que compartes, los que vuelven a compartir lo que dejas en tu muro
  • Clusters de amigos, a partir de las listas que hayamos formado y los default de facebook (ciudad, escuela, universidad)

 

Martes 21 en Infosoft 2012

Recomendamos

Conferencias (en el Auditorio de Ingeniería)

  • Hacking Corporativo y Ciber Guerra. De 3 a 4 pm

 

  • Desafío en la dirección de proyectos informáticos, presente y futuro. De 4 a 5:30 pm

Prezi de la conferenca “Desafío en la dirección de proyectos informáticos, presente y futuro”
Video de la conferencia “Desafío en la dirección de proyectos informáticos, presente y futuro”
Gracias a Luis Flores

 

  • Scrum: Retos y desafíos desde las trincheras. De 8:30 a 9:30 pm

Slides de la charla sobre retos y desafíos en la implementación de scrum
Video de la conferencia “Scrum: Retos y desafíos desde las trincheras”
Gracias a Hiroshi Hiromoto

 

Charlas

Social Media – moda o revolución. Auditorio de Física. De 6 a 8 pm

Desarrollo de aplicaciones móviles abiertas. Auditorio de Física. De 8 a 10 pm

Mención especial a la conferencia “Introducción al proyecto E-learning Chamilo” de 6 a 7 pm en el Auditorio de Ingeniería