Reseña: «Todo el mundo miente» de Seth Stephens-Davidowitz

Por Francisco R. Villatoro, el 3 marzo, 2019. Categoría(s): Ciencia • Informática • Libros • Psicología • Recomendación • Science ✎ 5

«Las ciencias sociales se están convirtiendo en una verdadera ciencia. Y esa verdadera nueva ciencia tiene la capacidad de cambiar la vida para mejor. [Los] experimentos demuestran que la inteligencia de datos tiene la capacidad de reemplazar las corazonadas, las ideas recibidas y las correlaciones chapuceras por cosas que de verdad funcionan: causalmente. [Predigo] una revolución basada en las revelaciones de los macrodatos. Pero eso no quiere decir que podamos contestar cualquier pregunta con solo echarle datos. Más aún, la inteligencia de datos no elimina la necesidad de utilizar las demás formas de entender el mundo que han desarrollado los seres humanos a lo largo de milenios. Ambos ámbitos se complementan. [Con] una mezcla de curiosidad, creatividad y datos se puede mejorar nuestra comprensión del mundo. En los datos se ocultan historias dignas de contarse».

El libro de Seth Setphens-Davidowitz, «Todo el mundo miente. Lo que Internet y el big data pueden decirnos sobre nosotros mismos», Capitán Swing (2019) [287 pp.], traducido por Martín Schifino, me ha hecho pensar. Y eso es lo que más me gusta de un libro. Seguro que si no has leído ningún otro libro sobre la revolución de los macrodatos y lo que las grandes corporaciones como Google, Facebook, Amazon o Netflix saben sobre tí, también te hará pensar. Incluso si ya has leído otros libros sobre este tema tan de actualidad, éste destaca por su cuidada escritura; se lee muy fácil y combina vivencias personales con investigaciones del propio autor, además de entrevistas a e investigaciones de otros científicos de datos. Sin lugar a dudas, un libro que merece la pena.

El autor fue científico de datos en Google siendo licenciado en Filosofía y doctor en Económicas. Ahora es profesor en The Wharton School y articulista de opinión para el New York Times. Su libro ha sido todo un éxito de ventas, así que pronto nos deleitará con alguno más.

Tras el prólogo de Steven Pinker y la introducción, encontramos ocho capítulos divididos en tres partes, la conclusión y los agradecimientos. En el prólogo [pp. 9-11], Pinker nos dice que «los big data o macrodatos de las búsquedas de internet y otras huellas en línea no constituyen un «cerebroscopio», [pero] ofrecen una visión sin precedentes de la psique humana». Y confiesa que le «impactó sobremanera lo que revela internet sobre la sexualidad humana». En la «Introducción. El perfil de una revolución» [pp. 15-35], el autor se describe: «soy experto en datos de internet. Todos los días rastreo huellas digitales que se dejan al transitar por la red. A partir de los botones o teclas que apretamos, intento entender qué queremos en realidad, qué haremos en realidad y quiénes somos en realidad». Y nos relata su propia historia, con Obama, el racismo y Trump como protagonistas. «Con frecuencia la gente miente: a sí misma y a los demás». Sobre todo en las encuestas y los sondeos.

«Las búsquedas de Google constituyen el conjunto de datos más importante jamás recopilado sobre la psique humana. [Estos] nuevos datos, que están cada vez más disponibles en nuestra era digital, ampliarán radicalmente nuestra comprensión de la humanidad». Así llegamos a la primera parte «Datos grandes, datos pequeños», constituida por el capítulo 1, «Malas corazonadas» [pp. 39-55], que se inicia con los consejos de su abuela, tan intuitivos ellos. «La mejor ciencia de datos, en realidad, es sorprendentemente intuitiva. [Casi] cualquier persona inteligente puede comprender los mejores estudios de macrodatos. Si un estudio no se entiende, lo más probable es que el problema resida en el estudio, no en el lector». Por ejemplo, en contra de la opinión popular, el autor nos muestra que «un mejor estatus socioeconómico brinda una mayor probabilidad de llegar a la NBA».

La segunda parte, «Las capacidades de los macrodatos», se inicia con el capítulo 2, «¿Tenía razón Freud?» [pp. 59-68]. «Karl Popper, el filósofo austro-británico, afirmó que las teorías de Freud no eran falsables. No había manera de demostrar si eran verdaderas o falsas. [Hasta] ahora, claro». Por ejemplo, «la teoría freudiana de que los errores revelan nuestros deseos subconscientes es falsable; y, según mi examen de los datos, falsa. [Pero] ¿erraba Freud el tiro en todas sus teorías? No tanto. La primera vez que tuve acceso a los datos de PornHub, di con una revelación que me pareció cuando menos un poco freudiana. [Un] número impactante de personas buscan representaciones de incesto en los sitios pornográficos convencionales».

«Los macrodatos tienen cuatro capacidades únicas. [1:] Ofrecer nuevos tipos de datos. [2:] Proporcionar datos honestos. [3:] Permitirnos enfocar pequeños subgrupos de personas. [Y 4:] Permitirnos hacer muchos experimentos sobre relaciones causales». Así nos adentramos en «¿por qué importa la inteligencia de datos?» en el capítulo 3, «Datos reinventados» [pp. 69-114], que se inicia describiendo el uso de Google Correlate. «La revolución de los macrodatos depende menos de recolectar cada vez más datos que de reunir los datos apropiados». El autor nos pone el ejemplo de los parámetros fisiológicos de los caballos de carreras en «Los cuerpos como datos». Cómo la selección de las palabras aporta más información que su propio significado en «Las palabras como datos». Y finaliza con el uso de «Las imágenes como datos».

El libro incluye un gran número de referencias bibliográficas a pie de página, muchas de ellas de artículos científicos y periodísticos del propio autor. También se incluyen enlaces a su página web donde se recopilan los datos usados, para que todos los interesados puedan reproducir sus conclusiones. El capítulo 4, «Suero de la verdad digital» [pp. 115-170], justifica el título del libro: «Todo el mundo miente. [En] las encuestas, mucha gente se guarda información sobre las conductas y los pensamientos vergonzosos. Quiere salir bien parada, aun cuando la mayoría de las encuestas sean anónimas. [El] sesgo de deseabilidad social». Aunque «otro motivo para mentir es simplemente burlarse de las encuestas», algo típico entre adolescentes afirma el autor.

«A veces escribimos en Google lo que pensamos sin censura, sin gran esperanza de que pueda ayudarnos. En ese caso, la ventana de búsqueda funciona como un confesionario. [Según] mis investigaciones, las búsquedas que expresan pensamientos frente a las que piden información, solo son realizadas por una pequeña porción de las personas a las que se les ocurre el pensamiento». Por ejemplo, «la mayoría de las personas nunca piensan que pueden arrepentirse de tener hijos. Pero algunas lo hacen. Puede que no lo admitan delante de nadie, salvo de Google».

La sexualidad de los estadounidenses es uno de los temas más jugosos del libro. En la sección «La verdad sobre el sexo» aparecen curiosidades como que «he calculado que un hombre que busca información sobre Judy Garland tiene tres veces más posibilidades de buscar pornografía gay que pornografía heterosexual». Pero me resultó más interesante «La verdad sobre el odio y el prejuicio» sobre racismo. Tras «La verdad sobre internet», «La verdad sobre el abuso infantil y el aborto», «La verdad sobre tus amigos de Facebook», llegamos a «La verdad sobre tus clientes», donde Xavier Amatriain, «un excientífico de datos de Netflix [afirma que] «los algoritmos te conocen mejor de lo que te conoces a ti mismo»». Finaliza el capítulo con «¿Podemos soportar la verdad?», que nos recuerda que «concienciarnos sobre nuestros prejuicios subconscientes también puede ser útil».

El capítulo 5, «Más de cerca» [pp. 171-207], afirma que «si tenemos suficientes datos, podemos ver cómo se comporta la gente en pueblos y ciudades particulares. Y podemos ver cómo se conducen hora a hora y minuto a minuto. [Vemos] la conducta humana en primer plano». Se centra en Estados Unidos, pero se mencionan otros países. «¿Estados Unidos es una «tierra de oportunidades»? La respuesta no es ni que sí ni que no. La respuesta es: algunas partes del país lo son; otras, no». En «¿Qué ocurre realmente en nuestros condados, ciudades y pueblos?» nos encontramos curiosidades como que «los pobres que viven cerca de los ricos hacen más ejercicio, fuman menos y tienen menos probabilidades de padecer obesidad».

«¿En qué ocupamos los minutos y las horas?» se resuelven dudas como si las películas violentas pueden incitar conductas violentas [te destripo la duda: no]. Por ejemplo, «la violencia doméstica aumenta inmediatamente después de que el equipo de fútbol [americano] local pierda un partido que se esperaba que ganase». Me ha resultado muy curioso «Nuestros dobles», donde se afirman que «la búsqueda del doble [es] el mejor método jamás creado para predecir el desempeño de los beisbolistas» [¿también lo será para los futbolistas?]. La idea se puede aplicar a muchos campos. «La pediatría se revolucionaría con solo crear un conjunto de datos completo de las tablas de estatura y peso de los niños y de todas las enfermedades que puedan tener. De ese modo, la curva de crecimiento de cada niño podría compararse con la curva de crecimiento de todos los demás. [Y] señalar automáticamente cualquier patrón problemático».

Lo importante no son los datos, per se, sino las «Historias de datos», como si el científico de datos fuera un Sherlock Holmes. El capítulo 6, «Todo el mundo es un laboratorio» [pp. 209-240] nos habla «de la diferencia entre correlación y causalidad, un tema muy importante en el análisis de datos. [Los] ensayos aleatorizados se utilizan cada vez más en las ciencias sociales». Aunque a veces se llaman pruebas A/B como se describe en «El ABC de las pruebas A/B», muy usadas por los diseñadores de páginas web; el autor nos pone ejemplos de la campaña electoral de Obama y de la publicidad en Google. «Nos guste o no, la experimentación es una de las herramientas esenciales con las que ahora cuentan los científicos de datos».

«Los experimentos crueles, pero iluminadores, de la naturaleza» nos habla de los anuncios en la Super Bowl. «Los anuncios surten efecto. [Pero] no solo surten efecto. Son increíblemente efectivos. De hecho, [los] márgenes son enormes. [Son] tan efectivos para aumentar la demanda que, en realidad, a las empresas les salen baratos». Me ha resultado curioso cómo afectan los asesinatos de presidentes a la historia del mundo. O cómo los incentivos financieros afectan a lo que recetan los médicos. Por cierto, «los médicos no prestan gran atención a los incentivos financieros de cara a las cosas que ponen en riesgo la vida; prestan mucha atención a los incentivos financieros ante las cosas sin importancia».

«La categoría de los experimentos naturales que aprovecha cortes numéricos abruptos es tan poderosa que tiene su propio nombre ente los economistas: discontinuidad en la regresión». Estos experimentos tan interesantes nos llevan a la tercera parte, «Macrodatos: precaución», con el capítulo 7, «¿Macrodatos, macrochascos? Lo que no se puede hacer con ellos» [pp. 243-255]. Se inicia con una refrescante anécdota entre Lawrence Summers y el autor sobre la predicción de los mercados financieros usando macrodatos. «¿Se pueden utilizar los macrodatos para predecir con éxito los movimientos de la bolsa? La respuesta breve es que no». La razón es que somos víctimas de «La maldición de la dimensionalidad», es decir, «someter a prueba demasiadas cosas».

La relación entre el genoma humano y el coeficiente intelectual es uno de los ejemplos. «Los científicos saben que el genoma humano difiere en millones de formas. Simplemente, hay demasiados genes que analizar. [Cuantas] más variables se consideren, más cauto habrá que ser y, en consecuencia, más rigurosas deberán ser las pruebas fuera de muestra. Así nos adentramos en «El énfasis excesivo en lo medible» y llegamos al capítulo 8, «¿Más datos, más poblemas? Lo que no deberíamos hacer» [pp. 257-268]. «A veces, el poder de los macrodatos es tan impresionante que da miedo. Plantea problemas éticos». Como «El peligro del poder de las corporaciones», ya que «los datos en internet pueden señalar a las empresas qué clientes deben evitar y a cuáles pueden explotar. [Hasta] la fecha, los macrodatos han ayudado a ambas partes en la lucha entre consumidores y empresas. Debemos asegurarnos de que la lucha siga siendo justa».

«El peligro del poder de los Gobiernos» nos aconseja que «debemos guardarnos de permitir que el Gobierno intervenga a nivel individual en respuesta a los datos de búsqueda. Y no solo por motivos éticos o legales. Al menos de momento, también por motivos científicos inherentes a los datos». Así llegamos a la «Conclusión: ¿Cuántas personas acaban los libros?» [pp. 271-281]. Tras presentar sus problemas para acabar el libro, nos encontramos con un capítulo bastante flojo, que desmerece mucho al resto. Una pena.

Por ejempo, no me gustado este comentario: «Si Karl Popper estuviera vivo hoy, [habría] más probabilidades de que se preguntase si los grandes teóricos de cuerdas de hoy son científicos en toda regla o solo se dan el gusto de dedicarse a la gimnasia mental». No creo que un filósofo de su altura perdiera el tiempo con estas nimiedades. Tampoco este otro: «Toda la psicología poddía utilizar las herramientas de Silicon Valley para optimizar notablemente sus investigaciones. Espero con impaciencia el primer artículo de psicología que, en lugar de detallar un par de experimentos hechos con unos pocos estudiantes, muestre los resultados de un millar de rápidas pruebas A/B».

Me ha gustado su confesión como escritor: «Me tomó cinco meses y 47 borradores escribir mi primera columna sobre sexo para The New York Times, que tenía 2.000 palabras. Para algunos capítulos de este libro hice 60 borradores. Puedo pasarme horas buscando la palabra necesaria para una frase de una nota al pie. [Pero,] por mucho que me esfuerce en pulir la prosa, la mayoría de [los lectores] leerán las primeras 50 páginas, recordarán algunas ideas sueltas y seguirán con su vida. [Según] los macrodatos, muy pocos siguen leyendo».

Finaliza este libro que me ha gustado mucho con los «Agradecimientos» [pp. 285-287]. Lo que más me ha gustado es que me ha hecho pensar sobre qué cosas de mi labor como divulgador podrían ser exploradas usando macrodatos y las herramientas que ofrece Google. Por desgracia, mis primeros intentos me han mostrado que se requiere tiempo, mucho tiempo, mucho más tiempo del que puedo dedicar a esta labor en estos momentos. Así que te recomiendo este libro, que seguro que te hará pensar a ti también.



5 Comentarios

  1. Solo he leído tu artículo, no el libro que recomiendas. Desde ese desconocimiento, me ha parecido que el libro está lleno de paradojas, conclusiones que como tú dices han sido «sospechadas» y algunas demostradas por otras disciplinas (sociología, filosofía, ensayos, medicina…). Además, según se infiere por el estudio, no deja de ser una muestra de la población humana (usuarios de Internet) y aunque representativa supongo que habrá que poner en duda eso de la «correlación VS causalidad».
    La conclusión de todo el estudio, y ya digo que puedo estar diciendo una bobada ignorante, es eso de la tierra de oportunidades en EEUU, unos sitios si y otros no.
    Creo que, para mi, la conclusión verdadera del libro está en el titulo; «Todo el mundo miente», quizá no por maldad sino por ignorancia.

  2. A mí me ha parecido –y tampoco he leído el libro– un chico apresurado que no ha estudiado lo suficiente. Como profesor de epistemología y filosofía no lo desaprobaría, pondría la nota mínima y le diría que siga, que tal vez en adelante…
    Pero lo más importante, me parece, es señalar que este muchacho es un representante típico de un «tipo» –redundemos– de intelectual-periodista-publicista-vendedor interesado en primer lugar en incrementar su valor de portfolio y su posicionamiento competitivo, al estilo de Yuval Harari y otros ¡varios! cuyos nombres no retengo.
    Al público: no confundir a este último con un historiador ni a Seth con un filósofo. Son gente del espectáculo.

  3. Estaría bueno que las personas comenten luego de leer el libro y no sobre la base pura de desconocimiento. Desacreditar un trabajo sólo por opiniones personales, es bien bajo.

    Por otro lado, por recomendación de una profesora y por tu reseña voy a leer el libro.
    Luego, te digo qué tal.

Deja un comentario