Pinterest ve el futuro

Cómo la IA visual cambiará la forma en que comemos, jugamos y compramos.

El CEO de Pinterest, Ben Silbermann. Getty

POR MARK WILSON

Todo comenzó hace 16 meses con un aguacate. (Esto es California, después de todo).

Este aguacate en particular se colocó en una mesa de juntas en la sede de Pinterest en San Francisco. Rodeado de media docena de colegas, Albert Pereta se acercó a la fruta y apuntó con cuidado su teléfono. El director creativo de Pinterest estaba probando el último invento de la compañía, una característica llamada Lens, que, si funcionaba correctamente, no solo identificaría la fruta sino que también buscaría miles de millones de fotos que se habían subido al servicio durante los últimos siete años para Encuentra imágenes similares.

Pereta tomó la foto. La aplicación tardó unos minutos en sincronizarse con la nube y luego obtuvo los resultados. La pantalla de Pereta se llenó con un pergamino aparentemente interminable de aguacates maduros y sin piel fotografiados desde todos los ángulos imaginables.

"Mucha gente estaba asombrada diciendo:" ¡Mira qué bueno es esto! ", Cuenta Pereta. Pinterest había logrado identificar un objeto solo a través de señales visuales, un problema de ingeniería increíblemente difícil. Pero Pereta no estaba satisfecho: "Y sabes, lo estaba mirando, mil alfileres de aguacate, y pensé:" ¿A quién le importa? "

La tecnología de búsqueda visual había funcionado perfectamente, pero sus resultados no tenían sentido. Nadie toma una foto de un aguacate con la esperanza de obtener una foto casi idéntica de un aguacate, y mucho menos una secuencia interminable de ellos. "Comenzamos a preguntarle a la habitación:" ¿Qué le gustaría si tomara una foto de un aguacate? "", Recuerda Pereta. Alguien intervino diciendo que le gustaría recetas de guacamole. "Así que ni siquiera verías un aguacate, verías un poco de guacamole blando", dice Pereta. O tal vez Pinterest podría brindar información sobre cómo cultivar aguacates, o hacks que podrías hacer con aguacates. "Joder, sí, eso sería increíble", recuerda Pereta diciendo.

Hoy, la historia del aguacate ha ascendido a parábola dentro de las paredes de madera contrachapada de Pinterest HQ, un recordatorio de que la personalización es más valiosa que la perfección. Esto es especialmente cierto cuando la compañía se sumerge en el campo emergente de la búsqueda visual con herramientas como Lens, que se lanzó en versión beta en febrero pasado. Esa versión no solo invocó miles de imágenes de aguacates. Al incorporar las ideas de Pereta, la aplicación pudo ofrecer ideas sobre cosas que hacer con ellas, como, por ejemplo, hacer guacamole. Fue un primer vistazo a cómo Pinterest, en un sentido muy real, está poniendo sus esperanzas en la IA visual para revisar todo, desde cómo las personas compran hasta cómo comen.

Durante las últimas dos décadas, hemos buscado cosas en línea escribiendo una barra de búsqueda. Gracias a los avances en la tecnología de aprendizaje automático, la visión por computadora está a punto de permitirnos buscar simplemente tomando fotos. Google, Facebook, Microsoft y Amazon están invirtiendo recursos en la tecnología. No es de extrañar: Google obtendrá unos $ 28.6 mil millones en 2017 a través de la publicidad en la búsqueda de texto tradicional. El potencial para la búsqueda por voz, utilizando servicios como Alexa, Siri y Google Assistant, solo se está dando cuenta. ¿Y la búsqueda visual? Eso podría ser monumental, ya que muchos tecnólogos imaginan el teléfono inteligente del futuro viviendo no en nuestros bolsillos, sino en nuestros ojos.

"Realmente creo que la cámara será el próximo teclado", dice el CEO de Pinterest, Ben Silbermann. "Será una herramienta fundamental que utilizará para consultar el mundo que lo rodea, descubrir cosas a su alrededor o visualizar cómo algo podría encajar en su vida".

En este panorama competitivo, el inicio de Silbermann de 1.200 personas, mejor conocido por dejar que las personas fijen ideas para la decoración rústica de la boda y los favores de fiestas infantiles de bricolaje en tableros digitales, puede parecer un retador poco probable. Pero Pinterest se esconde mucho debajo de ese montón de aguacates. En un momento en que los gritos partidistas se han apoderado de muchas aplicaciones y sitios web, los 200 millones de usuarios mensuales de Pinterest recurren al servicio para literalmente imaginar una vida mejor, ya sea en la forma de una sala de estar más acogedora, un viaje de aventura o un refrigerio saludable. Según un estudio de Nielsen, no están buscando pornografía de comida, como Instagram, sino comidas cotidianas que realmente pueden cocinar: el noventa y ocho por ciento de los usuarios de Pinterest informa haber probado cosas nuevas que encuentran en el servicio. Y los anunciantes están abrazando el sitio. Se proyecta que los ingresos anuales de Pinterest se quintuplicarán a $ 500 millones de 2015 a 2017, mientras que sus usuarios crecen en todo el mundo en un saludable 40%. (Pinterest se negó a comentar sobre el crecimiento de los ingresos y las proyecciones).

El cofundador de Pinterest Evan Sharp. Getty

La popularidad de Pinterest se basa en su capacidad para crear un "gráfico de sabor" único para cada usuario, conectando de forma extraña los puntos entre sus pines para inferir qué más podría interesarle. Ahora, está trabajando para incorporar la visión por computadora en su comprensión profunda del usuario preferencias "Todo depende de la utilidad de Pinterest para descubrir ideas para tu vida real", dice Silbermann. "Si las personas realmente usan Pinterest para decidir todas las cosas que van a poner en su casa, o la comida que van a cocinar, o sus próximas vacaciones, hay un gran valor allí". Eso significa que Pinterest no solo tiene que dominar la búsqueda lo único que estás buscando, como lo hace Google; También tiene que predecir las cosas que nunca supiste que querías. Si la empresa tiene éxito, podría usar nuestras cámaras para desbloquear un mundo de descubrimientos personales y sin fin.

"El impacto duradero de la búsqueda visual no será ningún producto o característica específica", dice el cofundador de Pinterest Evan Sharp, "más bien lo que permite a las personas hacer: convertir todo lo que ven en algo que pueden usar para descubrir más en Internet".

Estoy de pie en un apartamento húmedo y ajardinado en el barrio SOMA de San Francisco. Las ventanas del estudio son simples hendiduras en las paredes, tapiadas para privacidad por la noche, pero la puerta principal es de vidrio, lo que hace que la modestia sea más o menos imposible. El precio de $ 250 por noche que Airbnb cobra por este apartamento parece absurdo, pero el alquiler está inmaculadamente organizado con toda la alegría de mediados de siglo de un tablero estereotípico de Pinterest.

Saco la aplicación de Pinterest. Incluso en la iluminación del sótano, Lens funciona extraordinariamente bien, haciendo coincidir los objetos que fotografío con una nitidez específica. Lens ve no solo una silla, sino una silla de club. No solo una almohada, sino una almohada kilim. No solo "arte" sino una pintura de Rothko. En realidad estoy aprendiendo algo. Muchos resultados tienen enlaces accionables que puedo fijar o incluso comprar.

Más tarde, intenté poner fotos similares a través de Google Lens, un competidor de lentes de Pinterest que se lanzó a principios de este año, en versión beta, en los teléfonos Pixel. La versión de Google no entiende que ve una silla, o incluso muebles, y me ofrece una disculpa. Confunde la almohada con una colcha. Lo único que coincide correctamente es la impresión de Rothko, aunque vale la pena señalar que identificar el arte 2D es ampliamente considerado como uno de los desafíos más simples para las herramientas de búsqueda visual.

Google Lens simplemente no es muy bueno. Al menos no todavía. Pero puede ver cómo la IA visual se vincula con el imperativo comercial más grande de la compañía, así como con el de otros gigantes tecnológicos. Google está en el negocio de la indexación, por lo que tiene sentido que la compañía quiera ayudar a los usuarios a identificar visualmente el mundo que los rodea. Facebook tiene su gráfico social, enfocado en conectar a los usuarios con amigos, y un interés personal en usar IA para identificar caras. Amazon tiene comercio electrónico. Para ello, la búsqueda visual podría ser un puente entre el mundo físico y el digital, por ejemplo, permitiéndole fotografiar un par de zapatos para buscar unos similares, quizás más baratos, en Amazon. Cada compañía puede enfocar la IA visual de manera diferente, pero las implicaciones son las mismas: hay dinero en juego en este floreciente campo, incluso si es demasiado pronto para articular cuánto. "Piense en la posibilidad de tomar una foto para buscar algo que ni siquiera puede describir, es algo muy poderoso", dice el analista de búsqueda de Forrester, Collin Colburn. "Podría ser la [búsqueda] más inmadura, pero probablemente tenga el mayor potencial".

Google tiene cientos de empleados trabajando solo en IA visual. Facebook tiene 20,000 empleados y 300 investigadores de IA, además opera 1.2 millones de experimentos visuales de IA en la red social en cualquier momento. Amazon tiene más de 500,000 empleados con 5,000 trabajando en Alexa, su nuevo Echo Show presenta no solo un micrófono, sino también una cámara para interactuar con Alexa, una cámara le da a Amazon la vista de toda una habitación dentro de su hogar. Pinterest? Tiene solo 12 empleados dedicados a la búsqueda visual.

Pero Pinterest es más poderoso de lo que parece. Para empezar, tiene un conjunto de datos masivos en el que entrenar su IA visual. Cuantas más imágenes tenga, más inteligente será el algoritmo y mejor servirá para servir las recomendaciones que los usuarios realmente desean. El conjunto de datos públicos más grande utilizado por muchos investigadores, Image Net, consta de 14 millones de fotos de objetos cotidianos de crowdsourcing. Pinterest tiene miles de millones, cargados por ansiosos pinners, extraídos de blogs y publicados por las propias corporaciones, la mayoría de los cuales están inmaculadamente organizados e iluminados porque son fotografías oficiales de productos. Las computadoras ven imágenes perfectas con más facilidad. Igual de importante: estas fotos han sido etiquetadas a mano y etiquetadas por los propios usuarios leales de Pinterest durante años.

“Desea tener muestras de todo lo que puede suceder y todo lo que se puede ver. Cuanto mayor sea el conjunto de datos, mayor será la probabilidad de que no te sorprendas ", dice Manuela Veloso, directora de aprendizaje automático de la Universidad Carnegie Mellon. "Lo interesante de los miles de millones [de Pinterest] es que van a cubrir los extremos".

También ayuda que Pinterest, por diseño, ofrezca resultados algo confusos para cualquier búsqueda. Las consultas sobre chaquetas vaqueras generarán resultados con chaquetas vaqueras. Pero si una imagen en el feed tiene mezclilla negra en lugar de azul, o tal vez una cartera de mezclilla azul, no parece un error. Esa es la lección que Pinterest aprendió de los aguacates. Las coincidencias exactas son la especialidad de la búsqueda de Google, que se ha optimizado para responder a preguntas específicas, como "¿Cómo se cocina el pescado?", Con el enlace perfecto. Los usuarios de Pinterest tienden a plantear consultas más vagas: pueden buscar "ideas para la cena de mariscos" varias veces a la semana. Para ellos, una coincidencia no exacta no es un error. Es la inspiración.

En otras palabras, la inteligencia artificial de Pinterest puede fallar en una búsqueda visual, pero aún así la respuesta es correcta. Imagina a Siri haciendo lo mismo. “En algunas otras compañías, hablamos mucho sobre retiros precisos. Pero al final del día, es lo útil que se siente el usuario [una característica es] ", dice Li Fan, jefe de ingeniería de Pinterest. “Es posible que no requieran una precisión del 100%. Está bien. Siempre que cumplamos con las expectativas, sienten que es una experiencia consistente, sienten que es útil ".

Pinterest también ha engendrado la confianza de sus usuarios en un momento en que las plataformas de la competencia están bajo fuego por invadir la privacidad. Las personas ven a Pinterest como algo más que un motor de búsqueda o una red social. "La relación que intentamos tener con nuestros usuarios es que, cuando compartes cosas sobre ti, las compartes porque quieres mejores recomendaciones y te las damos", dice Silbermann. “Esa expectativa es bastante clara. Estás utilizando Pinterest para encontrar estilo, así que si te preguntamos, "¿Cuáles son tus colores favoritos?", No hay nada [invasivo] en eso ". Ese tipo de interacciones permiten a Pinterest ofrecer resultados sorprendentes y precisos. Y lo hace en un lenguaje de diseño que se siente más curado que calculado, más humano que robótico.

Pinterest se fundó en 2010 con una gran apuesta por el diseño: una plataforma que le permite recopilar y ordenar los temas que le interesan, no como enlaces de texto azul feo, sino como fotos magníficas que se encuentran en tarjetas de índice virtuales. El cofundador Sharp fue el visionario creativo, un diseñador que se formó en la Graduate Architecture School de Columbia, y el complemento perfecto para el CEO Silbermann, un consultor de gestión que se convirtió en emprendedor. La plataforma fue un éxito: en 2012, comScore analytics lo declaró el servicio web de más rápido crecimiento en la historia.

Pero el enfoque una vez novedoso de Pinterest para las tarjetas fotográficas ha sido adoptado por titanes como Google, que las utiliza en todo, desde los resultados de búsqueda hasta el sistema operativo de Android. Y su crecimiento meteórico se ha ralentizado. Hoy, el servicio de fijación ha sido eclipsado por Instagram, con sus 800 millones de usuarios activos mensuales, y Snapchat, con sus tecnologías radicales de realidad aumentada.

Sin embargo, en lugar de perseguir un crecimiento agresivo, Pinterest se ha duplicado en su oferta principal: predecir lo que los usuarios quieren ver. "Terminamos invirtiendo mucho en [aprendizaje automático]", dice Sharp, quien ahora se desempeña como director de producto, mientras pasea por una mesa de conferencias con una camiseta blanca con la marca Pinterest. Sharp no tiene su propia oficina, técnicamente. Nadie en Pinterest lo hace. En cambio, se ha apoderado de una pequeña habitación con una mesa redonda de estilo King Arthurian en el centro. En la pared del fondo hay una gran pizarra analógica adornada con un logotipo de Pinterest cosido en cruz, hecho por su madre. "La mayor parte de lo que ven [los usuarios] está determinada algorítmicamente", dice. "Es una recomendación, un resultado de búsqueda o un Pin relacionado".

Esta última característica, una lista relativamente simple de pines sugeridos, generada a partir de lo que viste por última vez, se lanzó en 2013. Pronto representó el 10% de todas las impresiones en Pinterest, pero se estancó hasta que la compañía encargó a algunos ingenieros de IA que lo hicieran. mejor en 2014. Entrenaron algoritmos para sugerir temas relacionados y recomendar elementos similares basados ​​simplemente en señales visuales, priorizando los pines que obtendrían la mayor cantidad de clics. Toque un gancho para ropa hecho de ramas de árboles caídos, y los pasadores relacionados incluyen un diagrama de Venn de sugerencias sensatas que combinan la decoración del hogar y el bosque, que incluyen un perchero para el tronco de un árbol, un divisor de habitación de árbol y una bandeja de llaves de madera de granero recuperada. Hoy, Pines relacionados representa el 40% de todo el compromiso en Pinterest.

La compañía siguió esta inversión inicial en IA visual al reclutar al gurú de la visión por computadora Fan de Google en 2016. Una pintora infantil apasionada por las artes visuales, Fan fue empujada a la ingeniería por sus padres a los 12 años. Luego comenzó a trabajar en Google durante ocho años, antes de liderar a los 1,000 ingenieros que trabajan en la búsqueda en Baidu. Luego regresó a Google nuevamente, optando por un papel más enfocado como jefe de búsqueda de imágenes de Google. Finalmente, Pinterest llegó golpeando. "Los valores de Li, como líder y persona, estaban muy alineados con los valores de Pinterest", dice Silbermann. "Una cosa que realmente me impactó fue que vio la tecnología como una forma de enriquecer la vida de las personas, no la tecnología por el bien de la tecnología".

Bajo Fan, las búsquedas visuales de Pinterest, realizadas en Lens, Pins y la extensión del navegador de la compañía, han aumentado casi un 70% año tras año, con más de 300 millones de búsquedas al mes. Mientras tanto, los socios comerciales de Pinterest han visto duplicar el volumen de clics en sus pines "Shop the Look", una característica que permite a los usuarios hacer clic y comprar artículos en imágenes.

Todo esto converge en una rica oportunidad de negocio. "Originalmente [Pinterest] fue comisariada por categoría, por personas", dice Rick Heitzmann, capitalista de riesgo de FirstMark Capital, quien redujo a los cofundadores de Pinterest su primer cheque en 2009 y ha estado involucrado en todas las rondas de inversión desde entonces. "Pero a medida que la tecnología ha evolucionado, se trata de inteligencia artificial, reconocimiento de imágenes y de encontrar las cosas que aman y les importan". A medida que la misión de Pinterest se codifica hacia la búsqueda visual, Heitzmann está entusiasmado con las oportunidades. "Se puede ver que el mercado potencial es grande".

Pinterest ya ofrece a los anunciantes que desean promocionar sus pines una plataforma atractiva. Los usuarios suelen estar allí en una misión: según encuestas internas, el 93% de ellos usan Pinterest para planificar compras, y el 87% han comprado algo que descubrieron a través de él, según un estudio de Milward Brown. Pero, lo que es más importante, los usuarios de pinners aún no han decidido el producto exacto que desean. Según Pinterest, el 97% de las consultas de búsqueda no tienen una marca especificada en ellas. Mientras tanto, las herramientas de búsqueda visual hacen que este proceso de descubrimiento de marca sea aún más atractivo, especialmente cuando los resultados están vinculados al "gráfico de gusto" personal del usuario.

Target se convirtió recientemente en el socio minorista exclusivo de Estados Unidos para la tecnología de lentes de Pinterest. Pronto, dentro de la aplicación principal del minorista, podrá usar una versión integrada de Lens para, por ejemplo, fotografiar una lámpara y ver una alimentación de las visualmente similares vendidas por Target. “Nuestros huéspedes anhelan la facilidad y conveniencia en cada experiencia de compra. La búsqueda visual es un gran desbloqueo para eso porque elimina gran parte de la fricción en la búsqueda de productos ", dice Rick Gomez, CMO de Target. “Simplemente tomando una foto de un artículo de interés, Pinterest Lens devolverá productos que se adaptan específicamente a lo que nuestro huésped está buscando” (Walmart, American Eagle y Tommy Hilfiger también tienen funciones de búsqueda visual en sus aplicaciones, creadas por la startup Slyce.) Pinterest también se ha asociado con Samsung para potenciar la búsqueda visual en los teléfonos inteligentes Galaxy de la compañía, y con Shopstyle, para vincular los resultados de Lens con pines comprables de más de 5 millones de accesorios de moda. Las marcas comienzan a comprender que la búsqueda visual es una parte crucial de su futuro.

El problema, por supuesto, es que las marcas tienen presupuestos de marketing limitados. Y Pinterest no es el único que quiere venderlos en IA visual.

En noviembre, Pinterest presentó su última versión de Lens: Lens Your Look, que ayuda a los usuarios a encontrar nuevas formas de usar ropa que ya poseen. Fotografíe algo en su armario, como un par de tacones negros gruesos, luego use consultas de texto para buscar prendas de vestir que puedan ir con él (como "vestidos negros"). Lens Your Look mostrará imágenes de personas con vestidos negros y tacones gruesos, tal vez incluso la misma marca y estilo que el suyo.

A medida que los usuarios tocan imágenes particulares, Pinterest descubre qué resultados fueron esencialmente correctos, o los más correctos, en la pila más grande, y puede priorizarlos la próxima vez. Es la destilación perfecta del enfoque de la empresa para la búsqueda visual: extraer su enorme base de datos, aprovechar los gustos de los usuarios y adoptar la imperfección.

Eso no significa que el flujo de usuarios de Lens Your Look se mantenga necesariamente. Sharp es el primero en admitir que el contenedor exacto para la búsqueda visual puede que aún no se haya inventado: ¿Realmente usaremos nuestros teléfonos con cámara para apuntar y buscar, o necesitamos algunos auriculares de realidad aumentada para que despegue el concepto? ? "Llegamos muy temprano", dice Sharp, "es como si estuviéramos donde la búsqueda de texto estaba a mediados de los 90 '. Existe esta tecnología, es interesante, pero en realidad nadie está lo suficientemente profundo como para saber cuál es el producto o qué problemas va a resolver ".

La pregunta sigue siendo si Pinterest, de todas las compañías, puede ser el que descifre el código. ¿Alguna vez lo "anclaremos" en lugar de "Google"? La perspectiva parece desalentadora, especialmente porque Pinterest se enfrenta a algunas de las compañías más valiosas y poderosas del mundo.

Hablando de esto en su improvisada "oficina", Sharp parece tragarse el impulso de despotricar. Quiere compartir su libro de jugadas tanto como no. Finalmente, no puede contenerse, por lo que camina hacia la pizarra y dibuja una cuadrícula de 2 × 2. En el eje x, escribe "Compartir y buscar". En el eje y, escribe "Texto y visión".

¿Compartir texto? Ese cuadrante pertenece a Facebook y Twitter. ¿Compartir la visión? Facebook, Instagram y Snapchat. Buscando texto? Eso es Google y Bing. ¿Pero buscando a través de la visión? El marcador de Sharp cuelga en el aire por un momento. Luego escribe una compañía en la caja vacía. "Pinterest". Dibujar un eje x-y y poner dramáticamente a su compañía sola en un cuadrante es un movimiento fundador clásico. Pero Sharp tiene razón en una cosa: la visión es un espacio raro y no colonizado.

“Vuelves y me gritas en 5 a 10 años. Este es el cuadrante más valioso aquí por una jodida milla ", continúa, arrojando el marcador de nuevo a la bandeja para puntuar su punto. "Esa es la premisa de Pinterest".