Durante mi tiempo en Amazon en el equipo de diseño de voz de Alexa, monitoreamos el alias interno de los entusiastas de Alexa. Aproximadamente una vez al mes, un recién llegado a la lista resucitaría una solicitud perenne: “Mis hijos son groseros con Alexa. ¡Ella solo debería responder si tú dices por favor!

Esa solicitud, por supuesto, no es específica para los empleados de Amazon. De hecho, Chaim Gartenberg en The Verge reflexionó sobre este tema mientras yo estaba escribiendo esta pieza:

Exigir que mi teléfono encienda y apague las luces comenzó a sentirse extraño decir en voz alta, lo que me hizo preguntarme: ¿estaba siendo grosero con mi teléfono inteligente?

Y nosotros, como humanos, deberíamos cuestionar el efecto que nuestras interacciones de dispositivos tienen en nuestra propia humanidad, sobre todo la de estos asistentes digitales que aprovechan nuestros cerebros con cables sociales para un mejor efecto.

Pero, ¿qué estamos pidiendo realmente cuando buscamos un marco formal para la cortesía, como exigir "por favor" y "gracias", en nuestras interfaces de usuario de voz? Si se despliega de manera gruesa, este mecánico aparentemente útil podría ser contraproducente involuntariamente. Es mejor tomarse un momento y deconstruir la solicitud. ¿Cuál es la mejor manera de modelar la cortesía en las VUI?

La importancia de las neuronas espejo

Estas solicitudes de un "modo de cortesía" se hacen casi universalmente en el contexto de los niños que utilizan asistentes de voz. Pero, ¿simplemente requeriría palabras clave "educadas" de los niños el efecto deseado?

Las neuronas espejo son una adición relativamente reciente a nuestra comprensión de la psicología cognitiva, pero aquí tienen una importancia particular. De una entrevista de Scientific American con el pionero de la neurona espejo Marco Iacoboni:

Lo que hace que estas células sean tan interesantes es que se activan tanto cuando realizamos una determinada acción, como sonreír o alcanzar una taza, como cuando observamos a otra persona realizar esa misma acción. En otras palabras, colapsan la distinción entre ver y hacer. En los últimos años, Iacoboni ha demostrado que las neuronas espejo pueden ser un elemento importante de la cognición social ...

Considere un niño que interactúa con un asistente de voz como Alexa. Ese niño ya está privado de la capacidad de ver a su compañero de conversación (el dispositivo) exhibir signos físicos de "cortesía", y es poco probable que las neuronas espejo se activen simplemente escuchando hablar al dispositivo.

Sin embargo, ver a un padre interactuar educadamente con Alexa sería mucho más probable que desencadene esas neuronas espejo que facilitan la cognición social y el aprendizaje. Tal vez no sea tanto que el dispositivo necesite exigir que el niño hable cortésmente. Establecer un modo de cortesía universal en un dispositivo obligaría a los padres a modelar este contrato social para sus hijos, proporcionando un nuevo tipo de escuela de terminación en el hogar.

Pero esto requiere un esfuerzo adicional para los padres, y dudo que esto sea realmente lo que la mayoría de los padres que solicitan esta función tienen en mente. Requerir "por favor" a cada paso probablemente conducirá rápidamente a la frustración, posiblemente contraproducente.

De hecho, si los adultos tratan la cortesía requerida como frustrante con el tiempo, podríamos accidentalmente enseñar a los niños que la cortesía es frustrante; un impuesto social Para desarrollar un sistema humano que funcione tanto para los padres como para los niños, debemos comprender mejor lo que realmente implica el contrato social de "cortesía" en el contexto de estos asistentes de voz.

Para desarrollar un sistema humano que funcione tanto para los padres como para los niños, debemos comprender mejor lo que realmente implica el contrato social de "cortesía" en el contexto de estos asistentes de voz.

La palabra mágica

Las manifestaciones de "cortesía" varían enormemente de un país a otro, por lo que un "modo de cortesía" ya es un concepto resbaladizo en el mejor de los casos. Además, la cortesía será muy costosa de localizar, ya que puede requerir un diseño de sistema completamente diferente de una región a otra. Nunca debemos suponer que la cortesía en un país se aplica a las normas de otra región.

En los Estados Unidos, a muchos niños se les enseña que "por favor" es la palabra mágica, una palabra que abre la acción en nombre de los adultos "educados". ¿Significa esto que un "modo de cortesía" debería requerir "por favor" en todo momento?

Irónicamente, la mayoría de los asistentes de voz no se comercializan ni optimizan intencionalmente para alentar el uso de los niños, en gran parte debido a la legislación (necesaria) que desalienta la recopilación de datos de los niños. Pero hagamos caso omiso de ese hecho, en aras de la discusión. ¿Cómo podríamos hacer cumplir el uso de "por favor"?

Opción A: responder como lo haría un padre, quizás un poco conciso.

"Alexa, pon una alarma".
"No escuché la palabra mágica ..."

Imagine obtener esta respuesta a las 11 p.m. cuando te estás preparando para la cama. ¿Cómo te sentirías? O, tal vez, cuando intente establecer un temporizador de tiempo de espera para su hijo en el calor del momento. ¿Sería corregido por falta de cortesía cuando se trata de disciplinar a un niño realmente ayudar a resolver el problema?

Opción B: completa la acción, pero agrega algo de refuerzo.

"Alexa, configura una alarma para las 7 a.m. de mañana".
“Tu alarma está programada para las 7 a.m. de mañana. Por cierto, me hace feliz cuando dices "por favor".

Menos inmediatamente molesto, pero predicador. ¿Puedes decir honestamente que esto no te irritaría y tal vez provocar una respuesta negativa frente a los niños que se supone que debemos enseñar?

Opción C: giro hacia refuerzo positivo.

"Alexa, configura una alarma para las 7 de la mañana mañana".
“Tu alarma está programada para las 7 am de mañana. ¡Gracias por preguntar tan educadamente!

Las indicaciones de hoy permanecerán como están, pero el uso exitoso de la palabra "por favor" en los escenarios apropiados podría resultar en un intercambio más agradable. Naturalmente, queremos variar las respuestas "agradables" para que no se vuelvan demasiado repetitivas, ya que estamos tratando de alentar el uso más frecuente de Please.

Opción D: ir abstracto y reflejar la brusquedad del discurso descortés.

"Alexa, configura una alarma para mañana a las 7 a.m."
"Bien, tu alarma está configurada".

Si bien no recomendaría necesariamente este enfoque, ya que es una regresión de la experiencia del usuario, la falta de cortesía significa que el sistema es menos comunicativo con la información. Si desea la confirmación completa ("Su alarma está programada para las 7 p.m. de mañana"), debe ser cortés al respecto.

Entonces, ¿cuál es el enfoque correcto? No hay bala de plata; probablemente depende no solo del tono y el comportamiento de su asistente, sino también de su marca y el contexto de uso. Y, por supuesto, es probable que haya muchas otras formas de atacar este problema. Pero las cuatro opciones corren contra la repetitividad, especialmente si se aplican a todas las solicitudes.

Un tiempo y un lugar

Si examina sus conversaciones a lo largo del tiempo, el hecho es que no es probable que diga Por favor cada vez que haga una solicitud. "Por favor" es más probable en situaciones específicas. Por ejemplo:

  • La primera solicitud en una conversación.
  • Solicitudes hechas en público
  • Solicitudes que requieren un esfuerzo particular en nombre del destinatario
  • Peticiones más cortas. (Para preguntas más largas, la redacción en sí misma puede ser suficiente para transmitir cortesía, por ejemplo, "¿Puedo tener una cookie?")

Y en otras situaciones, tendemos a perdonar a nuestros compañeros cuando olvidan la "palabra mágica". En situaciones estresantes, o cuando una tarea es urgente, no esperamos cortesía. Si su horno está en llamas, "¡Apague el fuego!" Es quizás un nivel de formalidad indebido por el momento.

Esto tiene implicaciones interesantes para los asistentes que llegan a entornos de trabajo o entornos de alta carga cognitiva como los automóviles (o incluso las cocinas). Para evitar frustraciones indebidas, nuestro "modo de cortesía" debe tener en cuenta nuestro estado y nuestro entorno. Después de todo, eso es lo que debe hacer el ser humano.

Estresado, con los ojos y la mente en la carretera, ¿este conductor realmente se beneficia de un

Además, exigir por favor significa ser lo suficientemente flexible como para aceptarlo en cualquier lugar que aparezca en una oración; si pregunto cortésmente "¿Podrías interpretar a Madonna?", Sería grosero responder "No escuché la palabra mágica" solo porque " por favor 'apareció en medio de un enunciado. Para evitar gravar excesivamente a los clientes, nuestras interfaces de voz deben estar preparadas para la colocación arbitraria de estas palabras clave.

Dar las gracias

Pero la cortesía no se trata solo de una sola palabra. Hay otras formas de expresarse cortésmente (usando títulos y honoríficos, etc.). Y, por supuesto, existe el concepto de agradecimiento. Cuando un trabajo está bien hecho o apreciado, agradecemos a nuestro socio de conversación por sus esfuerzos.

Las interfaces de voz actuales tienden a estar activadas por la palabra de activación, lo que hace que las gracias sean algo incómodas. Para agradecerle a Alexa, uno debe prefacio formalmente con la palabra de activación: "Alexa, gracias". Solo gritando gracias no activará el micrófono, y el dispositivo nunca lo "escuchará".

La alternativa, hacer que su altavoz inteligente escuche después de cada interacción de "gracias", es un riesgo de privacidad. Sé que los dispositivos Alexa, por ejemplo, tienen un enfoque estricto de la privacidad y no encenderán el micrófono después de que se complete una solicitud sin escuchar la palabra de activación. Al final, creo que la pérdida del más natural "Gracias" vale nuestra mayor privacidad en general.

Dejando de lado la incomodidad, ¿qué incentivo tenemos para dar gracias? ¿Por qué lo hacemos? En nuestro contrato social de persona a persona, el concepto de "gracias" se utiliza para proporcionar a nuestro compañero de conversación una sensación de aprecio: felicidad, satisfacción o incluso orgullo. Con el tiempo, construimos confianza en una relación al mostrar que vemos y apreciamos el esfuerzo realizado. Y a cambio, a veces somos recompensados ​​al ver mejorar el estado de ánimo de nuestro compañero de conversación.

Entonces, ¿cuál es el estado de ánimo equivalente para un asistente de voz? ¿Recibir "gracias" con frecuencia puede hacer que un asistente sea más feliz? ¿Más familiarizado con nosotros? Quizás el "agradecimiento" frecuente disminuye la importancia del "por favor", ya que el respeto neto que se muestra es el mismo. En el contrato social humano, las personas que se sienten agradecidas y apreciadas a menudo van más allá. ¿Podría manifestarse eso en nuestros dispositivos?

Gamificación o falta de ella

Una idea de la que me he alejado intencionalmente es la de gamificar estas interacciones educadas. Por supuesto, podríamos rastrear el nivel de "cortesía" de un cliente, otorgando puntos por favor / gracias y eliminándolos por omisiones frecuentes. Pero cuando aplicamos ese nivel de abstracción, disociamos la cortesía de sus beneficios humanos. En lugar de enseñar a los niños (y / o adultos) cómo la cortesía mejora nuestras interacciones, simplemente estamos proporcionando un marco para interactuar con dispositivos digitales, uno que ciertamente puede ser manipulado.

Al final, cualquier sistema que use la cortesía como una puerta para la funcionalidad central puede ser contraproducente. Reforzar el buen comportamiento también significa igualar la motivación que le gustaría ver en el mundo real. Como lo expresó The Verge:

Soy cortés con mis asistentes inteligentes porque también quiero ser cortés con la gente, y reforzar los hábitos groseros parece una mala idea.

Por otro lado, la gamificación a menudo consiste en proporcionar comentarios oportunos y satisfactorios para reforzar comportamientos específicos. Si podemos encontrar una manera de hacer que la retroalimentación no sea cuantitativa, es decir, si encontramos una manera de hacer que nuestras VUI respondan positivamente al comportamiento cortés sin muletas de gamificación como puntos o insignias, creo que tendremos una mejor oportunidad de tener un impacto positivo genuino y duradero en los comportamientos sociales.

Hacia experiencias de voz más humanas

Claramente, salimos de esta discusión con más preguntas que respuestas. Me encantaría ver más exploración en este espacio. Quizás la investigación académica sobre los efectos duraderos de las construcciones de "cortesía" en la interacción longitudinal (es decir, a largo plazo) con los asistentes digitales podría ayudar. También serían útiles los estudios bien construidos sobre los beneficios potenciales para los niños de tener asistentes habilitados para la cortesía en el hogar.

Es importante para nosotros seguir pidiendo más de nuestra tecnología, especialmente la tecnología que aprovecha las interfaces de usuario naturales. Nuestros dispositivos deben continuar adaptándose a nuestra humanidad, no al revés.

Pero como muchos desafíos, la cortesía no es tan simple como un "por favor" universal y "gracias". Es un desafío complejo de diseño de sistemas para que el equipo correcto lo explore. Tenemos la oportunidad de diseñar un nuevo mundo humano, donde nuestros sistemas digitales refuerzan y extienden nuestros mejores hábitos de manera constructiva. ¿Estás preparado para el reto?

Ah ... y gracias por leer.