Era la típica pesadilla de quien viaja por avión. Glen Harvell, un ejecutivo de Anderson Consulting, llegó al aeropuerto de Minneapolis para encontrarse con que su vuelo a Washington se había retrasado por problemas mecánicos. Pero como la mayoría de quienes viajan con frecuencia por motivo de negocios, Harvell es un experto en lidiar con el caos de los aeropuertos. Mientras que otros pasajeros eran presas de la confusión Harvell tomó su celular y llamó al sistema de reservas de viaje de su empresa, el cual funciona mediante 'reconocimiento automático del habla'. Rápidamente respondió las preguntas del computador y logró reserva en otro vuelo sin tener que hablar con ninguna persona ni digitar interminables series de códigos y claves telefónicas.Hasta hace poco el reconocimiento del habla era utilizado principalmente como sustituto para la mecanografía en los computadores caseros. Gracias a él, si usted habla por un micrófono, sus palabras (o algo parecido a lo que usted dijo) aparecen por arte de magia en la pantalla de su procesador de palabras. Pero ahora la tecnología ha mejorado hasta el punto en que los negocios, por ahora en las áreas de servicios financieros y atención de viajeros, están recurriendo a los sistemas de reconocimiento del habla diseñados para el uso telefónico. Estos nuevos recursos prometen relegar al pasado esos complicados procedimientos de digitación de claves, reduciendo a la vez los costos del servicio al cliente 24 horas al día. Cambiarán también la manera en que interactuamos con todo tipo de aparatos, desde los computadores hasta los electrodomésticos. "Esto podría crecer como Internet, o incluso más rápido, porque no requiere que los usuarios compren aparatos adicionales ni tengan que aprender cosas nuevas", dice William Meisel, editor de la carta informativa Speech Recognition Newsletter (Noticias sobre Reconocimiento del Habla). La tecnología del habla aún tiene muchas pruebas que pasar. Aunque los sistemas de dictado a los computadores personales se han vendido bien, los analistas estiman que cerca de la mitad de los compradores dejan de utilizarlos luego de la primera semana. La razón es que las personas están demasiado acostumbradas a mecanografiar sus textos. Por otra parte, la marcación de códigos de acciones y de números de vuelos en teclados telefónicos de 12 botones puede confundir y distraer a los automovilistas más experimentados. Nuance Communications, de Silicon Valley; Speech Works, de Boston, y los veteranos IBM y Lucent Technologies están compitiendo para suministrar a las empresas opciones basadas en las tecnologías del habla. "Las personas están esperando servicio 24 horas al día y los centros de atención de llamadas están muy interesados en encontrar el modo de suministrarlo a costos eficientes", dice Val Matula, un planificador de tecnología del habla de Lucent.El sector de servicios financieros fue el primero en experimentar con el habla en un esfuerzo por hacerse disponible en cualquier momento a los clientes localizados en cualquier lugar. Los clientes desean acceso inmediato a información sobre precios de acciones, así como la posibilidad de realizar pagos y movimientos de dinero aunque se encuentren lejos de sus equipos de comunicación habitual con Internet. Los corredores de bolsa E*Trade y Schwab comenzaron a emplear sistemas de atención telefónica automatizada con reconocimiento de voz hace más de un año y ahora toda la competencia está imitándolos. Fidelity introdujo en diciembre pasado un sistema que permite a los clientes dar instrucciones como "deme el saldo de mi cuenta" o "venda todas mis acciones de Microsoft" _o cualquier otra frase equivalente_. Esa 'comprensión del lenguaje natural' trabaja descomponiendo todas las palabras escuchadas en sus sonidos constitutivos llamados fonemas. Por ejemplo los sonidos [a], [p], [i], [t] correspondientes a las letras a, p, i y t son fonemas. Una vez obtenidos los fonemas les asocia valores numéricos y con ellos calcula el significado más probable de la palabra. Si usted comete un error, o dice algo que el computador no logra entender, simplemente responde brindando instrucciones más largas y específicas como, por ejemplo, preguntas cerradas con respuestas de sí o no. "Tan pronto como uno se familiariza con nuestro sistema la llamada se agiliza enormemente", dice Judith McMichael, vicepresidenta de Fidelity. Entusiasmado por los progresos técnicos, el sector de viajes aéreos optó por imitar la iniciativa de los corredores de bolsa y firmas financieras. United y American Airlines están preparándose para poner a disposición del público sistemas de información que suministren números de vuelo y puertas de llegada. Pero la empresa Via Word Network ha ido aún más lejos: su línea automatizada de atención por voz, que actualmente opera bajo licencia para Northwest Airlines y Anderson Consulting, fue aquella que utilizó Glen Harvell en nuestro ejemplo para solucionar su problema de cambio de vuelos. La gran ventaja de la nueva tecnología, según Harvell, es que uno puede obligar al sistema a actuar sin tener que esperar a que recite todas sus instrucciones. Simplemente le va diciendo al computador qué quiere sin esperar a que termine. "Nunca podría ser tan brusco con una persona que agenciara mis reservas", dice. Las tecnologías del habla podrían ingresar en el mundo cotidiano de la mayoría desde esta misma primavera. Movie Fone, una firma neoyorquina que fue adquirida en los primeros días de este mes por America Online, quiere brindarle información de cine a los clientes que le digan simplemente el nombre de la película que les interesa. Inicialmente en Nueva York y luego en Los Angeles y Chicago, bastará con que los consumidores digan su nombre, su código de correos y el número de su tarjeta de crédito para ser atendidos. La empresa se curará en salud por si hay dificultades y conservará como apoyo el viejo sistema de digitación de códigos.Por supuesto que la nueva tecnología no está libre de percances. Los computadores todavía tienen tendencia a interpretar como lenguaje hablado los suspiros fuertes y la tos. También los diferentes acentos regionales pueden despistarlos, aunque las empresas de informática están revisando constantemente las llamadas para incorporar las distintas pronunciaciones en el bagaje de los computadores. Otro problema es que, inevitablemente, se están perdiendo empleos por efecto del ingreso de sistemas que reconocen el habla. De acuerdo con el Departamento del Trabajo, en 1998 había en Estados Unidos 159.000 operadores de teléfono. Dicho número equivalía a las dos terceras partes de los operadores empleados en 1990 en el mismo país. Aunque las empresas productoras de los equipos y los programas insisten en que esta nueva tecnología simplemente libera trabajadores para que se ocupen en tareas más valiosas, los sindicatos dicen que las compañías están sacrificando empleos, así como la calidad de la atención al público. "Yo nunca he oído a nadie decir: 'Detesto llamar a esa oficina porque me contesta una persona', pero en cambio sí he oído decir que es terrible que le conteste a uno una máquina", dice Kevin Kistler, del Sindicato Internacional de Empleados de Oficina y Profesionales. Sin embargo es difícil imaginar que pueda detenerse el avance inexorable de la tecnología de reconocimiento del habla. Ello se hizo evidente en la Feria del Juguete que tuvo lugar la semana pasada en Nueva York. Por lo menos media docena de los juguetes en exhibición ejecutaban alguna operación comandada con la voz. Entre las ofertas estaba una muñeca de cola de caballo llamada 'Mi mejor amiguita', que le hace a su dueña repasos de matemáticas y ortografía y evalúa la corrección de las respuestas de la niña. Ese juguete es uno de muchos artículos que están sirviendo para medir el apetito de los consumidores por artefactos operados con el habla. El nuevo sedan Jaguar S, que saldrá al mercado el próximo mes de mayo, vendrá equipado con calefacción, aire acondicionado, equipo de sonido y teléfono activados por la voz (el timón no viene aún operado por este sistema). Un nuevo teléfono inalámbrico fabricado por Uniden, de Fort Worth _Texas_, le permite programar una lista de nombres asociados con teléfonos de tal manera que para llamar a sus parientes o amigos cercanos usted solamente tiene que descolgar y pronunciar el nombre de la persona a quien desea llamar y el teléfono marca sin ayuda el número respectivo. Y hay más en perspectiva. Bill Gates ha prometido que en un plazo máximo de 10 años podremos manejar el computador personal con comandos vocales. Los ejecutivos del sector informático predicen que el aumento de la velocidad y el abaratamiento de los chips de silicio permitirán operar con la voz los hornos de microondas y las videograbadoras en menos de cinco años. Se ve remoto si se compara con las ventajas inmediatas de cambiar reservaciones de avión desde un celular, pero si la tecnología de reconocimiento del habla permite reducir la complejidad de los PC y las videograbadoras entonces seguramente dará de qué hablar