Ventana Modal

Este contenido se reemplaza via ajax por el del html externo.

×

Ventana Modal

Este contenido se reemplaza via ajax por el del html externo.

×

Ventana Modal

Este contenido se reemplaza via ajax por el del html externo.

×

×

| 4/12/1999 12:00:00 AM

MIRA QUIEN HABLA AHORA

El reconocimiento del habla está facilitando las reservaciones de pasajes, las compras de <BR>acciones, la búsqueda de entretenimiento. ¿Qué vendrá ahora, la casa parlante?

Era la típica pesadilla de quien viaja por avión. Glen Harvell, un ejecutivo de Anderson
Consulting, llegó al aeropuerto de Minneapolis para encontrarse con que su vuelo a Washington se había
retrasado por problemas mecánicos. Pero como la mayoría de quienes viajan con frecuencia por motivo de
negocios, Harvell es un experto en lidiar con el caos de los aeropuertos. Mientras que otros pasajeros eran
presas de la confusión Harvell tomó su celular y llamó al sistema de reservas de viaje de su empresa, el
cual funciona mediante 'reconocimiento automático del habla'. Rápidamente respondió las preguntas del
computador y logró reserva en otro vuelo sin tener que hablar con ninguna persona ni digitar interminables
series de códigos y claves telefónicas.Hasta hace poco el reconocimiento del habla era utilizado
principalmente como sustituto para la mecanografía en los computadores caseros. Gracias a él, si usted
habla por un micrófono, sus palabras (o algo parecido a lo que usted dijo) aparecen por arte de magia en la
pantalla de su procesador de palabras. Pero ahora la tecnología ha mejorado hasta el punto en que los
negocios, por ahora en las áreas de servicios financieros y atención de viajeros, están recurriendo a los
sistemas de reconocimiento del habla diseñados para el uso telefónico. Estos nuevos recursos prometen
relegar al pasado esos complicados procedimientos de digitación de claves, reduciendo a la vez los costos
del servicio al cliente 24 horas al día. Cambiarán también la manera en que interactuamos con todo tipo de
aparatos, desde los computadores hasta los electrodomésticos. "Esto podría crecer como Internet, o incluso
más rápido, porque no requiere que los usuarios compren aparatos adicionales ni tengan que aprender cosas
nuevas", dice William Meisel, editor de la carta informativa Speech Recognition Newsletter (Noticias sobre
Reconocimiento del Habla). La tecnología del habla aún tiene muchas pruebas que pasar. Aunque los
sistemas de dictado a los computadores personales se han vendido bien, los analistas estiman que cerca
de la mitad de los compradores dejan de utilizarlos luego de la primera semana. La razón es que las
personas están demasiado acostumbradas a mecanografiar sus textos. Por otra parte, la marcación de
códigos de acciones y de números de vuelos en teclados telefónicos de 12 botones puede confundir y
distraer a los automovilistas más experimentados. Nuance Communications, de Silicon Valley; Speech
Works, de Boston, y los veteranos IBM y Lucent Technologies están compitiendo para suministrar a las
empresas opciones basadas en las tecnologías del habla. "Las personas están esperando servicio 24 horas al
día y los centros de atención de llamadas están muy interesados en encontrar el modo de suministrarlo a
costos eficientes", dice Val Matula, un planificador de tecnología del habla de Lucent.El sector de servicios
financieros fue el primero en experimentar con el habla en un esfuerzo por hacerse disponible en cualquier
momento a los clientes localizados en cualquier lugar. Los clientes desean acceso inmediato a
información sobre precios de acciones, así como la posibilidad de realizar pagos y movimientos de dinero
aunque se encuentren lejos de sus equipos de comunicación habitual con Internet. Los corredores de bolsa
E*Trade y Schwab comenzaron a emplear sistemas de atención telefónica automatizada con reconocimiento
de voz hace más de un año y ahora toda la competencia está imitándolos. Fidelity introdujo en diciembre
pasado un sistema que permite a los clientes dar instrucciones como "deme el saldo de mi cuenta" o
"venda todas mis acciones de Microsoft" _o cualquier otra frase equivalente_. Esa 'comprensión del lenguaje
natural' trabaja descomponiendo todas las palabras escuchadas en sus sonidos constitutivos llamados
fonemas. Por ejemplo los sonidos [a], [p], [i], [t] correspondientes a las letras a, p, i y t son fonemas.
Una vez obtenidos los fonemas les asocia valores numéricos y con ellos calcula el significado más
probable de la palabra. Si usted comete un error, o dice algo que el computador no logra entender,
simplemente responde brindando instrucciones más largas y específicas como, por ejemplo, preguntas
cerradas con respuestas de sí o no. "Tan pronto como uno se familiariza con nuestro sistema la llamada
se agiliza enormemente", dice Judith McMichael, vicepresidenta de Fidelity. Entusiasmado por los progresos
técnicos, el sector de viajes aéreos optó por imitar la iniciativa de los corredores de bolsa y firmas financieras.
United y American Airlines están preparándose para poner a disposición del público sistemas de
información que suministren números de vuelo y puertas de llegada. Pero la empresa Via Word Network ha
ido aún más lejos: su línea automatizada de atención por voz, que actualmente opera bajo licencia para
Northwest Airlines y Anderson Consulting, fue aquella que utilizó Glen Harvell en nuestro ejemplo para
solucionar su problema de cambio de vuelos. La gran ventaja de la nueva tecnología, según Harvell, es
que uno puede obligar al sistema a actuar sin tener que esperar a que recite todas sus instrucciones.
Simplemente le va diciendo al computador qué quiere sin esperar a que termine. "Nunca podría ser tan brusco
con una persona que agenciara mis reservas", dice. Las tecnologías del habla podrían ingresar en el mundo
cotidiano de la mayoría desde esta misma primavera. Movie Fone, una firma neoyorquina que fue adquirida en
los primeros días de este mes por America Online, quiere brindarle información de cine a los clientes que le
digan simplemente el nombre de la película que les interesa. Inicialmente en Nueva York y luego en Los
Angeles y Chicago, bastará con que los consumidores digan su nombre, su código de correos y el número de
su tarjeta de crédito para ser atendidos. La empresa se curará en salud por si hay dificultades y conservará
como apoyo el viejo sistema de digitación de códigos.Por supuesto que la nueva tecnología no está libre
de percances. Los computadores todavía tienen tendencia a interpretar como lenguaje hablado los
suspiros fuertes y la tos. También los diferentes acentos regionales pueden despistarlos, aunque las
empresas de informática están revisando constantemente las llamadas para incorporar las distintas
pronunciaciones en el bagaje de los computadores. Otro problema es que, inevitablemente, se están
perdiendo empleos por efecto del ingreso de sistemas que reconocen el habla. De acuerdo con el
Departamento del Trabajo, en 1998 había en Estados Unidos 159.000 operadores de teléfono. Dicho número
equivalía a las dos terceras partes de los operadores empleados en 1990 en el mismo país. Aunque las
empresas productoras de los equipos y los programas insisten en que esta nueva tecnología simplemente
libera trabajadores para que se ocupen en tareas más valiosas, los sindicatos dicen que las compañías están
sacrificando empleos, así como la calidad de la atención al público. "Yo nunca he oído a nadie decir: 'Detesto
llamar a esa oficina porque me contesta una persona', pero en cambio sí he oído decir que es terrible que le
conteste a uno una máquina", dice Kevin Kistler, del Sindicato Internacional de Empleados de Oficina y
Profesionales. Sin embargo es difícil imaginar que pueda detenerse el avance inexorable de la tecnología de
reconocimiento del habla. Ello se hizo evidente en la Feria del Juguete que tuvo lugar la semana pasada en
Nueva York. Por lo menos media docena de los juguetes en exhibición ejecutaban alguna operación
comandada con la voz. Entre las ofertas estaba una muñeca de cola de caballo llamada 'Mi mejor
amiguita', que le hace a su dueña repasos de matemáticas y ortografía y evalúa la corrección de las
respuestas de la niña. Ese juguete es uno de muchos artículos que están sirviendo para medir el apetito de
los consumidores por artefactos operados con el habla. El nuevo sedan Jaguar S, que saldrá al mercado el
próximo mes de mayo, vendrá equipado con calefacción, aire acondicionado, equipo de sonido y teléfono
activados por la voz (el timón no viene aún operado por este sistema). Un nuevo teléfono inalámbrico fabricado
por Uniden, de Fort Worth _Texas_, le permite programar una lista de nombres asociados con teléfonos de tal
manera que para llamar a sus parientes o amigos cercanos usted solamente tiene que descolgar y
pronunciar el nombre de la persona a quien desea llamar y el teléfono marca sin ayuda el número
respectivo. Y hay más en perspectiva. Bill Gates ha prometido que en un plazo máximo de 10 años podremos
manejar el computador personal con comandos vocales. Los ejecutivos del sector informático predicen que el
aumento de la velocidad y el abaratamiento de los chips de silicio permitirán operar con la voz los hornos de
microondas y las videograbadoras en menos de cinco años. Se ve remoto si se compara con las ventajas
inmediatas de cambiar reservaciones de avión desde un celular, pero si la tecnología de reconocimiento del
habla permite reducir la complejidad de los PC y las videograbadoras entonces seguramente dará de qué hablar
¿Tiene algo que decir? Comente

Para comentar este artículo usted debe ser un usuario registrado.

EDICIÓN 1842

PORTADA

La voltereta de la Corte con el proceso de Andrade

Los tres delitos por los cuales la Corte Suprema procesaba al senador se esfumaron con la llegada del abogado Gustavo Moreno, hoy ‘ad portas’ de ser extraditado. SEMANA revela la historia secreta de ese reversazo.