Mi octavo libro dedicado a recuperar al auténtico primer videojuego español, a la venta con precio muy popular en versión papel, o versión ebook económica.
En el año 1984 fue publicado, en un medio de comunicación muy importante en España, un artículo dedicado a la creación de un 'ordenador parlante' en el marco de un proyecto nacido en la Universidad Politécnica de Madrid en el año 1980. Aquí compartiré la historia de los pioneros de la síntesis de voz en España.
En el otoño de 2023 tuve un intercambio de información con Elías Muñoz donde me aportó documentación de hechos que considero de gran importancia para la historia de la informática en España. Hablo de los primeros trabajos de síntesis de voz en España, bajo un proyecto nacido en el año 1980 en la Universidad Politécnica de Madrid. Hablo de la creación del primer ordenador parlante español.
Elías, Catedrático Emérito de Circuitos Electrónicos de la Universidad Politécnica de Madrid.
¿Quién es Elías Muñoz Merino? Una persona que llegó hace muchos años de la Universidad de Stanford, en Estados Unidos. Allí había hecho la tesis doctoral, para terminar ocupando la Cátedra de Circuitos Electrónicos de la Universidad Politécnica de Madrid. Actualmente, ya jubilado, es Catedrático Emérito de la UPM y, además, académico de la Real Academia de Ingeniería de España, conocida como RAI. Voy a centrar la historia de este artículo en Elías Muñoz por ser la fuente más importante de información al respecto y por ser la dirección en la vertiente electrónica del equipo que logró el hito de crear el primer ordenador parlante español. Pero también compartiré información que me aportó personalmente José Manuel Pardo, Catedrático en activo en la Escuela Técnica Superior de Ingeniería de Telecomunicación de la Universidad Politécnica de Madrid, que se doctoró en la UPM en el año 1981, y que obtuvo de la Red Temática en Tecnologías del Habla el Premio a la Trayectoria Profesional en Noviembre de 2023 por sus contribuciones a la Tecnología del Habla.
Conocí a Elías Muñoz a raíz del descubrimiento y recuperación del 'Primer Videojuego creado en España', descubrimiento que hice en colaboración con Paco Portalo, iniciador de la investigación; el videojuego Ping-Pong creado en 1977 en la Universidad Politécnica de Madrid. Elías Muñoz, ya Catedrático de la UPM en 1977, fue el coordinador de un Seminario de Microprocesadores celebrado en marzo de 1977 para el cual se construyó aquel videojuego.
No fue fácil contactar con Elías, en realidad no fue fácil contactar con ninguno de los intervinientes en el desarrollo de aquel videojuego de 1977, y tuve que tirar de ingenio; los protagonistas de aquel hito histórico están jubilados hoy en día. Pero una vez contactado Elías, además de intercambiar información sobre aquel videojuego, me contó y aportó documentación de otros asuntos que, para mí, no son menos importantes.
Wiliam Shocley, inventor del transistor en Palo Alto.
Para contar la historia debo trasladarme a finales de los años sesenta, donde la Universidad de Stanford era, probablemente, la más relevante a nivel mundial en lo que a electrónica refiere. Por ejemplo, allí muy cerca de Stanford, en la ciudad de Palo Alto, William Shockley inventó un componente esencial para la electrónica moderna, el transistor. Aunque William Shockley era londinense de nacimiento, sus padres eran norteamericanos de nacimiento, y con tres años de edad se trasladó a Palo Alto; allí vivió, y falleció en el lugar de Stanford, anexo a la ciudad de Palo Alto. Y allí, cerca de aquella ciudad californiana, también se creó el famoso Silicon Valley, fuente inagotable de genios de la informática y electrónica y de grandes e históricas empresas de la especialidad... la distancia que separa a la Universidad de Stanford de Silicon Valley es tan solo de 14 kilómetros. Por tanto, la influencia de la especialidad electrónica en Stanford fue brutal. Además, William Shockley fue profesor de ingeniería aquella Universidad desde 1963 hasta su jubilación en 1975.
Elías Muñoz había conseguido una 'Beca Fulbright', creada en 1946 por el Senador William Fulbright, y que era un programa de ayudas de estudio para intercambio de titulados superiores estadounidenses y de los países miembros de ese mismo programa. Allí, en Stanford, Elías Muñoz coincidió con John G. Linvill, profesor de la Universidad, que tenía una hija ciega, y que trabajó sobre un proyecto para convertir símbolos braille en voz.
John G. Linvill, fundador de la empresa de Palo Alto Telesensory Systems.
John G. Linvill fundó en 1970 en Palo Alto una pequeña empresa llamada Telesensory Systems donde creó una gama de productos electrónicos para personas ciegas como, por ejemplo, Optacon, Speech+ Calculator, VERT, VersaBraille, y OsCar. Elías Muñoz visitó aquella empresa en alguna ocasión.
Elías Muñoz, por la propia sensibilidad personal hacia las discapacidades, aprendió todo lo que pudo sobre aquello, y a su vuelta a España, y rodeado de un grupo de estudiantes voluntariosos y con conocimientos en temas de microcontroladores, trabajaron en el año 1978 dentro de la UPM sobre el proyecto de crear una calculadora parlante. Para ello, utilizaron la caja de una calculadora Vanguard, calculadoras creadas por Isidre Cots para la empresa PROMAX, que fue fundada en 1963 por José Clotet Llorca en Barcelona, y consideradas las primeras calculadoras diseñadas y fabricadas en España. En marzo de 1978 fue publicado un artículo sobre la creación de la calculadora parlante en la revista Euromicro.
Aquello fue la base, o el inicio, del argumento central de este artículo, que relata la historia de los pioneros de la síntesis de voz en España. El grupo de trabajo coordinado por Elías Muñoz colaboró para el proyecto con la empresa norteamericana Speech Plus en 1982 y 1983 cuando se creo el Prose 2000. Posteriormente, se hizo otro desarrollo para la empresa Digital Equipment Corporation en el año 1984; el conocido DECTalk. Aquel grupo de trabajo de la UPM tuvo un nombre: Grupo de Tecnología del Habla del Departamento de Ingeniería Electrónica de la Universidad Politécnica de Madrid. En adelante, mencionaré como GTH.
Sobre el GTH debo compartir algunas aclaraciones. José Manuel Pardo, una de las fuentes para elaborar este artículo, estuvo desde septiembre de 1983 hasta octubre de 1984 con una Beca Fulbright trabajando en el MIT de Massachusetts en asuntos del 'Reconocimiento de Voz', siendo su tutor Kenneth Stevens, Director del 'Speech Communication Group'. Cuando Pardo volvió de Estados Unidos se convirtió en el responsable de la mejora de la prosodia de la síntesis en español para Speech Plus, heredando de Elías Muñoz, también, la responsabilidad de seguir en la Tecnología del Habla y en todos los proyectos relacionados con la misma, especialmente en atención a sordos para los que había desarrollado él su tesis doctoral. En 1987 pasó a ser el principal responsable de la tecnología del Habla y creó el Grupo de Tecnología del Habla (GTH) mencionado antes... actualmente sigue siendo el Director. Antes de esa fecha no había un nombre de grupo definido, estando todos bajo la tutela del Catedrático Elías Muñoz. Por tanto, en el párrafo anterior menciono al GTH como si hubiera existido desde el primer momento, pero ese nombre no fue efectivo hasta el año 1987.
Una colaboración entre la UPM y el CSIC.
Además de Elías Muñoz, formaron parte del GTH Andrés Santos, Rafael Martínez, Pedro Muñoz, y Antonio Quilis. Sobre Rafael Martínez debo destacar que, aparte de lo contado en este artículo, fue co-creador, junto con Juan Santos, del primer videojuego español llamado Ping-Pong mencionado en párrafos anteriores. Sobre Antonio Quilis mencionar que pertenecía al Laboratorio de Fonética del Instituto Miguel de Cervantes del Centro Consejo Superior de Investigaciones Científicas (CSIC), y se ocupó de la dirección en el apartado lingüístico.
Las actividades concretas para la conversión texto a voz se iniciaron en el GTH de la UPM y el CSIC en el año 1980. En ese mismo año se inició una cooperación con Speech Plus Inc (antigua Telesensory Speech Systems) para implementar el conversor de texto a voz Prose 2000 en versión de idioma español. En el año 1983, el GTH creó la primera versión del sistema con resultados aceptables en pruebas de inteligibilidad. Y, en 1986, se introdujo en el mercado una primera versión comercial de la mano de Speech Plus Inc.
Paralelamente al desarrollo del producto Prose 2000 en español, en 1984, el GTH trabajó en la primera versión de DECTalk, creación original en inglés basada en el trabajo de Dennis Klatt en el MIT, para el idioma español. El DECtalk era un sintetizador de voz creado por la histórica empresa Digital Equipment Corporation y que había sido diseñado en el año 1983.
Existió un prototipo funcional para adaptar el DECTalk al idioma español.
Respecto al proyecto sobre el DECTalk en español, existió un prototipo funcional y fue publicado un artículo al respecto el 22 de junio de 1984 en el periódico El País, donde se mencionó que en el mundo existían, en aquella época, diferentes grupos de investigación que habían trabajado con la síntesis de voz... pero en inglés. Y el periódico resaltó que el equipo GTH de la Universidad Politécnica de Madrid y CSIC había creado un prototipo terminal capaz de hablar en castellano, calificando el hito como 'uno de los proyectos más avanzados en este idioma y sector en el mundo'. Desde luego, en España, fueron pioneros.
En 1984 Elías Muñoz afirmó que el lenguaje castellano, al ser más estructurado, era más fácil de sintetizar que el inglés, aunque determinados fonemas dobles como la 'ch' o la 'rr' habían resultado altamente complejos de procesar.
Por tanto, existió el primer prototipo funcional de sintetizador de voz en castellano creado por el GTH de la Universidad Politécnica de Madrid y basado en el DECTalk, que se puede ver en la foto de portada de este artículo, y en las fotos incluidas al final del texto. Todo un hito en la informática de España.
¿Cuáles fueron los avances más significativos del GTH destinado a investigar sobre la síntesis de voz? Mejorar la prosodia del sintetizador, crear reglas específicas de duración de segmentos, mejora de la entonación, principalmente en el análisis de grupos de respiración, y la generación automática de contornos de tono naturales.
En el año 1986 fue introducida una primera versión comercial del Prose 2000 en español.
¿Qué pasó posteriormente con aquellos trabajos? En el año 1986, fue introducida en el mercado una primera versión comercial del Prose 2000 en español de la mano de Speech Plus Inc. A partir del año 1989 se fraguó una colaboración del GTH con Telefónica I+D bajo la idea de desarrollar un nuevo sintetizador de texto a voz en español basado en dífonos, además de la implementación de la arquitectura del sintetizador de texto a voz que se estaba produciendo dentro del programa ESPRIT de la Unión Europea.
En el año 1992 el GTH desarrolló un sistema de conversión de texto a voz basado en una placa de PC y un software interno. Aquella placa también admitió otros programas de análisis y reconocimiento de voz. En los años 1994 y 1995 el GTH trabajó, a través del proyecto TIDE VAESS TP 1174, en la generación de nuevas voces para añadir al sintetizador.
En 1983 el GTH mostró un primer prototipo de reconocedor de dígitos del español independiente del hablante.
El GTH también trabajó en otros proyectos paralelos al sintetizador de voz en español. En el año 1978 inició un proyecto de reconocimiento de voz con la idea de ser ayuda para el entrenamiento del habla para personas sordas, y un sistema reconocedor independiente del hablante con dígitos aislados en idioma español. En 1983 el GTH mostró un primer prototipo de reconocedor de dígitos del español independiente del hablante.
En el año 1985 el GTH diseñó un prototipo de hardware de conversión de texto a voz. En 1986 trabajaron en implementaciones hardware de sistemas de reconocimiento de voz, junto con SRI Internacional y el grupo LSI del Departamento de EE-UPM. Dentro del GTH fue desarrollada una placa DSP que albergaba una serie de programas para la síntesis de voz como PCVOX, ISOTON, y TEL-ECO.
También en el año 1985 el GTH hizo un nuevo énfasis en el reconocimiento de voz con el inicio de un proyecto sobre el reconocimiento independiente de hablantes de palabras aisladas y un vocabulario de mil palabras. Entre los años 1985 y 1988 el GTH cooperó con SRI International en ese proyecto. El GTH desarrolló un sistema que reconocía mil palabras aisladas, en español, independientemente del hablante.
En el año 1986, con la incorporación de España a la Comunidad Económica Europea, el GTH se unió al proyecto ESPRIT 291-860 denominado 'Análisis Lingüístico de las Lenguas Europeas' fechado entre los años 1985 y 1989, donde el GTH trabajó en un sistema de acceso léxico a partir de cadenas de fonemas aislados para diferentes lenguas, incluido el español, utilizando estadísticas y conocimiento del lenguaje heurístico.
El GTH trabajó en el proyecto ESPRIT 2104 POLYGLOT.
Entre los años 1989 y 1992 el GTH trabajó en el proyecto ESPRIT 2104 POLYGLOT, donde desarrollaron un reconocedor de palabras aisladas de amplio vocabulario y un reconocedor de voz continua.
En el año 1984 se presentó, a la opinión pública, la creación de un sintetizador de voz en idioma español pero, además, el grupo de la UPM trabajó durante muchos años en la Tecnología del Habla aportando una gran labor en diferentes áreas de la síntesis de voz, y no hay duda que fueron pioneros de aquello en español, y también en España. Son sucesos reales de la tecnología informática y electrónica que la historia no debe olvidar.
Elías, Catedrático Emérito de Circuitos Electrónicos de la Universidad Politécnica de Madrid.