PlainTalk es el nombre colectivo de varias tecnologías síntesis de voz (MacinTalk) y reconocimiento de voz desarrolladas por Apple Inc.. En 1990, Apple invirtió Mucho trabajo y dinero en tecnología de reconocimiento de voz, contratando a muchos investigadores en el campo. El resultado fue "PlainTalk", lanzado con los modelos AV en la serie Macintosh Quadra desde 1993. Se fabricó como un componente estándar del sistema en System 7. 1.2, y desde entonces enviado en todos PowerPC y algunos otros 68K Macintosh.
Los usos de texto a voz de Apple diphone s. Comparado con otros métodos de sintetizar el habla, no es muy intensivo en recursos, pero limita lo natural que puede ser la síntesis de voz. Las versiones American English y Spanish están disponibles, pero desde la llegada de Mac OS X, Apple ha enviado solo voces en inglés americano, confiando en proveedores externos como [[Acapela Group] ] para suministrar voces para otros idiomas (en OS X 10.7, Apple otorgó licencias para muchas voces de terceros y las puso a disposición para su descarga dentro del panel de control de Speech).
Una interfaz de programación de aplicaciones conocida como Speech Manager permite a los desarrolladores externos utilizar la síntesis de voz en sus aplicaciones. Hay varias secuencias de control que se pueden usar para afinar la entonación y el ritmo. El volumen, tono y la velocidad de la voz también se pueden configurar.
La entrada al sintetizador se puede controlar explícitamente usando un phoneme alphabet.
Apple utilizó el motor de texto a voz inicial de Macintosh, MacinTalk (nombrado por Denise Chandler), en la introducción en 1984 de Macintosh en la que la computadora se anunció al mundo (y se burló de El peso de una computadora IBM). Si bien se incorporó al sistema operativo del Macintosh, no fue oficialmente compatible con Apple (aunque la información de programación estuvo disponible a través de una Nota técnica de Apple). MacinTalk fue desarrollado por Joseph Katz y Mark Barton, quienes más tarde fundaron SoftVoice, Inc.] que actualmente comercializa motores TTS para Windows, Linux y plataformas integradas.
Abrir en Google Traductor
Finalmente, Apple lanzó un sistema de síntesis de voz compatible, llamado MacinTalk 2. Es compatible con cualquier Macintosh que ejecute System Software 6.0.7 o posterior. Se mantuvo como la versión recomendada para máquinas más lentas, incluso después del lanzamiento de MacinTalk 3 y Pro.
MacinTalk 3 introdujo una gran variedad de voces. Además de las voces adultas estándar "Ralph", "Fred" y "Kathy", y voces de niños como "Princess" y "Junior", se incluyeron varias voces novedosas, como "Whisper", "Zarvox" (una voz robótica con melódica sonidos de fondo, con una voz similar llamada "Trinoids" también incluida), "Cellos" (una voz que cantó su texto a una Edvard Grieg melodía, con similar voces cantantes como "Good News", "Bad News", "Pipe Organ"), "Albert" (una voz ronca), "Bells", "Boing", "Bubbles", y otras.
Cada una de estas voces vino con su propio texto de ejemplo, que se emitiría cuando uno presionara el botón "Prueba" en el panel de control de Voz. Algunos solo dirían su nombre, idioma y la versión de MacinTalk con la que fueron introducidos. Otros dirían cosas gracioso, como "Me gusta estar dentro de esta elegante computadora", "Tengo una rana en la garganta ... No, me refiero a una verdadera rana", "Debemos regocijarnos en esta mórbida voz "(una parodia de Iglesia occidental con música de órgano), o" La luz que se ve al final del túnel es el faro de un tren que se aproxima rápidamente " . Estas voces, así como sus textos de prueba, todavía están en Mac OS X en la actualidad.
Con el aumento en la potencia de cómputo que brindan los equipos Mac basados en AV Mac y PowerPC, Apple podría permitirse aumentar la calidad de la síntesis. MacInTalk 3 requirió un 33 MHz 68030 procesador y MacinTalk Pro requirió un 68040 o mejor y al menos 1 MB de RAM. Cada sintetizador soporta un conjunto diferente de voces.
Text-to-speech ha sido parte de cada versión de Mac OS X. La voz de Victoria se mejoró significativamente en Mac OS X v10.3, y se agregó como Vicki (Victoria no se eliminó). Su tamaño era casi 20 veces mayor, debido a las muestras de diphone de mayor calidad utilizadas.
Una nueva voz, mucho más natural, llamada "Alex" se ha agregado a la lista de texto a voz de Mac con el lanzamiento de Mac OS X 10.5 Leopard.
Con Mac OS X 10.7 Lion, las voces están disponibles en inglés adicional de los EE. UU. Y otros acentos en inglés, así como en otros 21 idiomas.
La función Hablar texto seleccionado cuando se presiona la tecla permite que el texto seleccionado de cualquier aplicación se lea mediante una combinación de teclas. Desde Mac OS X 10.1 a Mac OS X 10.6, la función copiaría el texto seleccionado al portapapeles y lo leería desde allí. Desde Mac OS X 10.7 hasta Mac OS X 10.10, una nueva implementación de la función requería que los desarrolladores de software implementaran una síntesis de voz API en sus aplicaciones. Esto evitó que El portapapeles no se sobrescribió, pero también significaba que, para las aplicaciones que no usaban la API, la función no funcionaría como se esperaba, al leer la barra de título en lugar del texto seleccionado.
Apple contrató a muchos investigadores de reconocimiento de voz en 1990. Después de aproximadamente un año, demostraron una tecnología llamada Casper. Fue lanzado como parte del paquete PlainTalk en 1993. Aunque está disponible para todas las máquinas Macintosh de PowerPC y AV 68k (fue una de las pocas aplicaciones que hizo uso del DSP en el Centris 660AV y Quadra 840AV, no formaba parte de la instalación predeterminada del sistema antes de Mac OS X, lo que requiere que el usuario realice una instalación personalizada del sistema operativo para obtener capacidades de reconocimiento de voz.
En Mac OS X 10.7 Lion y en versiones anteriores, el reconocimiento de voz de Apple estaba orientado únicamente al comando de voz, es decir, no estaba destinado a dictado. Se puede configurar para escuchar los comandos cuando se presiona una tecla de acceso rápido, después de que se dirija con una frase de activación como "Computadora", "Macintosh" o sin aviso. Un monitor de estado gráfico, a menudo en forma de un personaje animado, proporciona información visual y textual sobre el estado de escucha, los comandos disponibles y las acciones. También puede comunicarse con el usuario utilizando la síntesis de voz.
Las primeras versiones del reconocimiento de voz proporcionaban acceso completo a los menús. Este soporte se eliminó posteriormente, ya que requería demasiados recursos y hacía que el reconocimiento fuera menos confiable, solo para volver a agregarlo en Mac OS X 10.3 como una "tecnología de acceso universal" denominada interfaz de usuario hablada.
El usuario puede lanzar elementos ubicados en una carpeta especial, llamada "Elementos que se pueden hablar", simplemente diciendo su nombre (mientras el sistema está en el modo escuchar ). Apple envió una cantidad de AppleScript en esta carpeta, pero alias, documento y carpeta s se pueden abrir en de la misma manera
La funcionalidad adicional es proporcionada por aplicaciones individuales. Una interfaz de programación de aplicaciones permite a los programas definir y modificar un vocabulario disponible. Por ejemplo, Finder proporciona un vocabulario para manipular archivos y ventanas.
En OS X 10.8 Mountain Lion, Apple introdujo “Dictation, ”destinado a texto general. Originalmente, requería el envío de datos de audio a los servidores de Apple para su procesamiento. En OS X 10.9 Mavericks, Apple agregó la opción de descargar soporte para dictado sin conexión a Internet. A partir de OS X 10.9.3, se admiten ocho idiomas (19 dialectos).
La síntesis de voz de MacinTalk se puede escuchar en algunos programas de radio:
La síntesis de voz de MacinTalk se puede escuchar en algunas canciones:
La canción "Bo Peep Bo Peep" de Korea Idol T-ara del Absolute First Album introducción parte 'No pierdas la paciencia tan rápidamente'
Apple produjo dos micrófono s bajo el nombre de "Apple PlainTalk Microphone". El primer producto incluido, incluido con los modelos Macintosh LC y Early Performa, fue circular en apariencia. Fue diseñado para sentarse en un soporte adjunto al lado de una pantalla CRT, y se levanta y sujeta por la boca cuando se habla. El segundo modelo se introdujo junto con los modelos AV en la serie Macintosh Quadra en 1993, pero también se vendió por separado. Fue diseñado para colocarse en la parte superior de la pantalla y ser sensible al sonido desde la parte frontal. Ambos modelos tenían un conector más largo, cuya punta se usó para proporcionar al micrófono tensión de polarización.
Escribe un comentario o lo que quieras sobre MacInTalk (directo, no tienes que registrarte)
Comentarios
(de más nuevos a más antiguos)