lunes, 7 de mayo de 2012

EasyVr Speech Recognition Module

Hablemos un poco del "EasyVR Speech Recognition Module" o mejor conocido como el modulo de reconocimiento de voz.

Les dire lo basico que necesitan saber de este modulo, asi como tambien algunas caracteristicas importantes el momento de estar "jugando" con el modulo.

Primero y talvez los mas importante ¿Que es el modulo EasyVr?


Se trata de un potente módulo de bajo coste para el 
reconocimiento de voz y reproducción de sonidos. Es la 

versión mejorada y actualizada del VRbot de la firma VeeaR.  

Las voces a reconocer pueden estar 
predefinidas y grabadas internamente. Se dice que sonvoces independientes del micrófono (SI). También se puede grabar y reconocer voces definidas por el propio usuario y en cualquier idioma. En este caso se tratan de voces dependientes del micrófono (SD), que se supone previamente han sido “enseñadas” y grabadas en la memoria interna del módulo.




Caracteristicas:



Se pueden destacar las más relevantes:

  • 26 comandos y voces pre-programados (SI) en: en inglés, italiano, japonés, alemán,francés y español
  • Admite hasta 32 comandos y sus correspondientes voces definidas por el usuario (SD) en cualquier idioma
  • Los comandos y voces SD se pueden organizar en hasta 16 grupos
  • Se dispone de un interface gráfico de usuario (GUI) para Windows que permite una rápida familiarización con el uso del módulo.
  • El módulo se puede conectar fácilmente con cualquier tipo de controlador mediante una sencilla comunicación serie.
  • Dispone de un potente protocolo de comandos para el desarrollo de cualquier aplicación basada en el reconocimiento de voz.
  • Alimentación de 3.3V a 5V
  • 3 líneas de E/S o GPIO (IO1, IO2 e IO3) que se controlan directamente mediante los comandos correspondientes
  • Salida PWM de audio que admite la conexión con un altavoz de 8 Ω
  • Capacidad de reproducción de hasta 9 minutos de sonidos y/o voces
  • Se suministra junto con un CD-ROM que contiene el presente documento y una serie de 
  • librerías y ejemplos de aplicación para PIC16F88X desarrollados por Ingeniería de
  • Microsistemas Programados

Aplicaciones:




Son numerosas las posibles aplicaciones del módulo de reconocimiento EasyVR. Algunas sugerencias:
  • Sistemas de control de propósito general que se deseen gobernar mediante voz
  • Automatización de aplicaciones en el ámbito doméstico
  • Control de acceso por voz
  • Sistemas robóticos controlados por voz

Especificaciones tecnicas/electricas:



La siguiente figura muestra las dimensiones físicas del módulo EasyVR así como la disposición de las señales que se explican en la siguiente tabla.






 EasyVR Commander: EL INTERFACE GRAFICO DE USUARIO (GUI)

Se trata de una aplicación para WINDOWS que permite usar y configurar el módulo EasyVR de una forma muy sencilla e intuitiva. 

Estableciendo la comunicación

Una vez instalado el programa EasyVR GUI y realizadas las conexiones eléctricas entre el módulo y
el COMx del PC, ejecutamos la aplicación. Nos aparecerá una ventana de trabajo como la mostrada en la siguiente figura.


En el ángulo superior izquierdo tenemos un desplegable que permitirá seleccionar el canal COM disponible en nuestro PC. También disponemos de dos botones para la conexión/desconexión de la comunicación entre el módulo EasyVR y el PC.

En la parte superior central existen una serie de botones con las diferentes tareas que podemos realizar con el módulo: añadir/editar/borrar comandos, enseñanza de las voces asociadas a los comandos, reconocimiento de esas voces, reproducción de sonidos, etc. Cada vez que se establece la comunicación el software EasyVR Commander lee el contenido del módulo en su totalidad y lo traslada a las diferentes áreas de trabajo: el área de grupos y el área de comandos.

En el área de grupos aparecen los grupos 0-16 disponibles para almacenar las voces definidas por el usuario (SD) y otros tres grupos llamados “Wordset 1-3” donde están almacenadas las voces pregrabadas o voces SI. Al lado de cada grupo aparecerá también el no de voces que contiene el mismo. Se recuerda que en el módulo se pueden grabar un TOTAL de 32 voces SD definidas por el usuario. Lo que pasa es que estas voces se pueden almacenar o clasificar en diferentes grupos si fuera necesario. Abajo del todo hay un último grupo, SoundT, donde se pueden almacenar diferentes sonidos digitalizados para su posterior reproducción.

En el área de comandos se Editan/Visualizan las etiquetas o comandos asociados a las voces y qué posición ocupan dentro de un determinado grupo. Un comando o etiqueta no es ni más ni menos que una cadena ASCII de hasta 32 caracteres. Toda etiqueta o comando debe estar asociado a una voz o viceversa, durante la fase de enseñanza. De esta forma, cuando el módulo reconozca una voz, devuelve el comando o etiqueta asociada a la misma. Sólo se admiten etiquetas formadas por los caracteres ASCII en mayúsculas desde la A a la Z.


En futuras entradas tratare de explicar como usamos el EasyVR en nuestro proyecto así como también de la explicación de mas hardware de nuestro proyecto.


LIGAS UTILIES
http://www.veear.eu/Products/EasyVR.aspx