Generalidades

Cómo creé una aplicación que traduce las voces de los gatos al lenguaje humano | Por Ege Kuzubasioglu | Febrero de 2022

Ideas de un millón de dólares de Zimbabue

Como cree una aplicacion que traduce las voces de los

Todo comenzó cuando el tipo «emprendedor» me envió un mensaje en Linkedin.

Antes de rechazar la generosa oferta del Sr. Hyphothetical, me prometí a mí mismo que algún día haría una aplicación que suene graciosa en el papel y que no tendría tecnología de cadena de bloques. O NFT… porque todavía no sé qué es.*

Un avance rápido hasta enero y mi novia me preguntó:

Esto suena como una idea increíble por dos razones: primero, no tengo que pensar en regalos y segundo, finalmente puedo hacerlo. esa aplicación

gato gilberto

Este es nuestro gato Gilbert, y no se equivoca. Excepto que está maullando demasiado… Quiero decir, demasiado, lo que me hizo revisar mis viejas notas de aprendizaje automático y hacer una aplicación solo para entender de qué está hablando. Una aplicación que traduce maullidos al inglés.

1644947949 976 Como cree una aplicacion que traduce las voces de los

cosas súper complejas de aprendizaje automático

Creo que para poder traducir los sonidos de los gatos, deberías saber si un sonido es un sonido de gato. Suena lógico, ¿verdad? Para hacer esto, diseñé un algoritmo de aprendizaje profundo muy sofisticado que puede distinguir sonidos. es una broma.acabo de usar Kit de aprendizaje automático Detector de sonido de Huawei Technologies. Puede detectar hasta 12 sonidos diferentes, uno de los cuales es el sonido de un gato.

Como cree una aplicacion que traduce las voces de los

OK, podemos distinguir entre maullidos y pedos, ¿y ahora qué? En esta etapa, necesito un montón de ejemplos de sonidos de gatos para anotar tipos específicos de comportamiento de gatos. En esta etapa, seguí el trabajo realizado por Yagya Raj Pandeya y Joonwhoan Lee, utilizando el aprendizaje por transferencia para la clasificación de voces de gatos domésticos. Afortunadamente, los gatos no hablan de política. cuando hablan, casi siempre sobre una situación o comportamiento particular.

  • hambriento
  • Eiger jugando/cazando/saliendo
  • molesto/en peligro
  • Somnoliento
  • feliz/cómodo
  • córneo
  • enojado

Como he vuelto a especificar el comportamiento, es hora de recopilar algunos ejemplos. Lo bueno es que hay mucha gente grabando a sus gatos mientras maúllan, lo malo es que mi historial de Youtube está lleno de búsquedas como:

1644947949 68 Como cree una aplicacion que traduce las voces de los
Para aquellos que se preguntan, así es como se ve un mapa de sonido de un gato cachondo

Una vez que he recopilado todos los datos de muestra sin procesar en formato mp3, es hora de compararlo con el sonido de Gilbert. Recuerde, debido a que esta aplicación es específica para Gilbert, todos los datos utilizados pertenecen a gatos machos de 1 año. No sé qué vas a hacer con esta información, pero sí, eso es todo.

En esta etapa, tengo que comparar el sonido grabado por la aplicación con los datos de muestra y determinar a qué clase de Cat Sound pertenece.

1644947949 278 Como cree una aplicacion que traduce las voces de los

Ahora que tenemos el audio sin procesar de Gilbert y nuestro ejemplo preentrenado, es hora de comparar el espectro de audio para averiguar a cuál de los 7 comportamientos pertenece. Para esto, uso un analizador bifurcado del analizador de audio de Google.

1644947949 4 Como cree una aplicacion que traduce las voces de los

Una vez que sé qué tipo de maullido es, muestro una referencia aleatoria de la lista de comportamientos. Supongamos que el comportamiento es hambre y la hora del día es antes de las 12:00 p. m., en cuyo caso podríamos obtener una cita como «¡Tengo hambre, dame el desayuno!».

LEER  Los 11 mejores emuladores ligeros de Android para PC en 2022

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba