Cómo creé una aplicación que traduce las voces de los gatos al lenguaje humano | Por Ege Kuzubasioglu | Febrero de 2022

Ideas de un millón de dólares de Zimbabue

Todo comenzó cuando el tipo «emprendedor» me envió un mensaje en Linkedin.
«Solo estás programando, hermano, si me haces una aplicación que conduzca mi auto, te daré el 20 por ciento».
Antes de rechazar la generosa oferta del Sr. Hyphothetical, me prometí a mí mismo que algún día haría una aplicación que suene graciosa en el papel y que no tendría tecnología de cadena de bloques. O NFT… porque todavía no sé qué es.*
Un avance rápido hasta enero y mi novia me preguntó:
«¿Sería genial si me hicieras una aplicación para el Día de San Valentín?»
Esto suena como una idea increíble por dos razones: primero, no tengo que pensar en regalos y segundo, finalmente puedo hacerlo. esa aplicación
gato gilberto
Este es nuestro gato Gilbert, y no se equivoca. Excepto que está maullando demasiado… Quiero decir, demasiado, lo que me hizo revisar mis viejas notas de aprendizaje automático y hacer una aplicación solo para entender de qué está hablando. Una aplicación que traduce maullidos al inglés.

cosas súper complejas de aprendizaje automático
Creo que para poder traducir los sonidos de los gatos, deberías saber si un sonido es un sonido de gato. Suena lógico, ¿verdad? Para hacer esto, diseñé un algoritmo de aprendizaje profundo muy sofisticado que puede distinguir sonidos. es una broma.acabo de usar Kit de aprendizaje automático Detector de sonido de Huawei Technologies. Puede detectar hasta 12 sonidos diferentes, uno de los cuales es el sonido de un gato.

OK, podemos distinguir entre maullidos y pedos, ¿y ahora qué? En esta etapa, necesito un montón de ejemplos de sonidos de gatos para anotar tipos específicos de comportamiento de gatos. En esta etapa, seguí el trabajo realizado por Yagya Raj Pandeya y Joonwhoan Lee, utilizando el aprendizaje por transferencia para la clasificación de voces de gatos domésticos. Afortunadamente, los gatos no hablan de política. cuando hablan, casi siempre sobre una situación o comportamiento particular.
- hambriento
- Eiger jugando/cazando/saliendo
- molesto/en peligro
- Somnoliento
- feliz/cómodo
- córneo
- enojado
Como he vuelto a especificar el comportamiento, es hora de recopilar algunos ejemplos. Lo bueno es que hay mucha gente grabando a sus gatos mientras maúllan, lo malo es que mi historial de Youtube está lleno de búsquedas como:
«Sonidos de coño cachondo – 1 hora de alta calidad»

Una vez que he recopilado todos los datos de muestra sin procesar en formato mp3, es hora de compararlo con el sonido de Gilbert. Recuerde, debido a que esta aplicación es específica para Gilbert, todos los datos utilizados pertenecen a gatos machos de 1 año. No sé qué vas a hacer con esta información, pero sí, eso es todo.
En esta etapa, tengo que comparar el sonido grabado por la aplicación con los datos de muestra y determinar a qué clase de Cat Sound pertenece.

Ahora que tenemos el audio sin procesar de Gilbert y nuestro ejemplo preentrenado, es hora de comparar el espectro de audio para averiguar a cuál de los 7 comportamientos pertenece. Para esto, uso un analizador bifurcado del analizador de audio de Google.

Una vez que sé qué tipo de maullido es, muestro una referencia aleatoria de la lista de comportamientos. Supongamos que el comportamiento es hambre y la hora del día es antes de las 12:00 p. m., en cuyo caso podríamos obtener una cita como «¡Tengo hambre, dame el desayuno!».