- Monógrafo
- Posts
- Diversificando la voz de la IA
Diversificando la voz de la IA
Genera subtítulos con Google Gemini
Buenos días, es martes 19 de noviembre.
Voluntarios recopilan datos en más idiomas, edades y géneros para una IA de voz inclusiva. Además, tacto Invisible permite a la IA sentir superficies. Por otra parte, Shekhar Kapur planea una escuela de cine en Dharavi enfocada en IA.
🐒 ¿Primera vez leyendo Monógrafo? Suscríbete aquí.
Menú
🧑🤝🧑 IA y Sociedad - Diversificando la voz de la IA
🛠️ Herramientas - 5 herramientas para desarrollo de software
💬 Prompt - Establecer objetivos a corto plazo
🥼 IA y Ciencia - Investigadores capacitan a la IA con el sentido del “tacto”
🧠 Tutorial AI - Genera subtítulos con Google Gemini
🎥 IA y Cine - Shekhar Kapur lanzará una escuela de cine basada en IA
🍌 Snacks - Noticias rápidas de IA
IA y Sociedad
Midjourney
Un esfuerzo comunitario masivo, liderado por voluntarios, está trabajando para que la próxima generación de IA de voz sea más inclusiva y menos explotadora.
Puntos clave
Origen de la iniciativa: Mozilla lanzó el proyecto Common Voice para recolectar datos de voz en múltiples idiomas, permitiendo que la IA refleje mejor la diversidad global.
Datos de voz recolectados: Desde 2017, han recolectado 31,000 horas de datos en 180 idiomas, con la participación de más de 900,000 voluntarios.
Problemas actuales: La mayoría de los asistentes de voz se entrenan con datos en inglés, limitando la calidad de las respuestas en otros idiomas y contribuyendo a una homogeneización cultural.
Diversidad en la recolección: La iniciativa también se centra en incluir voces de diferentes géneros, edades y acentos para reducir los sesgos en los modelos de IA.
¿Por qué es importante?
El objetivo de Common Voice es hacer que las tecnologías de IA sean más accesibles e inclusivas, reflejando la diversidad cultural y lingüística del mundo. Esto es crucial para evitar que la tecnología refuerce desigualdades existentes, y para garantizar que todos los grupos estén representados en el desarrollo tecnológico global.
¿Apoyarías proyectos como Common Voice para hacer la IA de voz más inclusiva y representativa? |
Iniciar Sesión o Suscríbete para participar en las encuestas. |
Herramientas
Bolt - Plataforma web para desarrollo de web apps con IA.
Cursor AI - App de escritorio para programar con la ayuda de la IA.
Vercel V0 - Crea tu primer versión de aplicación con el poder de la IA.
Continue - Asistente líder de código de IA de código abierto.
Aider - Programación en par con la IA y tu terminal.
👉️ Lista completa de las mejores herramientas.
Prompt
Establecer objetivos a corto plazo
Copia y pega este prompt en ChatGPT o cualquier otro chatbot de tu preferencia.
Actúa como un experto en el establecimiento de objetivos. Ayúdame a establecer tres objetivos alcanzables para [hoy, esta semana, etc.] relacionados con [una tarea o un proyecto específico] para que el progreso parezca manejable y gratificante.
IA y Ciencia
Midjourney
Investigadores del Centro de Ciencia Cuántica e Ingeniería de Stevens desarrollan un sistema de IA capaz de "sentir" superficies usando tecnología cuántica.
Puntos clave
IA con sentido del tacto: Un láser combinado con modelos de IA permite identificar texturas de objetos.
Funcionamiento: Emiten pulsos de luz sobre una superficie y analizan los fotones reflejados para interpretar su textura.
Resultados: Probado en 31 tipos de papel de lija, logra precisión comparable a dispositivos actuales, con margen de error de 4 micras.
Aplicaciones: Potencial para detectar cáncer de piel, diferenciar lunares y mejorar control de calidad industrial.
Tecnologías actuales: Podría perfeccionar sistemas LiDAR en autos autónomos y dispositivos electrónicos.
¿Por qué es importante?
Esta innovación expande las capacidades de la IA para interactuar con el mundo físico, abriendo nuevas posibilidades en precisión para medicina, manufactura y tecnología autónoma.
Tutorial AI
Google AI Studio
La función avanzada de video de Google Gemini te permite crear subtítulos en varios idiomas de manera sencilla.
Accede a Gemini Studio
Visita Google AI Studio y selecciona el modelo Gemini 1.5 Pro.
Sube tu video
Carga tu archivo de video en la plataforma y deja que Gemini genere una transcripción detallada con marcas de tiempo.
Traduce los subtítulos
Utiliza prompts específicos para traducir la transcripción a los idiomas que desees. Por ejemplo:
“Traduce el siguiente texto al español manteniendo el formato de subtítulos con marcas de tiempo claras”
Ajusta y formatea
Modifica la sincronización y el formato de los subtítulos para lograr un resultado profesional.
Incluye instrucciones como "Mantén el lenguaje formal" o "Adapta el tono para una audiencia juvenil" si deseas personalizar aún más el estilo de la traducción.
IA y Cine
Midjourney
El cineasta Shekhar Kapur quiere innovar con una escuela de cine en India que ayude a jóvenes cineastas.
Puntos clave
Shekhar Kapur: Conocido por su filmografía que incluye "Masoom", "Mr. India" y "Elizabeth".
Escuela de cine: Kapur planea abrir una escuela de cine en Dharavi, Mumbai, con un enfoque en la IA aplicada al cine.
Visión: Kapur cree que la IA permite que cualquiera, sin importar sus recursos, pueda crear cine de alta calidad.
Oportunidades: Afirma que el futuro de la competencia no será con los grandes directores, sino con jóvenes que entienden y utilizan la IA.
Status Quo: Aunque la fecha de lanzamiento no está confirmada, Kapur ya ha comenzado los preparativos y está en conversaciones con socios importantes.
¿Por qué es importante?
Esta escuela podría abrir nuevas oportunidades para jóvenes de Dharavi, brindándoles acceso a tecnología avanzada y recursos para entrar al mundo del cine. La IA como herramienta de creación cinematográfica tiene el potencial de igualar las oportunidades en una industria que es sumamente difícil salir adelante.
Snacks
Wall Street y firmas de capital privado esperan grandes ganancias del auge de infraestructura de IA, valorado en $1 billón, liderado por centros de datos y energía.
CEO de Salesforce está 'absolutamente impresionado' por el nuevo asistente de voz Gemini AI de Google.
La startup Aggie, basada en datos, utiliza IA para gestionar las redes sociales de pequeñas empresas.
Perplexity AI ahora permite a suscriptores Pro en EE. UU. comprar productos directamente desde su motor de búsqueda, con envío gratuito incluido.
EE. UU. limita inversiones en startups chinas de IA avanzada; Trump podría ampliar restricciones, intensificando tensiones tecnológicas con China.
Hackers usan deepfakes y editores de video falsos con IA para distribuir malware como Lumma Stealer y AMOS en Windows y macOS.
ESPN crea un nuevo analista de fútbol americano impulsado por IA que podría ser el futuro de ver deportes en vivo.
Nvidia enfrenta problemas de sobrecalentamiento con sus nuevos chips de IA Blackwell en servidores, preocupando a clientes.
Eso es todo por hoy. Hasta la próxima edición.¿Que te pareció este número? |
Iniciar Sesión o Suscríbete para participar en las encuestas. |
📩Necesitamos tus comentarios para mejorar nuestra newsletter.