Monógrafo
Posts
Cuando la IA pase esta prueba, ¡cuidado!”

Cuando la IA pase esta prueba, ¡cuidado!”

Cómo usar Serif para optimizar tu correo electrónico

Eduardo González
January 24, 2025

Buenos días, es viernes 24 de enero.

Un nuevo test, "El último examen de la humanidad", superó a los mejores modelos de IA. Además, un modelo chino venció a los más grandes con menos recursos. Por último, OpenAI lanza su agente de IA capaz de navegar la web por ti.

🐒 ¿Primera vez leyendo Monógrafo? Suscríbete aquí.

Menú

📄 IA y Pruebas - El examen que la IA aún no puede superar

🛠️ Herramientas - 5 nuevas herramientas de IA

💬 Prompt - Fotografía con enfoque suave

🐋 DeepSeek - El modelo chino que les puede dar la ventaja en la carrera por la IA

🧠 Tutorial AI - Cómo usar Serif para optimizar tu correo electrónico

🤖 OpenAI - OpenAI lanza su agente “Operator”

🍌 Snacks - Noticias rápidas de IA

IA y Pruebas

El examen que la IA aún no puede superar

Midjourney

Los creadores de una nueva prueba llamada “El último examen de la humanidad” argumentan que pronto podríamos perder la capacidad de crear pruebas lo suficientemente difíciles para los modelos de IA.

✅ Puntos clave

La prueba más difícil hasta ahora: Diseñada por el investigador Dan Hendrycks en colaboración con Scale AI. La tarea plantea 3,000 preguntas en áreas como filosofía, ingeniería aeroespacial y física avanzada.
Validación: Las preguntas han sido escritas y revisadas por expertos, incluidas personas que han ganado premios en matemáticas y profesores universitarios.
Filtro riguroso: Las preguntas fueron evaluadas primero por modelos de IA líderes. Si no lograban resolverlas correctamente, se ajustaban y validaban con revisores humanos.
Resultados iniciales: Los modelos actuales, como Gemini 1.5 Pro de Google y Claude 3.5 Sonnet de Anthropic, fracasaron rotundamente. El mejor puntaje fue de OpenAI o1, con apenas un 8.3%.
Un futuro prometedor: Los expertos esperan que los puntajes aumenten rápidamente, posiblemente superando el 50% este año. Cuando eso suceda, podríamos estar ante sistemas de IA capaces de responder preguntas complejas con precisión similar o superior a la de expertos humanos.

💡 Por qué importa

Viéndolo desde el lado positivo, una IA que pase esta prueba podría revolucionar campos como la ciencia, las matemáticas y la ingeniería, ayudando a resolver problemas aun sin respuesta. Por otro lado, y como lo advierte el New York Times: “Cuando la IA pase esta prueba, ¡cuidado!”, lo que siguiere que debemos proceder con cuidado y responsabilidad. Aquí un ejemplo de tres preguntas del test 👇️

Herramientas

Steno - Tus podcasts favoritos, completamente transcritos.
Playlist AI - Crea listas de reproducción a partir de prompts de IA, imágenes, videos y tu música más escuchada.
Krisp - Elimina voces de fondo, ruidos y ecos de todas tus llamadas.
Endel - Paisajes sonoros personalizados para ayudarte a concentrarte, relajarte y dormir.
Cleanvoice - Elimina palabras de relleno, tartamudeos y sonidos de la boca de tus podcasts o grabaciones de audio.

👉️ Lista completa de las mejores herramientas.

Prompt

Fotografía con enfoque suave

Midjourney

Copia y pega este prompt en Midjourney. Escrito en inglés para mejores resultados.

Soft-focus photography of a [color, flower] on a white background, with blurry details, a dreamy and prismatic image, chromatic aberration, pearlescent colors and reflections, and muted pastel tones, in the style of Richard Avedon. --ar 9:16 --profile xj2oxel --stylize 1000 --v 6.1

DeepSeek

El modelo chino que les puede dar la ventaja en la carrera por la IA

Midjourney

DeepSeek, una startup china de IA, ha logrado algo sorprendente: crear un chatbot de alto nivel con recursos mínimos, desafiando tanto a Google como OpenAI.

✅ Puntos clave

Eficiencia sin precedentes: Mientras las empresas estadounidenses usan 16,000 chips, DeepSeek sacó adelante su proyecto con solo 2,000 chips de Nvidia.
Bajo presupuesto, gran resultado: Invirtieron cerca de $6 millones en DeepSeek-V3, una fracción comparado con los más de $100 millones que gastan otras compañías en sus modelos.
Creatividad ante restricciones: Las limitaciones de EE. UU. para vender chips avanzados han obligado a los ingenieros chinos a ser más ingeniosos y eficientes.
Código abierto como estrategia: Compartieron públicamente el código de su sistema, apostando por la colaboración global y demostrando que la innovación no es privada.
Nuevo escenario tecnológico: Su movimiento podría posicionar a China en el centro del desarrollo de IA, desafiando el dominio estadounidense.

💡 Por qué importa

El modelo R1 de DeepSeek superó al o1 de OpenAI, revelando que la innovación en IA puede surgir con recursos limitados y cuestionando las actuales barreras tecnológicas. Su éxito sugiere que el código abierto podría ser el verdadero motor del avance global en inteligencia artificial. Es esta edición explico como utilizar DeepSeek V3.

Tutorial AI

Cómo usar Serif para optimizar tu correo electrónico

Serif

Serif es un asistente de IA diseñado para simplificar la gestión de tu bandeja de entrada. Analiza tu correo, genera documentos relevantes sobre ti y tu trabajo, y te ayuda a responder correos y organizar reuniones.

Regístrate en Serif
- Ve a Serif y crea una cuenta gratuita.
Genera documentos personalizados
- Una vez registrado, Serif analizará tu bandeja de entrada y creará automáticamente unos 100 documentos relacionados con:
  - Tu perfil.
  - Tus proyectos.
  - Tu empresa.
  - Tus contactos.
- Estos documentos permiten a Serif entender cómo gestionar tus correos con precisión.
Responde correos automáticamente
- Cuando llegue un nuevo correo, Serif generará una respuesta preliminar que puedes enviar directamente.
- Si Serif no está seguro de cómo responder, te ofrecerá varias opciones para elegir la más adecuada.
Programa reuniones
- Serif también puede revisar tu calendario y ayudarte a coordinar reuniones directamente desde tu bandeja de entrada.

OpenAI

OpenAI lanza su agente “Operator”

Bryce Durbin / TechCruch

OpenAI acaba de presentar Operator, un agente de IA que puede moverte por internet y hacer tareas por ti, como si fuera tu asistente personal digital.

✅ Puntos clave

Primeros pasos: Operator arranca como una vista previa solo para usuarios Pro de ChatGPT en Estados Unidos, con un precio de $200 mensuales.
Su funcionamiento: Combina lo mejor de GPT-4o y aprendizaje por refuerzo. Básicamente "ve" las páginas web con capturas de pantalla e interactúa escribiendo, haciendo clic y desplazándose.
Seguridad primero: Si encuentra información delicada, como contraseñas, el sistema se detiene y te pide permiso. Siempre busca tu aprobación antes de hacer algo importante.
Alianzas estratégicas: OpenAI ya está trabajando con empresas como DoorDash, Instacart, OpenTable y Uber para asegurarse de que cubra necesidades reales.
Lo que aún no hace bien: Por ahora tiene problemas con tareas complejas como crear presentaciones o gestionar calendarios.
Lo que viene: La idea es expandirlo pronto a más planes de ChatGPT e integrarlo completamente en la plataforma.

💡 Por qué importa

Operator marca el inicio de la era de agentes para OpenAI.Su éxito dependerá de cómo supere sus actuales limitaciones y maneje temas de seguridad y usabilidad. Aquí puedes ver la presentación completa con Sam Altman y el equipo de ingeniería.

Snacks

Trump dice que aprobará plantas de energía para IA mediante declaración de emergencia nacional.
Anthropic está por lanzar “Citations”, una API que permite a Claude basar sus respuestas en las fuentes que el usuario proporciona.
Freepik añadió el último generador de imágenes de IA de Google, Imagen 3, a su suite de IA.
LinkedIn enfrenta demanda por acusaciones de usar mensajes privados para entrenar a la IA.
Hugging Face afirma que sus nuevos modelos de IA son los más pequeños de su tipo.
Fundraise Up afirma que su inteligencia artificial puede aumentar las donaciones a organizaciones sin fines de lucro.
McDonald's continúa desarrollando innovaciones basadas en IA y de nube.