


Claude Opus 4.6 es el modelo más avanzado de Anthropic, diseñado para razonamiento profundo, tareas agentivas sostenidas y trabajo con bases de código a gran escala. Cuenta con una ventana de contexto de 1 millón de tokens en versión beta, capacidades de pensamiento adaptativo y habilidades de planificación mejoradas. El modelo alcanza un rendimiento de vanguardia en benchmarks como Terminal-Bench 2.0, Humanity's Last Exam y BrowseComp, al mismo tiempo que sobresale en tareas de trabajo intelectual del mundo real en finanzas, derecho y otros ámbitos profesionales.
Opus 4.6 introduce una enorme ventana de contexto de 1 millón de tokens en versión beta, lo que permite al modelo procesar bases de código completas, documentos extensos o conversaciones prolongadas en una sola sesión. Esto hace posible trabajar con proyectos a gran escala sin tener que recargar el contexto constantemente.
El modelo ahora puede captar pistas contextuales para determinar cuánto pensamiento extendido requiere una tarea. Los desarrolladores también pueden ajustar el esfuerzo hacia arriba o hacia abajo usando el parámetro /effort, lo que proporciona un control detallado sobre el equilibrio entre inteligencia, velocidad y costo.
En Claude Code, puedes ensamblar equipos de agentes que colaboran en tareas conjuntamente. En la API, la compactación permite que Claude resuma su propio contexto para realizar tareas de mayor duración sin alcanzar límites, haciendo que el trabajo autónomo sostenido sea más práctico.
Mejoras sustanciales de Claude en Excel y una nueva vista previa de investigación para Claude en PowerPoint hacen que Opus 4.6 sea significativamente más capaz para tareas profesionales cotidianas como crear hojas de cálculo, elaborar presentaciones y realizar análisis.
Claude Opus 4.6 es el modelo más potente que Anthropic ha lanzado. Toma solicitudes complejas y realmente las lleva a cabo, dividiéndolas en pasos concretos, ejecutándolas y produciendo un trabajo pulido.
Esto no se trata solo de puntuaciones brutas en benchmarks: Opus 4.6 supera al siguiente mejor modelo en trabajo intelectual económicamente valioso en aproximadamente 144 puntos Elo. Los socios de acceso temprano informan que el modelo trabaja de forma autónoma sin necesidad de supervisión constante, tiene éxito donde modelos anteriores fallaban y cambia fundamentalmente la forma en que los equipos abordan proyectos complejos. Combinado con un perfil de seguridad que iguala o supera a cualquier otro modelo de frontera, ofrece tanto capacidad como fiabilidad.
Necesitas un modelo que pueda manejar tareas de razonamiento profundo, trabajar de forma autónoma durante sesiones prolongadas y gestionar grandes bases de código o documentos complejos sin supervisión constante. Si estás construyendo flujos de trabajo agentivos, realizando análisis profesionales o deseas un modelo que planifique cuidadosamente y detecte sus propios errores, Claude Opus 4.6 merece ser evaluado.
Otras herramientas que podrías considerar
Loading comments…
Creador
pixelpunk
Visitar sitio web
anthropic.com/news/claude-opus-4-6
Información del proyecto
Palabras clave del producto
Alternativas