


FrontierScience es un nuevo punto de referencia diseñado para evaluar el razonamiento científico de nivel experto de la IA en física, química y biología. Mide tanto la resolución de problemas al estilo de las Olimpiadas como tareas de investigación reales, ayudando a rastrear qué tan bien los modelos avanzados pueden apoyar y acelerar el trabajo científico. El punto de referencia va más allá de las preguntas teóricas al incluir razonamiento experimental en laboratorio húmedo, como se demostró en un estudio reciente donde GPT‑5 optimizó un protocolo de clonación molecular, mejorando la eficiencia en 79x a través de un mecanismo enzimático novedoso.
FrontierScience abarca física, química y biología, probando tanto la resolución de problemas teóricos (por ejemplo, preguntas al estilo de las Olimpiadas) como tareas de investigación reales. Esto asegura que el punto de referencia capture una amplia gama de pensamiento científico de nivel experto.
A diferencia de los puntos de referencia puramente teóricos, FrontierScience incluye evaluaciones donde los modelos de IA proponen modificaciones a protocolos de laboratorio reales. En el estudio de clonación, GPT‑5 razonó de forma autónoma sobre los pasos de biología molecular, sugirió combinaciones de enzimas e incorporó datos experimentales para mejorar iterativamente los resultados.
El punto de referencia reveló que GPT‑5 podía introducir un mecanismo enzimático no reportado previamente—Ensamblaje HiFi de Par y Finalización Asistido por RecA (RAPF) combinado con transformación T7—que aumentó la eficiencia de clonación en 79x. Esto demuestra la capacidad del modelo para encontrar soluciones no obvias y experimentalmente válidas.
Todo el trabajo de laboratorio húmedo se realizó en un entorno estrictamente controlado utilizando un sistema experimental benigno. Los resultados se incorporan directamente al Marco de Preparación de OpenAI, ayudando a evaluar y mitigar los riesgos asociados con capacidades avanzadas de razonamiento biológico.
FrontierScience no solo prueba lo que la IA sabe—prueba si la IA puede inventar nueva ciencia en el laboratorio.
La mayoría de los puntos de referencia se limitan a respuestas de opción múltiple o escritas. FrontierScience va más allá al exigir que los modelos propongan modificaciones experimentales viables, y luego valida esas ideas a través de resultados reales de laboratorio. La ganancia de eficiencia de 79x a partir de una vía enzimática novedosa muestra que la IA puede contribuir con ideas originales y empíricamente sólidas a la investigación biológica, no solo resumir el conocimiento existente.
Estás siguiendo qué tan cerca está la IA de convertirse en un colaborador de investigación genuino en las ciencias de la vida, o si necesitas un punto de referencia que capture tanto el rigor teórico como el razonamiento experimental práctico. FrontierScience es especialmente relevante para equipos que trabajan en seguridad de la IA, bioseguridad o la aceleración del descubrimiento de fármacos y la ingeniería de proteínas.
Otras herramientas que podrías considerar
Loading comments…
Creador
async_apple
Visitar sitio web
openai.com/index/accelerating-biological-research-in-the-wet-lab/
Información del proyecto
Palabras clave del producto
Logro