CriticGPT es una nueva herramienta de inteligencia artificial de OpenAI para encontrar errores en ChatGPT; Una nueva característica puede ayudar a entrenar chatbots por parte de humanos.
OpenAI anunció un nuevo modelo de IA llamado CriticGPT, entrenado en GPT-4 y utilizado para corregir posibles errores en las respuestas. ChatGPT sobre programación. Según la empresa, las personas que utilizan la herramienta ven mejoras el 60% de las veces.
La herramienta fue creada para perfeccionar los procesos de revisión de respuestas de ChatGPT: OpenAI informa que el chatbot se vuelve más preciso con el tiempo, con errores más sutiles, lo que puede dificultar la vida de los profesionales que analizan imprecisiones en la plataforma. La solución entonces fue entrenar a CriticGPT para que escribiera reseñas destacando las vulnerabilidades en las respuestas, incluidos errores que pasan desapercibidos para los humanos.
La empresa quiere integrar modelos similares a los novedosos sistemas Human Feedback Reinforcement Learning (RLHF), que utilizan la formación profesional para detectar posibles errores y comparar las respuestas de los chatbots.
Los resultados recopilados por la empresa revelan que CriticGPT no acierta todas las sugerencias, pero que los formadores se desempeñan mejor con la herramienta que aquellos que no la utilizan. Los conocimientos que ofrece la IA ayudan a crear reseñas más comprensibles y a reducir el riesgo de errores debidos a ilusiones informáticas. tecnología (proceso cuando la IA crea hechos inexistentes o inexactos).
Límites
La herramienta puede resultar útil para detectar errores, pero el desarrollador aún destaca ciertas limitaciones:
- CriticGPT solo está capacitado para respuestas cortas de ChatGPT, por lo que aún necesita mejoras para comprender solicitudes más largas;
- Los modelos aún pueden provocar alucinaciones y dificultar el trabajo de los entrenadores de IA;
- La herramienta puede corregir un error individual en el código, pero puede pasar por alto otros problemas en la respuesta misma;
- CriticGPT tiene dificultades para contribuir a tareas muy complejas, incluso bajo la supervisión de expertos.
Inicialmente, la herramienta solo está disponible para quienes trabajan con capacitación en herramientas de inteligencia artificial. Y hablando de OpenAI, el CEO Sam Altman comentó recientemente que el sucesor del GPT-4, ya en desarrollo, traerá un “salto significativo” en comparación con el modelo actual.
Tendencia en Canaltech:
«Explorador apasionado. Aficionado al alcohol. Fanático de Twitter. Webaholic galardonado. Aficionado a la comida. Geek de la cultura pop. Organizador».