Evaluación de grandes modelos para la "comprensión y el razonamiento profundos" en el mundo real, con textos largos y múltiples tareas En los últimos años, la investigación sobre grandes modelos lingüísticos para textos largos ha avanzado significativamente, y la longitud de la ventana de contexto para los modelos se ha ampliado de los 8.000 iniciales a 128.000 o incluso 1.000 tokens. sin embargo...