Para qué sirven los exámenes

Multitud de estudios se han llevado a cabo para dar respuesta a esta y otras preguntas íntimamente relacionadas. A lo largo de varias entradas intentaré hacer un hilo conductor que lleve a comprender mejor cómo se produce el aprendizaje de los contenidos curriculares de una manera más eficiente.

Examinaremos, por un lado, estudios de laboratorio que revelan el potencial de las pruebas, exámenes o evaluaciones para mejorar la retención, y estudios que demuestran los efectos básicos en entornos educativos. Tendremos en consideración también los conceptos relacionados de las pruebas dinámicas y la evaluación formativa, además de los posibles efectos negativos de las evaluaciones, hasta llegar a las recomendaciones de la Psicología para mejorar la forma de estudiar:

La idea que tiene la mayor√≠a sobre un examen se refiere a una prueba que se realiza al final de uno o varios temas explicados por el profesor, practicados en aula con una metodolog√≠a u otra y te√≥ricamente interiorizados por los alumnos. Aunque actualmente se valoran otras muchas cuestiones adem√°s de una puntuaci√≥n √ļnica en un momento determinado, creo que es interesante ahondar en esta cuesti√≥n y dejar claro qu√© es lo que nos dice la investigaci√≥n cient√≠fica.

El llamado ‘Efecto de Prueba’

Este fen√≥meno ha sido estudiado por psic√≥logos experimentales a lo largo de los a√Īos, pero a partir de la d√©cada de los 80 hay poca literatura y rara vez se ha aplicado con la intenci√≥n de extrapolar los resultados al √°mbito educativo. ¬ŅSon las pruebas eficaces o es un m√©todo de evaluaci√≥n del alumnado obsoleto y en v√≠as de extinci√≥n?. ¬ŅMiden o infieren lo que un alumno ha aprendido realmente? ¬ŅSirven para algo m√°s que para puntuar un supuesto conocimiento alcanzado?.

El mismo William James argument√≥ a finales del siglo XIX en su obra ‘Los Principios de la Psicolog√≠a’ : ¬ęlas cosas se impresionan mejor por la repetici√≥n activa que pasiva… al aprender cuando casi conocemos la pieza, es mejor esperar y recordar por un esfuerzo desde dentro que mirar el libro de nuevo¬Ľ.

De la misma opini√≥n eran Abbott en 1909 y Thorndike en 1914 con sus respectivas investigaciones, mencionado este √ļltimo como referente de la Psicolog√≠a Educativa en la PRIMERA ENTRADA DE ESTE BLOG.

Analizar√© este art√≠culo que hace una revisi√≥n exhaustiva de la literatura a lo largo del siglo XX y llega a conclusiones interesantes y de no tan dif√≠cil aplicaci√≥n en las aulas. En muchos de los experimentos que describen, un grupo de estudiantes deb√≠a aprender una serie de cuestiones que eran ¬ęevaluadas¬Ľ con una prueba inicial e incluso con varias repetidas. La retenci√≥n del material se determin√≥ con una prueba de criterio final y el rendimiento del grupo que realizaba ex√°menes se compar√≥ con uno o dos grupos de control.

  • En un tipo de control, los estudiantes estudiaron el material y tomaron la prueba final, pero no se les dio una prueba inicial como al otro grupo.
  • En un segundo tipo de control, los estudiantes estudiaron el material pero luego volvieron a reestudiarlo una segunda vez mientras el primer grupo recib√≠a la prueba inicial; el tiempo total de exposici√≥n al material se equipar√≥ para los grupos de ensayo y de control.

¬ŅSuperar√° el grupo de ensayo a ambos tipos de grupos de control en la prueba final? ¬ŅInfluye el hecho de que los estudiantes reciban retroalimentaci√≥n por parte del profesor sobre los resultados de la prueba inicial?. En variaciones de este experimento se han investigado los efectos de otras variables como el tipo de material a aprender, el formato de las pruebas, el intervalo de retenci√≥n antes de la prueba final, etc. La idea es ver si el resultado es robusto a trav√©s de una amplia variedad de contextos.

Los primeros estudios sobre el efecto de los ex√°menes

Gates (1917) y Spitzer (1939) publicaron dos estudios cl√°sicos que muestran fuertes efectos positivos de las pruebas en la retenci√≥n, siendo el primero quien llev√≥ a cabo un estudio pionero a gran escala con ni√Īos de diversos grados y utilizando dos tipos diferentes de materiales: s√≠labas sin sentido y biograf√≠as breves.

Los ni√Īos estudiaron estos materiales durante un procedimiento de aprendizaje de dos fases:

  • En la primera fase se leen el contenido a s√≠ mismos.
  • En la segunda fase el experimentador les instruy√≥ para tratar de recordar la informaci√≥n (recitaci√≥n encubierta) sin el material delante, aunque se les permiti√≥ echar un vistazo cuando necesitaban refrescar sus recuerdos. Aunque esta caracter√≠stica del dise√Īo relaj√≥ el control experimental, probablemente captur√≥ fielmente lo que los estudiantes hacen en una condici√≥n u otra a la hora de estudiar.

Gates manipul√≥ la cantidad de tiempo que los ni√Īos pasaban recitando, haciendo que dejaran de leer y comenzaran a recuperar la informaci√≥n despu√©s de intervalos de tiempo distintos. Al final del per√≠odo les hizo una prueba pidi√©ndoles que escribieran tantos art√≠culos como pudieran en orden de aparici√≥n. Luego volvi√≥ a examinar a los ni√Īos de 3 a 4 horas m√°s tarde.

En las s√≠labas sin sentido, todos los grupos excepto los de primer grado (a tener en cuenta que estos ni√Īos mostraban a√ļn habilidades de lectura pobres), mostraron un fuerte efecto cuando deb√≠an recuperar la informaci√≥n y no s√≥lo estudiarla. Cuando el material eran las biograf√≠as breves, todos los grupos mostraron tambi√©n el mismo efecto, aunque no fue tan robusto en las pruebas iniciales como en las m√°s dilatadas en el tiempo.

En dicho artículo concluyó que los intentos de recordar durante el aprendizaje son una buena manera de promover este. Argumentó, además, que los resultados tenían importantes implicaciones para la práctica educativa y describió formas de incorporar esa metodología en los ejercicios de clase.

Sin embargo, el trabajo de Gates tambi√©n se√Īal√≥ las limitaciones referidas a los estudiantes de primer grado que no mostraron el efecto, lo que sugiere que puede ocurrir s√≥lo despu√©s de un cierto punto de desarrollo. Otro punto que analizaremos m√°s adelante es que, con los pasajes en prosa, el efecto de la autorrecuperaci√≥n se estabiliz√≥ e incluso pareci√≥ disminuir cuando la cantidad de tiempo dedicado super√≥ el 60%, y en consecuencia el tiempo de estudio fue inferior al 40%.

Por lo tanto, los datos sugieren que una cierta cantidad de estudio puede ser necesaria antes de una prueba para que influya sobre el aprendizaje de los contenidos.

En el estudio de Spitzer se utiliz√≥ a toda la poblaci√≥n de estudiantes de sexto grado en 91 escuelas primarias en nueve ciudades de Iowa, un total de 3.605 estudiantes. El experimento consisti√≥ en que estudiaran art√≠culos de 600 palabras que eran similares al material que podr√≠an estudiar en la escuela y luego fueron evaluados de acuerdo a varios horarios durante los siguientes dos meses. Introdujo una de las variables antes mencionadas con respecto al tipo de formato de la prueba. Cada una de esas evaluaciones consisti√≥ en 25 art√≠culos de opci√≥n m√ļltiple con cinco alternativas de respuesta. Algunos estudiantes realizaron una sola prueba dos meses despu√©s, mientras que otros hicieron adem√°s varias pruebas anteriores para ver qu√© efecto tendr√≠an en el examen final.

Se pudieron discernir varios patrones interesantes en los resultados:

  • Cuanto m√°s tiempo se retras√≥ la primera prueba, peor fue el rendimiento en la misma.
  • El hecho de realizar una prueba, casi consigui√≥ que no se produjese un efecto de olvido. Es decir, cuando a los estudiantes se les dio una primera prueba y luego se volvi√≥ a probar en un momento posterior, su rendimiento no s√≥lo no cay√≥ sino que en ocasiones incluso mejor√≥.
  • Cuanto antes se realice la prueba inicial despu√©s del estudio, mejores resultados tendr√°n los estudiantes en las pruebas posteriores.

La lección del estudio de Spitzer es que una primera prueba (sin retroalimentación siquiera) debe ser administrada relativamente poco después del estudio (cuando el estudiante todavía puede recordar o reconocer el material) con el fin de tener un efecto positivo en un momento posterior.

Los trabajos de Gates y Spitzer se encontraban entre los más extensos de su época, aunque hay otro también exhaustivo y del que se han hecho eco posteriormente numerosos autores para sus propias investigaciones.

Aunque algunas de las caracter√≠sticas de las t√©cnicas experimentales de estos dos estudios no aguantar√≠an los est√°ndares de calidad de hoy, los puntos esenciales han sido replicados posteriormente en numerosas ocasiones. Como ejemplos y para finalizar esta entrada que tendr√° su continuaci√≥n, Forlano replic√≥, en 1936, el trabajo de Gates y demostr√≥ que las pruebas mejoran no s√≥lo el aprendizaje sino tambi√©n la ortograf√≠a de las palabras que forman parte del vocabulario de los ni√Īos; Sones y Stroud por su parte, en 1949, replicaron el estudio de Spitzer aunque a menor escala.

¬ŅSe repetir√°n los resultados en estudios posteriores? ¬ŅQu√© otras variables pueden influir en la mayor o menor eficiencia en el aprendizaje de los contenidos? ¬ŅPor qu√© a menudo se olvida lo estudiado una vez realizado el examen? ¬ŅEs importante dar feedback a los estudiantes sobre los resultados de las pruebas? A estas y otras preguntas contesto en LAS SIGUIENTES ENTRADAS RELACIONADAS, siempre con el apoyo de la investigaci√≥n.

J_Arg√ľeso

Deja un comentario

Tu dirección de correo electrónico no será publicada.

error: Cuesta mucho trabajo formarse