Bu çalışmada Eğitim fakültelerinde zorunlu ders olan Eğitimde Ölçme ve Değerlendirme dersi kapsamında ara ve final sınavında kullanılan 19 maddelik çoktan seçmeli öğretmen yapımı başarı testinde yer alan maddelerin cevaplayıcılar tarafından sınıflama yargılarına göre algılanan madde güçlük düzeyleri ile Klasik Test Kuramına göre hesaplanan madde güçlük düzeylerinin farklılaşıp farklılaşmadığına bakılmıştır. Ulaşılan bulgular, hem ara sınav sonuçları hem de final sınav sonuçlarına ait Klasik test Kuramına göre hesaplanan madde güçlük düzeyleri ile Sınıflama yargılarına göre algılanan madde güçlük düzeylerinin büyük ölçüde farklılaştıkları görülmektedir. Başarı testine ait A ve B formundaki maddelerin güçlük düzeylerinin farklılaştığı belirlenmiştir. Ayrıca bu çalışmada, her iki yönteme göre elde madde güçlük düzeyleri arasındaki ilişkiye bakılmıştır. Hem ara sınavındaki hem de final sınavındaki madde güçlük düzeyleri her iki yönteme göre kendi içinde pozitif yönde yüksek düzeyde anlamlı bir korelasyon verirken her iki yöntemden elde edilen madde güçlük düzeyleri arasında negatif yönde düşük düzeyde bir ilişki verdiği görülmüştür.
In this study, it was examined whether the item difficulty levels perceived according to the classification judgments of the items included in the 19-item multiple-choice teacher-making achievement test used in the mid-term and final exams in the education faculties, and the item difficulty levels calculated according to the classical test theory differs by the respondents Findings revealed that the level of item difficulty calculated according to the Classical Test Theory of both the mid-term and final exam results and the item difficulty levels perceived according to the classification judgments differed considerably. It was found that the difficulty levels of the items in the A and B forms of the achievement test differed. In addition, the relationship between the difficulty levels of the items according to both methods was examined in this study. The item difficulty levels in both the mid-term and the final exams showed a significant positive correlation between the two methods, whereas the item obtained from both methods showed a negatively low correlation between the difficulty levels.