İçeriğe atla


Ek Bilgiler İçin Tıkla Adıyaman Forum Sayfalarına Hoş Geldiniz..!

Adıyaman Forum Bölümüne Hoşgeldiniz. Foruma üye olmak ücretsizdir.

Üye olduğunuzda forumun bütün özelliklerini kullanma hakkına sahip oluyorsunuz.

Takvimde Etkinlik Oluşturabilirsiniz

Kendinize Ait Bir Profil Sayfası Oluşturabilirsiniz.

Lütfen üyelik işlemini başlatmak için BURAYA tıklayınız.


Resim

Psikometride Yeni Ufuklar:


Bu başlığa hiç cevap verilmemiş

#1 kommagene

kommagene

    Deneyimli

  • ΦÜyeler
  • PipPipPip
  • 380 İletiler:

Gönderi Tarihi: 01 Ocak 2007 - 18:10

Bu makalede, psikometri ve bilişim teknolojilerindeki gelişmelerden etkilenerek ortaya çıkan bir test uygulama yöntemi tanıtılacaktır. Bu yöntem, psikometri literatüründe önceleri “bireye biçilmiş test” (tailored test), sonra “bireye uyarlanmış test” (adaptive test) -BUT- son yıllarda da “bilgisayar ortamında bireye uyarlanmış test (BOB TEST)” (computerized adaptive testing -CAT) biçiminde anılan bir test uygulama yöntemi , aynı zamanda da bir test geliştirme yöntemi olarak kabul edilmektedir.

Psikometride Yeni Ufuklar: Bilgisayar Ortamında Bireye Uyarlanmış Test
Yrd. Doç. Dr. Nükhet Çıkrıkçı - Demirtaşlı

Bu makalede, psikometri ve bilişim teknolojilerindeki gelişmelerden etkilenerek ortaya çıkan bir test uygulama yöntemi tanıtılacaktır. Bu yöntem, psikometri literatüründe önceleri “bireye biçilmiş test” (tailored test), sonra “bireye uyarlanmış test” (adaptive test) -BUT- son yıllarda da “bilgisayar ortamında bireye uyarlanmış test (BOB TEST)” (computerized adaptive testing -CAT) biçiminde anılan bir test uygulama yöntemi , aynı zamanda da bir test geliştirme yöntemi olarak kabul edilmektedir.

Bu konu, ülkemiz psikometri literatürü için çok yeni olmakla beraber, bilimsel çalışmalar da başlamıştır. Bu makalede, “bilgisayar ortamında bireye uyarlanmış” (BOB) test uygulaması ile ilgili kısa tarihçe verildikten sonra, uygulamanın temel yaklaşımı ve özellikleri, avantajları, uygulama stratejileri ile uygulamanın geleceğe dönük yönelimlerinden söz edilecektir.

Eğitim ve psikolojide kullanılan testlerin çoğu kağıt - kalem (paper and pencil) formunda uygulanmaktadır (Bejar, 1983; s.48). Bir grup yanıtlayıcı (test alan) testi, bir test kitapçığına basılı olarak alır ve yanıtlarını bir yanıt kağıdına kaydeder. Testin başka bir formu yoksa, genellikle herkes aynı sorulara yanıt verir. Testlerin bu biçimdeki uygulaması “geleneksel uygulama” (conventional application) olarak adlandırılır. Geleneksel uygulamanın tercih edilmesinin başlıca nedeni ekonomik olmasıdır. Bu testler tekrar kullanılacaksa maliyet daha da azalır. Geleneksel uygulama maliyet bakımından kullanışlı olmasına rağmen, psikometri, bilişim alanındaki ve öğretim psikolojisindeki gelişmeler, “test uygulama süresinin” kullanışlılık özelliğini yeniden değerlendirmeyi zorunlu kılmıştır. Özellikle, bilgisayar programlarındaki yenilikler, bilgisayarlar aracılığıyla maddelerin geliştirilmesini olanaklı kılmaktadır. Test uygulamasındaki gelişmelerin gözlendiği ikinci bir boyut, bilgisayar (hardware) alanındaki ilerlemelerdir. Bilgisayarların küçülmesi, işlem hacminin gelişmesi testlerin bilgisayarda uygulanmalarını sağlamıştır.

Öncelikle bu gelişmelere bağlı olarak ortaya çıkan BOB test uygulaması, bireyin ölçülen yeteneği ile test maddelerinin güçlük düzeyinin, bilgisayar ortamında eşlenmesidir. İlk, bireye uyarlanmış (adaptive test) test -BUT-, Alfred Binet tarafından 1908’de geliştirilmiştir. (Bejar, 1983; Hambleton, Swaminathan ve Rogers, 1991; Weiss, 1983; Weiss, 1988;). Binet, her bireye testin tümünü uygulamak yerine, bireyin yetenek düzeyine uygun güçlükteki maddeleri uygulama yolunu seçmiştir. Binet zeka testi, güçlükleri yaş düzeylerine göre değişen maddelerden oluşturulmuş ve buna göre madde havuzunu kullanan bir testtir. Binet zeka testi, modern test kuramı olan ve klasik test kuramına alternatif olarak geliştirilen kuram olan Madde Tepki Kuramına (Item Response Theory -IRT)- dayalı BUT ile karşılaştırıldığında oldukça basit kalırken, Binet’in testi günümüzdeki BUT’lerin temel özelliklerini taşımaktadır. Buna göre, Binet zeka testi bir başlangıç değişkeni kullanır. Testte, bireye ilk uygulanacak maddeler, test uygulayıcısı tarafından tahmin edilen yanıtlayıcı yeteneğine bağlı olarak belirlenir. Uygulama, tüm maddelerin yanlış yanıtlandığı yaş düzeyinden (ceiling level) daha alt yaş düzeyine kaydırılarak, tüm maddelerin doğru yanıtlandığı yaş düzeyi tanımlanır. Test maddeleri uygulanırken puanlanır. Eğer, verilen yaş düzeyinde, tüm maddeler doğru yanıtlanmışsa, uygulama daha güç maddelerle devam eder. Bireye uygulanacak diğer maddelerin seçilmesi için doğru yanıtlanan maddeler kullanılır. Bu düzey “basal düzey” olarak adlandırılır. Test uygulamasının sonlandırma ölçütü, bireyin tüm maddeleri yanlış yanıtladığı yaş düzeyidir.

Psikometride, Binet’in bu test uygulamasından sonra, 1950’lerin başına kadar BUT konusu gündem dışı kalmıştır (Hambleton, Swaminathan ve Rogers, 1991; Wainer ve ark., 1990). O tarihte adaptive test kağıt kalem olarak kısa bir süre daha çalışılmış, fakat uygulamanın karmaşıklığından dolayı yürütülememiştir. Lord’un, 1960’ların sonunda A.B.D’nin test kurumu olan “Eğitim Testleri Bürosu”’nda (Educational Testing Service - ETS) başlattığı çalışmalar, bu alan için geliştirici olmuştur. Lord, sabit sorulu testlerin özellikle düşük ve yüksek yetenekli cevaplayıcılar için yetersiz yetenek ölçüleri verdiği görüşünden hareket ederek, daha kısa testlerle ölçme yaparak, fazla bilgi kaybına neden olmadan bireyin yeteneği hakkında en fazla bilginin elde edilebileceğini öne sürmüştür. 1960’ların sonundan itibaren yürütülen araştırmalar, A.B.D. Ordu Hizmetleri, A.B.D personel yönetim bürosu ve diğer devlet kurumları tarafından desteklenmiştir. 1970’lerin başından itibaren, etkileşimli bilgisayarlarda gelişme ve artışın sağlanmasıyla, BUT’ler, “bilgisayar ortamında bireye uyarlanmış test (BOB test – Computerized Adaptive Testing - CAT)” haline gelmiştir.

Bilgisayar Ortamında Bireye Uyarlanmış Test Uygulamasının
Temel Yaklaşımı ve Özellikleri

Daha öncede belirtildiği gibi, bilgisayar ortamında bireye uyarlanmış test uygulaması-BOB Test-, bireyin ölçülen özelliği (yetenek) ile madde güçlüğünün bilgisayar ortamında eşlenmesidir (Bejar,1983; Hambleton, Swaminathan ve Rogers, 1991). Bir başka deyişle, uygulama esas olarak testin, testi alan her bireyin ölçülen yetenek düzeyine uyarlanması, test maddelerinin farklı setlerinin bireyin ölçülen özellikteki yerine bağlı olarak uygulanmasıdır (Weiss, 1988). Bu durumda her birey güçlük düzeyi kendi yetenek düzeyine göre uyarlanmış farklı testleri alır. Geleneksel testler genellikle orta yetenek düzeyini ölçecek biçimde düzenlenir. BOB test uygulaması, bireyin yetenek düzeyinin en iyi ölçüsünü verecek bir ortam sağlar. Genel bir BOB test uygulaması şu basamakları izler (Lord ve Stocking, 1988);

1 - Bireyin yetenek düzeyinin bir kestirimi elde edilir.
2 - Özellikleri (parametreleri) belirlenmiş maddelerden oluşan bir havuzdan o bireyin yeteneğinin iyi bir ölçüsü olacak maddeler seçilir.
3 - Seçilen maddeler uygulanıp puanlanır, kestirilen yetenek düzeyi gözden geçirilir.
4 - Eğer yetenek kestirimindeki hata yeterince düşük bir değere ulaşmışsa, uygulama sonlandırılır, değilse ikinci basamağa dönülür.

Bu uygulamada, bilgisayarlar, test maddeleri hakkındaki bilgilerin (güçlük ve ayırıcılık parametreleri) depolanmasını, üretilmesini, testin uygulanmasını ve puanlanmasını sağlar. Bilgisayar, maddelerin bireye uyarlanma işini ardışık olarak yapar; maddelerin cevaplayıcılara veriliş sırası yanıtlayıcının önceki maddedeki performansına göre düzenlenir. Yanıtlayıcıya, önceki maddede verdiği doğru veya yanlış yanıta göre, yeteneği hakkında en fazla bilgiyi verecek madde uygulanır. Bu uygulamada, geleneksel uygulamada olduğu gibi, yüksek yetenekli bireylere çok kolay maddelerin, düşük yetenekli bireylere ise çok zor maddelerin uygulanması sözkonusu değildir. Zira bu tür maddeler, bireyin yeteneği hakkında hiç bilgi sağlamamakta veya az bilgi vermektedir. Yanıtlayıcı bir dizi maddeye yanıt verdikten sonra (bazen iki veya üç maddeye), kendisi için bir yetenek kestirimi (tahmini) yapılır. Maddelerin bireye uygulanması istenen ölçme düzeyine (örneğin, belli bir standart hata miktarına) veya önceden belirlenen soru sayısına kadar sürdürülür (Hambleton, Swaminathan ve Rogers, 1991;Weiss, 1983; Weiss, 1988).

Bu uygulama için madde parametreleri bilinen geniş bir madde havuzuna, yetenek ve madde güçlüğü eşlemesini yapacak bir bilgisayar programına ve bir bilgisayara ihtiyaç vardır. Lord’a göre, BOB test uygulamasında kullanılacak bilgisayar aşağıdaki sıraya göre programlanmalıdır (Hambleton, Swaminathan ve Rogers, 1991);

1.Yanıtlayıcının önceki maddelere verdiği yanıtlardan, henüz uygulanmamış çeşitli maddelere vereceği yanıtları tahmin etmeli.
2. İlk uygulanan maddede elde edilen bilgiyi, sonra uygulanacak olan maddeyi seçmede etkili bir biçimde kullanmalı.
3. Test uygulamasının sonunda, test edilen bireyin yeteneğini sayısal olarak vermelidir.

Psikometrik bakış açısından, bu uygulamanın iki önemli avantajı vardır (Hambleton, Swaminathan ve Rogers, 1991; Wainer ve ark., 1990; Weiss, 1988;); Biri, ölçmenin keskinliğini/doğruluğunu (precision/accuracy of measurement) artırması, diğeri ise, daha kontrollü ve güvenli bir test ortamı sağlamasıdır. Bob test uygulaması, geleneksel testlerle karşılaştırıldığında, ölçme işleminin etkinliğini artırırken, psikometrik niteliklerinden de ödün vermez. Bu uygulama ile, test puanlarının, geleneksel uygulamada ulaştığı “plato” geçerlik düzeyini kırmak mümkündür. BOB testlerden elde edilen ölçme sonuçları, geleneksel testlerle karşılaştırıldığında, ölçme işi nispeten daha az madde ile başarılmaktadır. Uygulama, ölçme niteliklerinden herhangi bir kayıp vermeksizin, testin uzunluğunda %50 ile %80 arasında değişen bir ekonomi sağlanır (Grist ve ark., 1989; Kaptan, 1993; Olsen, Maynes, Slawson ve Ho, 1989;). BOB test ayrıca, tam öğrenme sınıflamalarında daha etkin ve daha doğru sonuçlar verir; bireysel değişimin ölçülmesinde etkin ve pratik bir yaklaşım sağlar (Weiss, 1988).

BOB test uygulamasının, ölçme keskinliğinde bir kayba uğramadan testi kısaltması avantajının yanında, başka bazı avantajları da vardır (Grist ve ark., 1989; Hambleton ve ark., 1991; Wainer ve ark., 1990). BOB test uygulaması;

1. Testlerin gizliliğini artırır.
2. Bireyleri istendiği anda test etme olanağı vardır.
3. Yanıt kağıdına gereksinim yoktur.
4. Test uygulama hızı bireye göre ayarlanmıştır.
5. Test sonuçlarının puanlanması ve yanıtlayıcıya hemen bildirilmesi mümkündür. Bu avantajın teşhis amaçlı testler için doğurgusu önemlidir.
6. Bazı cevaplayıcılar için testten sıkılma faktörünü minimize eder.
7. Daha geniş bir test standardizasyonu sağlar.
8. Madde bankasından (belirlendiği takdirde)“sorunlu (defektive) madde”lerin atılması kolaydır.
9. Madde türünü seçme konusunda daha fazla esneklik sağlar.
10. Test sürecini izleme süresinde azalma sağlar.

BOB test uygulamasının yukarıda sıralanan avantajları yanında bazı sınırlılıkları da vardır. Bunlar, bilgisayar ortamının yapaylığı, yanıtlama biçimi (bilgisayara aşina olma), BOB test uygulamasının MTK’ya dayalı çalışılması nedeniyle ölçülen özelliğin tek boyutluluk (unidimensionality) şartını karşılaması -bununla birlikte çok boyutlu BOB test uygulaması ile ilgili girişimler de vardır-, geniş bir madde havuzuna gereksinim duyulması (1000 veya daha fazla madde), bilgisayar ve özel bilgisayar programının getirdiği maliyet, büyük ölçekli test uygulamalarında daha kullanışlı olması sayılabilir (Grist ve ark., 1990; Kingsbury, 1997; Laurier, 1990).

BOB TEST Testlerdeki Uygulama Stratejileri

BOB test, maddelerin geniş bir havuzdan seçilerek bireye uygulanmasında farklı stratejiler kullanılır (Thorndike, 1982). Bu stratejiler aşağıda özetlenmiştir:

1 - Çok Düzeyli Uygulama (Multilevel Format): Bu stratejide, bireye uygulanacak başlangıç düzeyinin seçimi, yaş, sınıf veya önceki testte ya da sınıfta gösterdiği performansa göre seçilir. Bu stratejide alt testler kolaydan zora doğru dizilmiştir. Böylece, her düzeyde biraz daha güçleşerek devam eden 8 veya 10 alt test yanıtlanmış olur.
2 - İki Aşamalı Uygulama (Two stage testing): Bu stratejide test iki bölüme ayrılır. Başlangıç testi genellikle kısadır ve tüm cevaplayıcılar için aynıdır. İlk bölümdeki test, her yanıtlayıcının ikinci bölümde alacağı testi belirlemede kullanılır. İkinci bölümdeki test, çeşitli güçlük düzeylerinde alternatif formlar halinde hazırlanır. İlk testten alınan puan, yetenek kestirimi için bir temel sağlar; bireyin ölçülen özelliği hakkında en fazla bilgiyi verecek olan ikinci testin seçiminde kullanılır.
3 - Kendinden Seçimli Uygulama (Self-selecting testing): İki aşamalı uygulamada, ilk aşamada alınan testin puanlanmasında yaşanan mantıksal sorunlar ve cevaplayıcıları ikinci aşamada alacakları teste tam yönlendirememesi yüzünden, bu strateji önerilmiştir. Buna göre, test maddeleri güçlüklerine göre sıralanır, birey kendi yaş veya sınıf düzeyindeki ortalama güçlükte bir madde ile yanıtlamaya başlar. O maddeyi doğru yanıtlarsa daha zor bir maddeye, yanlış yanırlarsa daha kolay bir maddeye geçilir. Uygulama bireyin yeteneği hakkında yeterli bilgi edininceye kadar sürer.
4 - Değişimlemeli Uygulama (Alternating Testing): Bu uygulamada maddeler iki kol (< ) halinde düzenlenmiştir. Kollardan birinde kolay maddeler, diğerinde zor maddeler dizilmiştir. Uygulama orta güçlükte bir madde ile başlar. Bu madde doğru yanıtlanırsa, zor madde koluna geçilir. Doğru yanıtlandığı sürece uygulama bu kolda sürdürülür. Yanlış yanıtlanırsa, kolay kola geçilir. Uygulama belirlenen sayıda madde uygulanıncaya kadar sürer.
5 - Piramitsel Çok Aşamalı Uygulama (Pyramidal Multistage Testing): Bu uygulama bir piramit düzenine benzer. Tepedeki maddeleri doğru yanıtlayanlar ikinci basamaktaki zor maddeyi, yanlış yanıtlayanlar ise, kolay maddeyi yanıtlar. Bu biçimde beş madde yanıtlanan beş basamaklı düzenleme için 15; 10 basamaklı için 55 madde gerekir.
6 - Tabakalı Uygulama (Stradaptive Testing): Maddeler kendi içinde güçlükleri bakımından homojen, kendi aralarında değişen güçlüklerdeki tabakalardan oluşur. Uygulama, bireye uygun olan ilk maddeyle başlar, doğru yanıtlarsa daha zor tabakanın ilk maddesine geçilir. Maddeler, bu tabakalar içinde en çok ayırıcı olandan en az ayırıcı olana doğru sıralanmıştır. Uygulama, iki, üç tabaka arasında gidiş-gelişlerle tamamlanır.

BOB Test Uygulaması ve Madde Tepki Kuramı (Item Response Theory)

MTK modelleri, özellikle BOB test uygulaması için uygundur. Çünkü MTK yeteneği, yanıtlayıcıya uygulanan madde örnekleminden, madde parametrelerini de testi alan yanıtlayıcı grubunun yetenek düzeyinden bağımsız olarak kestirmektedir (Bock, 1997; Crocker ve Algina, 1986; Hambleton ve Swaminathan, 1985; Hambleton, Swaminathan ve Rogers, 1991; Kingsbury, Gags ve Houser, 1993; Kline, 1986; Lord ve Stocking, 1988). Bir başka deyişle, MTK modelleri klasik test kuramının tersine, varsayımları karşılandığı taktirde, değişmez (invariance) madde ve yetenek parametreleri verir. Bütün MTK modellerinde ortak varsayım, madde performansında tek bir faktörün, tek yeteneğin sorumlu olmasıdır. Bu varsayım hemen bütün BOB test uygulamalarında sözkonusudur. Her yanıtlayıcı, güçlükleri bakımından farklı maddeleri alsalar bile, MTK farklı yanıtlayıcıların yetenek kestirimlerinin karşılaştırılması için değişmez bir çerçeve sağlar. MTK modelleri içinde, BOB test için en uygun model 3 parametreli lojistik (3PL) modeldir. Bu modelin seçilme nedeni, modelin çoktan seçmeli maddelerle, 2 ve 3 parametreli testlere göre daha iyi uyum (fit) vermesidir. Başarılı bir BOB test uygulaması, yeterince geniş, madde ayırıcılık güçleri yüksek (a değerleri > 1 olan maddeler), şans parametresi küçük (c değerleri < 0.20 olan maddeler) bir madde havuzu olduğunda elde edilmektedir (Wainer ve ark., 1990). Madde bilgi (item information index) fonksiyonu, BOB TEST uygulamasında bireyin yeteneğine en iyi hitap eden güçlük düzeyine sahip maddeyi seçmede kullanılır. BOB test uygulamasındaki madde seçiminde Maximum Likelihood ve Bayesian stratejileri yaygın olarak kullanılmaktadır. Bu stratejiler, sonraki maddenin seçiminde matematiksel bir işlem kullanarak çalışır. Temel amaç, öğrencinin uygulama sırasında hesaplanan yetenek kestiriminde en fazla bilgiyi veren maddeyi seçmek ve bireyin maddeyi yanıtlamasından sonra hesaplanan yetenek kestirimindeki dağılımın varyansını minimize etmektir.

Gelecekte BOB Test Uygulaması ve Beklentiler

BOB test uygulaması, psikometri alanında giderek daha çok çalışılan bir alan haline gelmektedir. Özellikle ABD’de büyük ölçekli test programlarında, örneğin “Askeri Hizmetler Mesleki Yetenek Bataryası”(Armed Services Vocational Aptitude Battery), “Mezuniyet Sonrası Giriş Sınavı” (Graduate Record Examination) ve TOEFL, BOB test olarak uygulanmaktadır (Bock, 1997). Angoff (1988), Amerikan Psikoloji Birliği’nin düzenlediği sempozyumlarda sunulmuş bildirileri gözden geçirerek, seçtiği dört bildiri üzerinden psikometride geleceğe dönük yönelimleri belirlemiştir. Buna göre, genel zeka yapısı, madde yanlılığı ve seçme, kesme puanları, eşitleme (equating), BOB test ile bireysel ve grup olarak başarının ölçülmesi başlığı altında toplanan konuları gelecekte de çalışılacak konular olarak belirlemiştir. Günümüzde ise, BOB test araştırmaları şu konular üzerinde yoğunlaşmıştır; MTK modelinin seçimi, madde bankası, testin başlangıç noktasının seçimi, sonraki test maddelerinin seçimi, puanlama/yetenek kestirimi ve test uygulamasını sonlandırmada karar vermede kullanılacak yöntemin seçimi (Hambleton ve ark., 1991).

Zara (1997 s.11), 1970’lerden beri BOB test uygulamasındaki gelişmelerin, bu konunun test alanında gerçekçi bir seçenek olmasını sağladığını belirtmiştir. Zara, yapılacak BOB test uygulamalarında ve araştırmalarında yanıtlanması gereken 27 kritik soru sormuştur. Bu sorular, BOB test uygulamasının yapılacağı fiziksel ortamın özellikleri ve güvenliği ile ilgili sorunlardan başlayıp, uygulama için gözetmene gereksinim duyulup duyulmadığı; BOB testleri ile kağıt kalem testlerinden elde edilen puanların karşılaştırılabilirliği; BOB test uygulamasında sonlandırma ölçütünün ne olacağına dek uzanan bir dizi kritik sorudur. Sonuç olarak, Zara, BOB test uygulaması ile ilgili yeni araştırmalara gereksinim duyulduğunu, alanın hala kısır olduğunu, yapılacak yeni araştırmaların güncel test uygulamaları için önemli doğurguları olabileceğini belirtmiştir.

Bunun yanında Wise (1997) makalesinde, BOB test uygulayıcılarının gözönüne almaları gereken beş konuyu tanımlayarak tartışmıştır. Bu konular, yanıtlayıcıların yanıtladıkları maddeleri gözden geçirme (item reviewing) ve yanıtlanmış maddelere geriye dönüp bakma olanağının verilmemesi, sabit sorulu BOB test uygulamalarında her yanıtlayıcıya eşit sürenin verilmesi, test kaygısı, yanıtlayıcı güdüsü ve bilgisayar kullanma olanaklarındaki eşitliktir. Wise, bu konulara ilişkin yapılmış araştırma bulgularını da gözönüne alarak, önerilerini sıralamıştır. Özetle, madde gözden geçirme ve süre sınırlamasının yanıtlayıcıların BOB testlerindeki performansını düşük oranda etkilediğini, ancak azınlık gruplarında bu oranın bu kadar önemsiz olmadığını belirtmiştir. Wise, sözü edilen faktörlerin BOB test uygulama sürecindeki etkilerinin çalışılıp, test uygulamasında birey için önemli olan psikolojik dinamiklerin daha iyi tanınması gerektiğini belirtmiştir.

Çoğu BOB test, yetenek ve başarıyı ölçmek üzere düzenlenmiştir. Bunun yanında kişilik özelliklerini ve tutumsal değişkenleri ölçmek üzere geliştirilen BOB test uygulama girişimleri de vardır (Weiss, 1988; Koch ve ark., 1990).

Sonuç olarak, BOB test geliştirme ve uygulama konusu, batıda üzerinde yapılan araştırmaların arttığı, çeşitlendiği bir alan olurken, ülkemizde bu konunun akademik düzeyde ele alınması oldukça yeni ve sınırlı düzeydedir. Ülkemizde bu konuda, halen başlayıp yürütülmekte olan bir iki araştırma dışında, tamamlanmış iki doktora tezinden (Köklü, 1990; Kaptan, 1993) başka araştırma yoktur. Çeşitli okul, program ve işe başvurularda geniş ölçekli test uygulamalarından (özellikle ÖSYM tarafından yapılan) elde edilen verilerin BOB test olarak çalışılması, denenmesi ülkemizdeki merkezi sınav uygulamalarında yaşanan önemli sorunların çözümüne katkı getirebilecek; diğer taraftan da Türk psikometri literatürünü bu alanda zenginleştirecektir.

KAYNAKLAR

Bejar, Isaac I., (1983). Achievement testing: recent advances . London: Sage Publications Ltd.
Hambleton, R.K. ve Swaminathan, H. (1985). Item response theory: principles and applications. (2nd. Eds.) Boston: Kluwer-Nijhoff Publishing.
Bock, R.Darrell (1997). A brief history of item response theory. Educational Measurement: issues and practice .16(4) pp.21-32.
Crocker, Linda & Algina, James (1986). Introduction classical and modern test theory. New York: CBS College Publishing.
Hambleton Ronald K., Swaminathan, H. & Rogers, H. Jane (1991). Fundamentals of item response theory. California: Sage Publications, Inc.
Hambleton, Ronald K. & Swaminathan, H. (1985). Item response theory: principles and applications. Boston: Kluwer-Nijhoff Publishing.
Kaptan, Fitnat (1993). Yetenek kestiriminde adaptive (bireyselleştirilmiş) test uygulaması ile geleneksel kağıt-kalem testi uygulamasının karşılaştırılması. Hacettepe Üniversitesi, Ankara.
Kingsbury, Gage G. (1997). Some questions that must be addressed to develop and maintain an item pool for use in an adaptive test. A paper presented to the annual meeting of the National Council on Measurement in education, Chicago, IL.
Kingsbury, G.G. & Houser, Ronald L. (1993). Assessing the utility item response models: computerized adaptive testing. Educational Measurement:Issues and Practice. 12(1). Pp. 21-27.
Grist, Susan & others. (1989). Computerized Adaptive Tests. (ERIC Document reproduction service no. ED 315425).
Kline, Paul. (1986). A handbook of test construction: introduction to psychometric design. London: Methuen & Co.Ltd.
Koch, William R. & others (1990). Computerized adaptive measurements of attitudes. Measurement end Evaluation in Counseling and Development. 23(1). Pp. 20-30. Apr.
Köklü, Nilgün (1990). Klasik test teorisine göre geliştirilen tailored test ile grup testi arasında bir karşılaştırma. Hacettepe Üniversitesi, Ankara.
Lord, F.M.& Stocking, M.L. (1988). Item response theory. In J.P. Keeves (ed.), Educational Research, methodology, and measurement: an international handbook (pp. 269-272). New York: Pergamon press.
Olsen, J.B., Maynes,D.D., Slawson, D. & Ho, Kevin. (1989). Comparison of paper administered, computer administered and computerized adaptive achievement tests. Journal of Educational Computing Research. 5(3). 311-326.
Wainer, H., Dorans, N.J., Flaugher, R., Green, B.F., Mislevy, R.J. Steinberg & Thissen, D. (1990). Computerized adaptive testing: a primer. New Jersey: Lawrence Erlbaum Associates, Publishers.
Weiss, David J. (1983). Latent trait theory and adaptive testing. In David J.Weiss (ed.), New horizons in testing (pp. 5-7). New York: Academic Press.
Weiss, David J. (1988). Adaptive testing. In John P.Keeves (ed.), Educational Research, methodology, and measurement: an international handbook (pp.372-375). New York: Pergamon press.
Wise, Stewen L. (1997). Examinee issues in CAT. A paper presented at the 1997 annual meeting of the National Council on Measurement in Education, Chicago, IL.
Thorndike, Ronald L. (1982). Applied psychometrics. Boston: Houghton-Mifflin Co.
Zara, Anthony R (1997). Administering and scoring the computerized adaptive test. A paper presented at a symposium: Implementation issues in computerized adaptive testing: theory meets reality, at the annual meeting of the National Council on Measurement in Education, Chicago, IL.

Kaynak: www.psikolog.org.trCevap ekle