Yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce test kusurlu çıktı

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

04.11.2025 - 15:25 Yayınlanma

1 Dk Okunma Süresi

Yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce test kusurlu çıktı

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 araştırmacı, "Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği" başlıklı bir çalışma yaptı.

Bilim insanları çalışmada, yapay zekanın alt dallarından olan "doğal dil işleme" ve "makine öğrenimi" alanlarının önde gelen konferanslarından alınan 445 değerlendirme testini sistematik olarak inceledi.

İncelemeler sonucunda, testlerin neredeyse hepsinin "sonuçların geçerliliğini zedeleyebilecek" kusurlara sahip olduğu sonucuna ulaşıldı.

Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ilişkin Guardian'a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.

NASA, ilk kez Bennu asteroitinde glikoz izleri buldu

İçeriği Görüntüle

Bean, değerlendirme testlerinin yapay zekayla ilgili tüm iddiaların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğini anlamanın zorlaştığını kaydetti.

Muhabir: Nusret Odabaş

Editörün Seçtiği

Kadıköy Rıhtım Camisi'nin yapımına başladı

Editörün Seçtiği

BMW yaklaşık 8 bin kişiyi işten çıkaracak

Editörün Seçtiği

Rusya’nın Ermenistan’a yönelik “ticari baskısı” artıyor

Muhabir

Nusret Odabaş

Yorumlar

Trend Haberler

Bakırköy Cumhuriyet Başsavcılığı'ndan yeni nesil suç örgütlerine operasyon: 50 şüpheli hakkında gözaltı kararı

İzmir merkezli yasa dışı bahis operasyonunda 34 gözaltı: Yaklaşık 2 Milyar liralık para trafiği tespit edildi

İzmit Belediyesi'ne operasyon! Başkan Fatma Kaplan Hürriyet ve eşi gözaltına alındı

Oğuzhan Uğur’un ifadesi ilk kez Diriliş Postası'nda!

Rusya Başbakan Yardımcısı Novak, Rusya-Türkiye enerji ortaklığının stratejik nitelikte olduğunu belirtti

Ahbap soruşturmasında ifadeler birbirine girdi: Dokuz şüphelinin ifadelerinden ortaya çıkan tablo şok etti

Ankara'da bir kişinin 2 milyon lirasını gasp eden şüpheliler Kırıkkale'de yakalandı

DMM, "DOA uygulamasında vatandaşlara ödenen iade tutarlarının düşürüldüğü" iddiasını yalanladı

Tutuklanan CHP Silivri İlçe Başkanı Bulut'un hesabında milyonluk para trafiğine: Patron talimat verdi, ben gönderdim

Husiler: Suudi Arabistan'ın Aramco tesislerini hedef aldık

Süper Lig Puan Durumu

Süper Lig

#	Takım	O	P
1	Galatasaray	34	77
2	Fenerbahçe	34	74
3	Trabzonspor	34	69
4	Beşiktaş	34	60
5	Başakşehir	34	57
6	Göztepe	34	55
7	Samsunspor	34	51
8	Rizespor	34	41
9	Konyaspor	34	40
10	Kocaelispor	34	37

Detaylar için tıklayın

Süper Lig Fikstür

15 Mayıs, Cuma
Rizespor - Beşiktaş
2-2

16 Mayıs, Cumartesi
Fatih Karagümrük - Alanyaspor
2-1
Gaziantep FK - Başakşehir
1-2
Samsunspor - Göztepe
3-0

17 Mayıs, Pazar
Kayserispor - Konyaspor
2-1
Fenerbahçe - Eyüpspor
3-3
Trabzonspor - Gençlerbirliği S.K.
0-3
Kasımpaşa - Galatasaray
1-0
Antalyaspor - Kocaelispor
1-0

Yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce test kusurlu çıktı

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

WSJ: ABD'de eyalet başsavcıları yapay zeka şirketi OpenAI hakkında soruşturma başlattı

Bakan Bak: 100 bin yapay zeka girişimcisi yetiştirmeyi hedefliyoruz

Türkiye dünya tarihinde hibrit motoru uzayda ateşleyen ilk ülke

NASA, ilk kez Bennu asteroitinde glikoz izleri buldu

Haberleri izinsiz kullanan yapay zekaya tazminat davası

Bennu asteroidinde yaşamın yapı taşlarından triptofan kanıtı bulundu

Trend Haberler