Veri Madenciliği Deneme Sınavı -3 2024-2025 Final Çıkmış Soruları

📌 Sınav Öncesi Kısa BilgiDeğerli AUZEF bölümü öğrencileri; bu sayfada Veri Madenciliği Deneme Sınavı -3 2024-2025 Final Çıkmış Soruları dersine ait geçmiş yıllarda çıkmış soruları ve pratik deneme testlerini sizin için bir araya getirdik. Sınavda zamanı iyi yönetmek ve soru tiplerine tam olarak aşina olmak için aşağıdaki özel test motorumuzu kullanabilirsiniz. İster "Çalışma Modu" ile anında cevapları görün, ister "Sınav Modu" ile kendinizi zamana karşı test edin. Şimdiden sınavlarınızda başarılar dileriz!
Soru bulunamadı.
Bir birliktelik kuralının desteği nedir?
A) Bir kuralın ne sıklıkta uygulandığını
B) X’i içeren işlemlerde X ve Y ögelerinin ne sıklıkta göründüğünü
*C) X ve Y ögelerini içeren işlemlerin ne sıklıkta göründüğünü
D) Bir öge setini içeren işlem sayısı
E) Veri setindeki işlem genişliği

Aşağıdaki yöntemlerden hangileri özellik oluşturma (feature creation) için kullanılabilir? – I. Öznitelik oluşturma – II. Veriyi yeni bir uzaya eşleme – III. Öznitelik inşası
A) I-II
B) II-III
*D) I-II-III
E) Yalnız I

Hangi lojistik regresyon türü, “Kırmızı/Yeşil/Mavi” gibi sıralı kategorilere sahip bir yanıt değişkeni için kullanılır?
A) Binomial Lojistik Regresyon
*B) Multinomial Lojistik Regresyon
C) Ordinal Lojistik Regresyon
D) Çoklu Değişkenli Lojistik Regresyon
E) Hiçbiri, sıralı kategorilere uygun bir regresyon türü yok

Aday öge kümesi sayısını azaltma ve karşılaştırmaların sayısını azaltma işlemleri hangi amaç için yapılır?< A) Gereksiz kuralları kesmek B) Yüksek güvenli kurallar oluşturmak C) Alt küme oluşturmak D) Kurallar oluşturmak *E) Sık öge kümelerini oluşturmak Lojistik regresyonun doğrusal regresyondan farkı nedir? *A) Olasılık tahminlerini sağlaması B) Kategorik değişkenlerin modellemesine uygun olmaması C) Doğrusal fonksiyonlar kullanmaması D) Lojistik ve taşıma alanında uygulanması E) Doğrusal terimlerin eksik olması Aşağıdaki ifadelerin hangileri yanlıştır? – I. Veri madenciliğinde hipotez testleri, elde edilen veri örüntülerinin istatistiksel olarak anlamlı olup olmadığını değerlendirir. – II. Hipotez testleri, değişkenler arasındaki ilişkilerin istatistiksel anlamlılığını değerlendirmek için kullanılabilir. – III. Hipotez testleri, veri madenciliğinde kullanılan algoritmaların doğruluğunu belirlemek için kullanılır. A) I-II-III B) Hepsi doğru *C) Yalnız III D) I-II E) II-III Aşağıdakilerden hangisi birleştirme (aggregation) işleminin bir riskidir? A) Veri kaynaklarının karmaşıklığının artması B) Ölçeklerin değişmesi *C) Detaylardan bazılarının kaybolması D) Veri boyutlarının artması E) Hiçbiri Destek tabanlı kesme neden önemlidir? A) Tüm kuralları eler B) Güveni artırır C) Alt küme oluşturur D) Kural kümesini bulur *E) Sık öge kümesini bulur Apriori prensibine göre, bir sık öge kümesinin alt kümeleri hakkında hangisi doğrudur? A) Alt kümelerin hiçbiri sık olamaz B) Sadece bir alt küme sık olabilir *C) Tüm alt kümeler sık olabilir D) Yalnızca en büyük alt küme sık olabilir E) Hiçbir alt küme sık olamaz Kategorik bir özniteliğin ikili hale getirilmesinde aşağıdakilerden hangileri yanlıştır? – I. Veri özelliği sıralı ise, atama yaparken sıralamayı korumak gerekir – II. Kategorik değerleri ikili formata dönüştürürken 0 ve 1’leri istenilen şekilde atanabilir – III. Kategori sayısı kadar sütun oluşturmak gerekir A) I-II B) II-III C) Yalnız II *D) Yalnız III E) Hiçbiri A firması tarafından üretilen ampullerden 80 adet seçilmiş ve ortalama 1258 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 94 saattir. B firması tarafından üretilen ampullerden 60 adet seçilmiş ve ortalama 1029 saat çalıştığı görülmüştür. Ana kütleye ait standart sapma 68 saattir. A firmasının ampul fiyatı daha fazla olduğu için bir test yapılacaktır. A firması tarafından üretilen ampullerin çalışma süresi, B firması tarafından üretilen ampullerin çalışma süresinden 200 saat fazlaysa, A firmasının ampulleri satın alınacaktır. ???????? = 0.011 için hangi firmanın ampullerinin satın alınacağını test ediniz. – Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır? A) 2,58 *B) 2,12 C) 1,96 D) 3,02 E) 2,33 Lojistik regresyonda, çıktı değişkeni 0 ile 1 arasında olan olasılık değerini ifade eder. Eğer bir modelin hesapladığı olasılık değeri 0.7 ise, bu durum neyi öngörür? *A) Eşik değerin üzerinde olduğu için olayın gerçekleşme olasılığının yüksek olduğunu öngörür B) Olayın hiç gerçekleşmeyeceğini öngörür C) Modelin yanlış olduğunu gösterir D) Modelin kararsız olduğunu gösterir E) Eşik değerin altında olduğu için olayın gerçekleşme olasılığının düşük olduğunu öngörür Hangi durumda Basit Fonksiyonel Dönüşümler veya Normalizasyon kullanılabilir? A) Veri setindeki değişkenlerin sayısını artırmak için B) Veri setindeki değişkenlerin değerlerini bozmak için *C) Veri setinin analizde daha anlamlı ve doğrusal bir şekle getirilmesi için D) Veri setindeki değişkenlerin orijinal dağılımını korumak için E) Veri setindeki değişkenlerin arasındaki ilişkiyi kesmek için Boyut azaltmanın avantajlarından hangisi doğrudur? A) Model performansını azaltır *B) Veri işleme sürelerini kısaltır C) Depolama alanı gereksinimlerini artırır D) Gürültüyü artırır E) Veri manipülasyonunu zorlaştırır Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. – Yukarıdaki örnekte hangi test istatistiği kullanılmalıdır? A) Z-testi *B) T-testi C) G testi D) Ki-kare E) F testi Olasılıklar oranı neyi ifade eder? A) Bir olayın gerçekleşmeme olasılığının gerçekleşme olasılığına oranı B) Bir olayın gerçekleşme olasılığı C) Tahmin edicideki bir birim değişiklikten sonraki olasılıkların orijinal olasılıklara oranı *D) Bir olayın gerçekleşme olasılığının gerçekleşmeme olasılığına oranı E) İki bağımsız değişkenin gerçekleşme olasılıklarının oranı Yaşlı ve genç yetişkinler arasındaki algılanan yaşam doyumunun farklarını incelemek amacıyla bir araştırma yapılmıştır. 10 kişilik iki gruptan oluşan, 70 yaş üstü yaşlı yetişkinlere ve 20 – 30 yaş arası genç yetişkinlere yüksek güvenilirlik ve geçerliliği olduğu bilinen bir yaşam memnuniyeti testi verilmiştir. Ölçüm puanları 0 (en düşük) – 60 (en yüksek) arasındadır. Yaşlı yetişkinlerin verdiği puanların ortalaması 44.5 ve varyansı 75.39 iken genç yetişkinlerin verdiği puanların ortalaması 28.1 ve varyansı 72.99 olarak hesaplanmıştır. Yaşlı ve genç yetişkinler arasındaki ortalama yaşam memnuniyetinin farklı olduğu iddiasını %5 anlam düzeyinde test ediniz ve yorumlayınız. – Yukarıdaki örneğe göre kritik test istatistiği değeri kaçtır? A) 3,91 B) 3,59 C) 4,26 D) 3,02 *E) 2,23 I = {a, b, c, d, e} kümesinden oluşturulan {a, b} → {d} kuralı düşük güven oranlı bir kuralsa aşağıdaki kurallardan hangisi düşük oranlı bir kuraldır? *A) {b} → {c} B) {a} → {b} C) {d} → {b} D) {c} → {e} E) {b} → {e} Belli bir parçanın üretimi için gereken ortalama zamanın 11.5 dakika olduğu biliniyor. İşe alınan 10 işçinin bu mamulü üretim süreleri gözlemleniyor ve aşağıdaki sonuçlar elde ediliyor. %5 anlam düzeyinde yeni işe alınan işçilerin bu mamulü üretim süresinin eski işçilerden daha fazla olup olmadığını araştırınız. (İpucu: Bu soru için toplanan verilerin kendisi verilmiştir. Daha önceki örneklerde ve sorularda toplanan verilerden elde edilen ortalamalar veya standart sapmalar verilmişti.) – Yukarıdaki örneğe göre hesaplanan test istatistiği değeri kaçtır? A) 2,91 B) 3,19 C) 2,26 D) 1,83 *E) 2,06 Lojistik regresyonda en uygun eğriyi bulmak için hangi yöntem kullanılır? A) Ortalama Kareler Hatası B) R-Kare C) En Küçük Kareler Yöntemi *D) En Olası Tahmin Yöntemi E) Doğrusal Dönüşüm [/auzef_test]