| Dersin Amacı: |
Bu dersin amacı, veri madenciliği (data mining) ve bilgi keşfi (KDD) süreçlerini uçtan uca ele alarak öğrencilerin; problem tanımı, veri anlama-hazırlama, modelleme, değerlendirme ve sonuçların raporlanması/uygulamaya alınması adımlarını sistematik biçimde yürütebilmesini sağlamaktır. Ders kapsamında öğrencilerin sınıflandırma, kümeleme, birliktelik kuralı madenciliği ve anomali tespiti gibi temel veri madenciliği görevlerini gerçek veri setleri üzerinde uygulayarak, doğru metriklerle değerlendirmesi ve genellenebilir sonuçlar üretmesi hedeflenir. |
| Dersin İçeriği: |
Veri madenciliğine giriş; KDD ve CRISP-DM süreç modeli; veri toplama, veri kalitesi ve ön-işleme (eksik veri, aykırı değer, ölçekleme, kodlama); özellik çıkarımı/seçimi ve boyut indirgeme; sınıflandırma (karar ağaçları, k-NN, Naive Bayes vb.); model değerlendirme (hold-out, çapraz doğrulama, metrikler); kümeleme (k-means, hiyerarşik yöntemler vb.); birliktelik kuralları ve Apriori; anomali/aykırılık tespiti; (opsiyonel) metin/zaman serisi/ağ verisi gibi karmaşık veri tiplerine giriş; Python ile uygulamalar ve raporlama. |
| Hafta |
Konu |
Ön Hazırlık |
| 1) |
Veri madenciliğine giriş; KDD ve CRISP-DM; problem tanımı ve başarı kriterleri |
ders notu |
| 2) |
Veri anlama (EDA), veri kalitesi; veri türleri ve örnekleme |
ders notu |
| 3) |
Ön-işleme I: eksik veri, aykırı değer, ölçekleme ve dönüşümler |
ders notu |
| 4) |
Ön-işleme II: özellik çıkarımı/seçimi; boyut indirgeme (PCA vb.) |
ders notu |
| 5) |
Sınıflandırma I: karar ağaçları, Naive Bayes, k-NN; temel sezgi
|
ders notu |
| 6) |
Model değerlendirme: train/test, çapraz doğrulama; metrikler (accuracy, F1, ROC-AUC vb.)
|
ders notu |
| 7) |
Pipeline ve veri sızıntısı; deney tasarımı mantığı; hiperparametre ayarına hazırlık |
ders notu |
| 8) |
Vize Sınavı |
|
| 9) |
Sınıflandırma II: ansambl yaklaşımlar (bagging/boosting – giriş), model karşılaştırma
|
ders notu |
| 10) |
Kümeleme I: k-means; küme sayısı seçimi; iç ölçütler (silhouette vb.)
|
ders notu |
| 11) |
Kümeleme II: hiyerarşik yöntemler ve/veya DBSCAN (giriş); kümeleri yorumlama
|
ders notu |
| 12) |
Birliktelik kuralları: frequent pattern mining; Apriori; support-confidence-lift
|
ders notu |
| 13) |
Aykırılık/anomali tespiti; değerlendirme ve kullanım senaryoları |
ders notu |
| 14) |
Uygulamalı atölye I: CRISP-DM’e göre mini vaka (veri hazırlama → modelleme → değerlendirme)
|
ders notu |
| 15) |
Uygulamalı atölye II: sonuçların raporlanması, görselleştirme, bulgu tartışması; genel tekrar
|
ders notu |
| 16) |
Final Sınavı |
|
| |
Dersin Program Kazanımlarına Etkisi |
Katkı Payı |
| 1) |
Veri analitiği süreçlerinde istatistik, olasılık, veri yönetimi ve makine öğrenmesi arasındaki ilişkiyi açıklar. |
|
| 1) |
Veri bilimi ve yapay zekâ alanında kullanılan temel kavramları, yöntemleri ve algoritmaları açıklar. |
|
| 1) |
Güncel veri teknolojileri, bulut altyapıları ve büyük veri ekosistemleri hakkında bilgi sahibidir. |
|
| 2) |
Python, SQL ve benzeri programlama dillerini kullanarak veri analizi ve modelleme projeleri geliştirir. |
|
| 2) |
Veri toplama, temizleme, dönüştürme ve görselleştirme süreçlerini etkin biçimde yürütür. |
|
| 2) |
Model performansını değerlendirir, metrikler üzerinden kıyaslama yapar ve model iyileştirme stratejileri geliştirir. |
|
| 2) |
Gerçek veri kümelerini analiz eder, uygun istatistiksel ve makine öğrenmesi modellerini seçer ve uygular. |
|
| 3) |
Alanındaki gelişmeleri izleyebilecek düzeyde İngilizce dil yeterliliğine sahiptir. |
|
| 3) |
Teknik sonuçları, teknik olmayan paydaşlara açık ve etkili biçimde aktarır. |
|
| 3) |
Farklı disiplinlerden profesyonellerle etkin biçimde iş birliği yürütür. |
|
| 4) |
Akademik literatürü eleştirel biçimde inceleyip uygulamalı projelere aktarır. |
|
| 4) |
Veri bilimi alanındaki yeni teknolojileri, araçları ve yöntemleri sürekli takip eder ve kendini günceller. |
|
| 5) |
Akademik veya sektörel araştırmalarda bilimsel yöntem ve etik değerlere uygun çalışır. |
|
| 5) |
Veri gizliliği, güvenliği ve etik ilkelerine uygun analiz ve modelleme süreçleri yürütür. |
|
| 5) |
Kurumsal karar süreçlerini destekleyen veri tabanlı raporlar, panolar ve öngörü sistemleri geliştirir. |
|
| 6) |
Gerçek dünyadaki veri odaklı projelerde zaman, kaynak ve kalite yönetimi sorumluluğu alır. |
|
| 6) |
Karmaşık veri problemlerine yönelik çözümleri bireysel veya ekip çalışması içinde geliştirir. |
|