UVB565 Veri Madenciliği ve UygulamalarıKurumsal BilgilerAkademik Programlar Uygulamalı Veri Bilimi (Tezsiz)Öğrenciler İçin Bilgiler
Uygulamalı Veri Bilimi (Tezsiz)
Yüksek Lisans TYYÇ: 7. Düzey QF-EHEA: 2. Düzey EQF-LLL: 7. Düzey

Ders Genel Tanıtım Bilgileri

Ders Kodu: UVB565
Ders İsmi: Veri Madenciliği ve Uygulamaları
Ders Yarıyılı: Güz
Ders Kredileri:
Teorik Pratik Kredi AKTS
3 0 3 8
Öğretim Dili: TR
Ders Koşulu:
Ders İş Deneyimini Gerektiriyor mu?: Hayır
Dersin Türü: Alan Seçmeli
Dersin Seviyesi:
Yüksek Lisans TYYÇ:7. Düzey QF-EHEA:2. Düzey EQF-LLL:7. Düzey
Dersin Veriliş Şekli: Yüz yüze
Dersin Koordinatörü: Dr.Öğr.Üyesi Bilge SERDARER KUZU
Dersi Veren(ler):
Dersin Yardımcıları:

Dersin Amaç ve İçeriği

Dersin Amacı: Bu dersin amacı, veri madenciliği (data mining) ve bilgi keşfi (KDD) süreçlerini uçtan uca ele alarak öğrencilerin; problem tanımı, veri anlama-hazırlama, modelleme, değerlendirme ve sonuçların raporlanması/uygulamaya alınması adımlarını sistematik biçimde yürütebilmesini sağlamaktır. Ders kapsamında öğrencilerin sınıflandırma, kümeleme, birliktelik kuralı madenciliği ve anomali tespiti gibi temel veri madenciliği görevlerini gerçek veri setleri üzerinde uygulayarak, doğru metriklerle değerlendirmesi ve genellenebilir sonuçlar üretmesi hedeflenir.
Dersin İçeriği: Veri madenciliğine giriş; KDD ve CRISP-DM süreç modeli; veri toplama, veri kalitesi ve ön-işleme (eksik veri, aykırı değer, ölçekleme, kodlama); özellik çıkarımı/seçimi ve boyut indirgeme; sınıflandırma (karar ağaçları, k-NN, Naive Bayes vb.); model değerlendirme (hold-out, çapraz doğrulama, metrikler); kümeleme (k-means, hiyerarşik yöntemler vb.); birliktelik kuralları ve Apriori; anomali/aykırılık tespiti; (opsiyonel) metin/zaman serisi/ağ verisi gibi karmaşık veri tiplerine giriş; Python ile uygulamalar ve raporlama.

Öğrenme Kazanımları

Bu dersi başarıyla tamamlayabilen öğrenciler;
Öğrenme Kazanımları
1 - Bilgi
Kuramsal - Olgusal
1) Veri madenciliği/KDD sürecinin temel aşamalarını ve CRISP-DM yaklaşımını (iş hedefi → veri anlama → veri hazırlama → modelleme → değerlendirme → yaygınlaştırma) açıklar.
2) Sınıflandırma, kümeleme, birliktelik kuralı madenciliği ve aykırılık/anomali tespiti problemlerinin kavramsal çerçevesini ve temel algoritma ailelerini açıklar.
2 - Beceriler
Bilişsel - Uygulamalı
1) Veri ön-işleme adımlarını (eksik veri, aykırı değer, ölçekleme, kodlama) uygular; özellik seçimi/indirgeme ile modellemeye hazır veri seti oluşturur.
2) Uygun değerlendirme stratejisi (hold-out/çapraz doğrulama) ve metrikleri seçerek modelleri karşılaştırır; Pipeline ile veri sızıntısını önleyen iş akışı kurar.
3 - Yetkinlikler
İletişim ve Sosyal Yetkinlik
1) Veri madenciliği bulgularını (metrikler, örüntüler, kurallar) görselleştirmelerle destekleyerek teknik rapor ve sunum formatında açık biçimde paylaşır.
2) Ekip çalışmasında veri hazırlama-modelleme-değerlendirme görevlerini koordine ederek ortak çıktı üretimine etkin katkı sağlar.
Öğrenme Yetkinliği
1) Yeni bir veri madenciliği tekniğini/algoritmasını kaynaklardan öğrenerek (kitap/dokümantasyon) uygun problemde uygular ve sonuçlarını değerlendirir.
2) Deney sonuçlarına göre (hata analizi/varsayım/parametre) model geliştirme stratejisini sistematik biçimde günceller.
Alana Özgü Yetkinlik
1) CRISP-DM fazlarına uygun biçimde bir veri madenciliği problemi için uçtan uca çözüm tasarlar; iş hedeflerini ölçülebilir başarı kriterlerine dönüştürür.
2) Birliktelik kuralları ve örüntü madenciliği çıktılarının (support, confidence, lift) karar verme süreçlerindeki anlamını yorumlar.
Bağımsız Çalışabilme ve Sorumluluk Alabilme Yetkinliği
1) Bir veri madenciliği çalışmasını bağımsız planlar, yürütür ve tekrarlanabilir biçimde (kod, parametreler, veri işleme adımları) teslim eder.
2) Modelin sınırlılıklarını, veri kalitesi risklerini ve etik/mahremiyet boyutlarını raporlayarak sorumlu kullanım için öneriler geliştirir.

Ders Akış Planı

Hafta Konu Ön Hazırlık
1) Veri madenciliğine giriş; KDD ve CRISP-DM; problem tanımı ve başarı kriterleri ders notu
2) Veri anlama (EDA), veri kalitesi; veri türleri ve örnekleme ders notu
3) Ön-işleme I: eksik veri, aykırı değer, ölçekleme ve dönüşümler ders notu
4) Ön-işleme II: özellik çıkarımı/seçimi; boyut indirgeme (PCA vb.) ders notu
5) Sınıflandırma I: karar ağaçları, Naive Bayes, k-NN; temel sezgi ders notu
6) Model değerlendirme: train/test, çapraz doğrulama; metrikler (accuracy, F1, ROC-AUC vb.) ders notu
7) Pipeline ve veri sızıntısı; deney tasarımı mantığı; hiperparametre ayarına hazırlık ders notu
8) Vize Sınavı
9) Sınıflandırma II: ansambl yaklaşımlar (bagging/boosting – giriş), model karşılaştırma ders notu
10) Kümeleme I: k-means; küme sayısı seçimi; iç ölçütler (silhouette vb.) ders notu
11) Kümeleme II: hiyerarşik yöntemler ve/veya DBSCAN (giriş); kümeleri yorumlama ders notu
12) Birliktelik kuralları: frequent pattern mining; Apriori; support-confidence-lift ders notu
13) Aykırılık/anomali tespiti; değerlendirme ve kullanım senaryoları ders notu
14) Uygulamalı atölye I: CRISP-DM’e göre mini vaka (veri hazırlama → modelleme → değerlendirme) ders notu
15) Uygulamalı atölye II: sonuçların raporlanması, görselleştirme, bulgu tartışması; genel tekrar ders notu
16) Final Sınavı

Kaynaklar

Ders Notları / Kitaplar: Öğretim elemanı tarafından hazırlanan ders notları, uygulama föyleri ve örnek kodlar.
Diğer Kaynaklar: Chapman, Clinton, Kerber, Khabaza, Reinartz, Shearer, Wirth, CRISP-DM 1.0 Step-by-step Data Mining Guide (süreç modeli ve görev çıktıları).

Ders - Program Öğrenme Kazanım İlişkisi

Ders Öğrenme Kazanımları

1

2

3

4

5

6

7

8

9

10

11

12

Program Kazanımları
1) Veri analitiği süreçlerinde istatistik, olasılık, veri yönetimi ve makine öğrenmesi arasındaki ilişkiyi açıklar.
1) Veri bilimi ve yapay zekâ alanında kullanılan temel kavramları, yöntemleri ve algoritmaları açıklar.
1) Güncel veri teknolojileri, bulut altyapıları ve büyük veri ekosistemleri hakkında bilgi sahibidir.
2) Python, SQL ve benzeri programlama dillerini kullanarak veri analizi ve modelleme projeleri geliştirir.
2) Veri toplama, temizleme, dönüştürme ve görselleştirme süreçlerini etkin biçimde yürütür.
2) Model performansını değerlendirir, metrikler üzerinden kıyaslama yapar ve model iyileştirme stratejileri geliştirir.
2) Gerçek veri kümelerini analiz eder, uygun istatistiksel ve makine öğrenmesi modellerini seçer ve uygular.
3) Alanındaki gelişmeleri izleyebilecek düzeyde İngilizce dil yeterliliğine sahiptir.
3) Teknik sonuçları, teknik olmayan paydaşlara açık ve etkili biçimde aktarır.
3) Farklı disiplinlerden profesyonellerle etkin biçimde iş birliği yürütür.
4) Akademik literatürü eleştirel biçimde inceleyip uygulamalı projelere aktarır.
4) Veri bilimi alanındaki yeni teknolojileri, araçları ve yöntemleri sürekli takip eder ve kendini günceller.
5) Akademik veya sektörel araştırmalarda bilimsel yöntem ve etik değerlere uygun çalışır.
5) Veri gizliliği, güvenliği ve etik ilkelerine uygun analiz ve modelleme süreçleri yürütür.
5) Kurumsal karar süreçlerini destekleyen veri tabanlı raporlar, panolar ve öngörü sistemleri geliştirir.
6) Gerçek dünyadaki veri odaklı projelerde zaman, kaynak ve kalite yönetimi sorumluluğu alır.
6) Karmaşık veri problemlerine yönelik çözümleri bireysel veya ekip çalışması içinde geliştirir.

Ders - Öğrenme Kazanımı İlişkisi

Etkisi Yok 1 En Düşük 2 Düşük 3 Orta 4 Yüksek 5 En Yüksek
           
Dersin Program Kazanımlarına Etkisi Katkı Payı
1) Veri analitiği süreçlerinde istatistik, olasılık, veri yönetimi ve makine öğrenmesi arasındaki ilişkiyi açıklar.
1) Veri bilimi ve yapay zekâ alanında kullanılan temel kavramları, yöntemleri ve algoritmaları açıklar.
1) Güncel veri teknolojileri, bulut altyapıları ve büyük veri ekosistemleri hakkında bilgi sahibidir.
2) Python, SQL ve benzeri programlama dillerini kullanarak veri analizi ve modelleme projeleri geliştirir.
2) Veri toplama, temizleme, dönüştürme ve görselleştirme süreçlerini etkin biçimde yürütür.
2) Model performansını değerlendirir, metrikler üzerinden kıyaslama yapar ve model iyileştirme stratejileri geliştirir.
2) Gerçek veri kümelerini analiz eder, uygun istatistiksel ve makine öğrenmesi modellerini seçer ve uygular.
3) Alanındaki gelişmeleri izleyebilecek düzeyde İngilizce dil yeterliliğine sahiptir.
3) Teknik sonuçları, teknik olmayan paydaşlara açık ve etkili biçimde aktarır.
3) Farklı disiplinlerden profesyonellerle etkin biçimde iş birliği yürütür.
4) Akademik literatürü eleştirel biçimde inceleyip uygulamalı projelere aktarır.
4) Veri bilimi alanındaki yeni teknolojileri, araçları ve yöntemleri sürekli takip eder ve kendini günceller.
5) Akademik veya sektörel araştırmalarda bilimsel yöntem ve etik değerlere uygun çalışır.
5) Veri gizliliği, güvenliği ve etik ilkelerine uygun analiz ve modelleme süreçleri yürütür.
5) Kurumsal karar süreçlerini destekleyen veri tabanlı raporlar, panolar ve öngörü sistemleri geliştirir.
6) Gerçek dünyadaki veri odaklı projelerde zaman, kaynak ve kalite yönetimi sorumluluğu alır.
6) Karmaşık veri problemlerine yönelik çözümleri bireysel veya ekip çalışması içinde geliştirir.

Öğrenme Etkinliği ve Öğretme Yöntemleri

Ders

Ölçme ve Değerlendirme Yöntemleri ve Kriterleri

Yazılı Sınav (Açık uçlu sorular, çoktan seçmeli, doğru yanlış, eşleştirme, boşluk doldurma, sıralama)
Ödev

Ölçme ve Değerlendirme

Yarıyıl İçi Çalışmaları Aktivite Sayısı Katkı Payı
Ara Sınavlar 1 % 40
Final 1 % 60
Toplam % 100
YARIYIL İÇİ ÇALIŞMALARININ BAŞARI NOTU KATKISI % 40
YARIYIL SONU ÇALIŞMALARININ BAŞARI NOTUNA KATKISI % 60
Toplam % 100

İş Yükü ve AKTS Kredisi Hesaplaması

Aktiviteler Aktivite Sayısı Süre (Saat) İş Yükü
Ara Sınavlar 1 1 1
Final 1 1 1
Toplam İş Yükü 2