BLM4032 / BÜYÜK VERİ MADENCİLİĞİ

DERSİN HAFTALIK İÇERİĞİ

 
KONULAR 
KAYNAKLAR 
1Büyük Veriye Giriş: Kavramlar, terminoloji, özellikleri ve 5V, yapılandırılmış, yapılandırılmamış, yarı yapılandırılmış ve metadata gibi büyük Veri türlerini kapsar. İş ve araştırma motivasyonlarını kapsar.1
2Büyük Veride Depolama ve Analiz: Kümeler gibi depolama kavramları kapsar, dağıtık dosya sistemleri, RDBMS, NoSQL, sharding, bellek depolama, aynı zamanda paralel, dağıtık, toplu veri işleme ve Hadoop gibi büyük veri işleme konseptlerini kapsar.1
3Büyük Veri Analizi Teknikleri: Nicel, nitel veri madenciliği, istatistiksel analiz, Machine Learning, anlamsal analiz ve görsel veri analizi gibi analiz teknikleri ve konularını kapsar.1
4MapReduce Çerçevesi ve Hadoop: Paralel süreçler ve büyük veri işleme için diğer tasarım desenleri kapsar. Cloudera sanal makine. HDFS, YARN ve Hue.1
5Java ile mapreduce API ve Basic Programlama: Hadoop MapReduce Java API'yi inceleyeceğiz.1
6Hive kullanımı: "veri ambarı" HDFS'ler ve Hadoop. Depolanan veriler üzerinde SQL sorguları.1
7Spark Kullanımı: MapReduce çerçevesinin bellek tabanlı veri analizi ve RDD-Spark.1
8Spark veri akışı, Kafka ve Cassandra: Hızlı verilerin işlenmesi için standart haline gelmiş yığın kullanımı.1
9Spark ile MLLib, Machine Learning: Veriler üzerinde öngörüde bulunmak için öğrenme algoritmalarını gözden geçireceğiz.1
10Büyük Veri Kümelerinde görselleştirme: Büyük verinin içeriğini ve özelliklerini grafiksel olarak incelenmesini göreceğiz.1
11Büyük veride ileri konular ve uygulamalar.1
12Büyük veride ileri konular ve uygulamalar.1
13Büyük veride ileri konular ve uygulamalar.1
14Büyük veride ileri konular ve uygulamalar.1