Kurslar
Büyük Veri (Bireysel-Kurumsal)
Çağımızın en aranan özelliklerinden büyük veriyi keşfetmeye başla!
✅ Büyük verinin potansiyelinin farkındasınız ve bu alanda nasıl uzman olabileceğinizi mi merak ediyorsunuz?
✅ Büyük veri konusunda temelin var ve bu konuda daha da ilerlemek mi istiyorsunuz?
✅ Büyük veriyi mesleğine entegre ederek güncel mi kalmak istiyorsun?
Eğer bunlardan birine bile evet cevabı verdiyseniz, doğru yerdesiniz!
Kurs Tanıtımı:
Büyük veri, günümüzde endüstri ve teknolojinin en önemli parçalarına yerleşmiş bir kavram.
Bu kursla, büyük verinin temellerinden ileri seviye tekniklerine kadar geniş bir eğitim alacaksınız.
Alanında uzmanlaşmış eğitmenlerimizin rehberliğinde, en güncel büyük veri analiz yöntemlerini keşfedecek ve bu konuda kariyerinizi oluşturmak için gereken tüm bilgilere sahip olacaksınız.
Yetenek setinize büyük veri analizi ekleyerek, teknolojik değişimlerin ön saflarında yer alın!📈🌐
📘 Neler Öğreneceksiniz:
🧠 Büyük Veri Temelleri: Dağıtık sistemler, veri ambarları ve büyük veri mimarileri hakkında bilgi edineceksiniz.
🖥️ Hadoop & Spark & Kafka: Büyük veri için endüstri standartları olan Hadoop, Spark ve Kafka'yı ayrıntılı olarak öğreneceksiniz.
✍️ Uygulamalı Projeler: Gerçek dünyadan veri setleriyle büyük veri projeleri geliştireceksiniz.
Ön koşullar:
Bu kursa katılacak öğrencilerin python dilinde kodlamaya aşina olmaları beklenir (isteğe göre kursa python modülü de eklenebilir.)
Süre:
4 gün (ihtiyaca göre eklenen dersler olursa süre uzayabilir).
Ders İçeriği:
(İsteğe bağlı olarak modüller çıkarılıp yeni konular eklenebilir veya çıkartılıp gün sayısı azaltılabilir)
Büyük Veri nedir ve neden günümüzde önemli?
Hafıza Mimarisi
Gecikme
Lokallik
Cache
Cache miss vs Cache hit
Row-wise vs Column-wise
Hadoop Ekosistemi
HDFS
YARN
MapReduce
Pig
Apache Ambari
Spark
HDFS yapısında nasıl veri tutup çağırırım?
MapReduce - Mapper and Reducer
Pig Scripting
Hive
Introduction to Real-time Streams
Kafka
Kafka mimarisi
Kafka Producers
Stream Processing
KTable
Spark
Map Reduce
Framework's architecture
Resilient Distributed Dataset (RDD)
KeyVal RDD
pyspark
Number of workers
Lazy Eval and Caching
Partition and Gloming
Map-reduce egzersiz
Dataframe
RDD vs Dataframe
Temel işlemler
Apache Parquet
Deserialization
PCA (principal component analysis)
PCA using RDD
Analyzing data using PCA
Spark kullanarak makine öğrenmesi
Kendini güncel tut