Bu sayfa Manisa Celal Bayar Üniversitesi Veri Topluluğu üyeleri için hazırlanmış Veri Bilimi(Data Science) rehberidir. Bu sayfada veri bilimi hakkında bilgilere ulaşabilirsiniz. Sosyal Medya Hesaplarımız
Veri bilimi, verileri analiz etmek, yorumlamak ve anlamlı bilgiler elde etmek için istatistiksel ve hesaplamalı yöntemleri kullanma sürecidir. Bu disiplin, büyük miktarda veriyle çalışmayı gerektiren veri analitiği, makine öğrenimi, istatistiksel modelleme ve veri görselleştirme gibi teknikleri birleştirir.
- Data Science ve Python (Kaan Can Yılmaz)
- Data Visualization (Kaan Can Yılmaz)
- R: R, veri analitiği ve istatistiksel hesaplamalar için kullanılan bir başka popüler programlama dilidir. R, geniş bir istatistiksel ve grafiksel araç seti sunar ve veri analizi, veri görselleştirme ve modelleme için kullanılır. R'ın popüler kütüphaneleri arasında ggplot2, dplyr ve caret bulunmaktadır.
- Apache Hadoop: Hadoop, büyük veri işleme ve dağıtık depolama için kullanılan açık kaynaklı bir framework'tür. Hadoop, veri bilimcilerin büyük miktardaki verileri parçalara bölerek paralel olarak işlemesini ve analiz etmesini sağlar. Hadoop ekosistemindeki diğer araçlar arasında MapReduce, HDFS (Hadoop Distributed File System) ve Apache Spark bulunmaktadır.
- Apache Spark: Apache Spark, büyük ölçekli veri işleme, veri analizi ve makine öğrenimi için bir framework'tür. Spark, hızlı ve dağıtık veri işleme sağlar ve Python, R, Java ve Scala gibi farklı dillerde kullanılabilir. Spark'ın veri bilimi için yaygın olarak kullanılan bileşenleri arasında Spark SQL, Spark Streaming ve MLlib yer alır.
- TensorFlow: TensorFlow, makine öğrenimi ve derin öğrenme uygulamaları için popüler bir açık kaynaklı kütüphanedir. TensorFlow, büyük ölçekte hesaplama gücü gerektiren karmaşık yapay sinir ağları ve derin öğrenme modellerinin oluşturulmasına olanak tanır. TensorFlow'un yanı sıra PyTorch ve Keras gibi diğer derin öğrenme kütüphaneleri de yaygın olarak kullanılır.
- Scikit-learn: Scikit-learn, Python tabanlı bir makine öğrenimi kütüphanesidir. Scikit-learn, sınıflandırma, regresyon, kümeleme, boyut indirgeme ve model seçimi gibi birçok temel makine öğrenimi algoritmasını içerir. Ayrıca, model değerlendirme, hiperparametre ayarlama ve veri önişleme gibi araçlar da sağlar.
- Veri Bilimi ve Makine Öğrenmesi -Bootcamp 2022 (BTK Akademi)
- Veri Bilimi için Python ve Tensorflow (BTK Akademi)
- Veri Bilimi Dersleri (Tirendaz Akademi)
- Veri Bilimi Giriş Eğtimi-Python istatistik SQL (Data Science Earth)
- R Programlama ile Veri Analizi (Tirendaz Akademi)
- Python Pandas ile Veri Analizi (Tirendaz Akademi)
- R Dokümantasyon
- Apache Hadoop Dökümantasyon
- Apache Spark Dokümantasyon
- TensorFlow Dokümantasyon
- Scikit-learn Dokümantasyon
- Python Data Science Handbook (Jake VanderPlas)
- Data Science Design Manual (Steven S. Skiena)
- Introduction to Data Science (Laura Igual , Santi Seguí)
- Data Science and Predictive Analytics (Ivo D. Dinov)