Herkese Merhaba!
Bu içerikte veri görselleştirmede sıklıkla kullanılan yöntemlerden bahsedeceğim. Eğer ggplot() komutuyla yazdığım diğer yazıları okumadıysanız ve uygulamadıysanız, ilk önce onları uygulamanızı, sonrasında bu içeriğe dönmenizi öneririm.
Öncelikle her zamanki gibi üzerinde çalışacağımız “anket.xlsx” verisini R Studio’ya yüklememiz gerekir. Diğer içeriklerimde de gösterdiğim gibi bunun için “import” butonunu kullanıyoruz. Aşağıdaki görsellerdeki adımları uygulayarak veriyi kullanılabilir hale getiriyoruz.
Verimizde bir ankete katılan insanların belli kategorilerdeki cevabı yer almaktadır.
Yukarıda da görüldüğü gibi veri aktarırken gerçekleştirdiğimiz adımlar şu şekilde:
- Import butonuna tıklamak.
- Browse butonuna tıklamak.
- Bilgisayarımızdan dosyayı seçip yüklemek.
- Sağ altta bulunan import butonuna tıklamak.
Veri kullanılabilir hale geldi. Şimdi “Console” kısmına çalıştırmak istediğimiz paketi yazmalıyız. Bu içerikte ggplot() ile veri görselleştireceğimiz için bu komutun bulunduğu ggplot2 paketini çalıştıracağız. Diğer içeriklerde ggplot 2 paketinin nasıl indirildiğini anlatmıştım. İndirmemiş olanlar inceleyebilirler.
library(ggplot2) ile önceden indirmiş olduğum bu paketi çalıştırmış oldum.
Yukarıdaki komuta diğer içeriklerden farklı olarak shape komutu eklenmiştir. Grafikte de görüldüğü gibi farklı şekillerle sınıflandırma yapmak için kullanılmıştır. Örneğin kilo_kg – boy_cm grafiğinde Ankara’da doğan insanlar daire ile, Bursa’da doğanlar üçgen ile, İstanbul’da doğanlar kare ile ifade edilmiştir.
Verinizdeki sınıflandırma kriterleri arttıkça yeni bir şekille ifade edilir. 25 adet farklı şekil görülmektedir.
Yukarıdaki gibi farklı kriterler de uygulanabilir. Kilo_kg- boy_cm grafiğinde eğitim düzeyi lisans olanlar daire ile, lise olanlar üçgen ile, master olanlar kare ile gösterilmiştir.
Birçok farklı örnek yapılabilir. Örneğin yukarıdaki örnekte kriterlendirme İngilizce seviyesine göre olmuş. Diğer örneklerden farklı olarak + şeklini görmekteyiz. Elimizdeki veriye göre, kilosu yaklaşık 60 kg, boyu yaklaşık 186 cm olan bir insanın İngilizce dil seviyesi C1 olarak gözükmektedir.
Şekillerle sınıflandırma yaptıktan sonra rengini, veriden bağımsız olarak değiştirebilirsiniz. Bunun için aes() ‘in dışında color komutunu kullanmanız yeterli.
Fakat veriye bağımlı bir renklendirme istiyorsanız; örneğin üçgenler pembe, kareler kırmızı, daireler mavi olsun istiyorsanız bu sefer farklı kod yazmanız gerekecektir. Verinin doğru okunması için görselleştirmenin göze hitap etmesi şarttır.
Yukarıdaki örnekte şekiller ve renkler senkronize halde çalışmaktadır. Çünkü gruplandırmada aynı sütun seçilmiştir.
Bu içerikte anlatmak istediklerim bu kadar. Siz de kendinizi deneyerek, benzer örnekler çözerek öğrenebilirsiniz. Bunun için benim kullandığım veriyi kullanmanız doğruluğunuzu test etmeniz açısından daha verimli olacaktır.
İyi çalışmalar ve uygulamalar!
Kaynaklar:
- https://anaraven.bitbucket.io/
- R for Data Science, Hadley Wickham & Garrett Grolemund, 2016.
Görsel Kaynaklar:
- https://stackoverflow.com/questions/62001377/r-ggplot2-shapes-in-unicode
- https://www.datanovia.com/en/blog/ggplot-point-shapes-best-tips/
Editör: Berfin Sucu