in ,

HavalıHavalı ÇalışkanÇalışkan EntellektüelEntellektüel Sevgi DoluSevgi Dolu ŞaşkınŞaşkın ÇılgıncaÇılgınca

Temel Grafikler ve R Stüdyoda Grafik Çizdirme

İstatistikte Kullanılan Temel Grafikler ve R’da Çizdirilmesi

Giriş

Bu yazıda R Studio kullanarak temel ve basit grafikleri nasıl çizebileceğimizden bahsedeceğim. Öncelikle bu yazıda bir vektörün faktörü ile ilgili bilgilere sahip olduğunuzu varsayarak bir anlatım yapacağım. Fakat yine de faktör kavramını kısaca açıklamak istiyorum.

Faktör

Elinizde bir veri olduğunu varsayın, bu verinin içinde hem sayısal bilgiler hem de kelime içeren bilgiler olabilir. Örneğin bir anket verisinde, ankete katılan kişilerin yaşları, kiloları, boyları gibi sayısal veriler yer alabilirken; doğum yerleri, cinsiyetleri gibi kelime içeren veriler de olabilmektedir. Sayısal veriler grafikleştirilirken vektör olarak kullanılması yeterlidir. Fakat kelime içeren veriler için vektör yeterli olmamaktadır. Bu yüzden faktör kavramını kullanmak durumunda kalırız. Bu kullanımı, bu yazı içerisinde daha net göreceğiz.

Bu yazıda plot komutuna değineceğim.

Öncelikle elimizde bir veri olmalı. Ben çok az sayıda kişinin katıldığı bir anket verisini kullanacağım.

R Studio’yu açalım. Elimizdeki veriyi R Studio’ya aktaralım.

import dataset
Görsel 1

Yukarıdaki resimde, “environment” bölümündeki “import dataset” butonuna tıklayalım.

Görsel 2

Ben Excel’den aktarmayı seçeceğim. Çünkü elimdeki veri Excel’de hazırlamış olduğum bir veri.

 Fakat elinizdeki veriye göre bu seçim değişebilir. Örneğin Dünya Sağlık Örgütü’nün güncel olarak yayınlamış olduğu Covid19 verileri için “From Text(readr)” butonunu seçmeniz daha iyi olacaktır.

browse
Görsel 3

Karşınıza böyle bir pencere çıkacaktır. Sağda bulunan “Browse” butonuna tıklayarak bilgisayarınızda bulunan veriyi seçmelisiniz.

Görsel 4

Veri yüklendikten sonra bu şekilde görünecektir. “Import” butonuna tıklamalısınız.

environment
Görsel 5

Veri, R Studio’ya aktarıldığında “Enviroment” bölümünde görünecektir. Ayrıca sol üstte verinin içeriği görünmektedir. Cinsiyet, kilo_kg, boy_cm, yaş, doğum_yeri,eğitim_seviyesi sütun adlarıdır.  Şimdi grafik çizme komutlarına geçebiliriz.

Plot

plot
Görsel 6

“plot” komutu ile çok basit bir şekilde grafik çizebiliriz. Ortaya çıkan grafik “Plots” bölümünde görüldüğü gibi noktalı halde olacaktır. Bu görüntüyü çizgili ve çizgili-noktalı hale getirebilmek mümkündür. Bunu yapmayı da göstereceğim.

Öncelikle dikkat etmemiz gereken şey “plot” komutuyla bir vektörü grafik hale getirebilecek olmamızdır. Seçtiğimiz verinin adı ve verideki bir sütun, ki bu sütun sayısal verilere sahip olmalı, $ işareti ile vektör hale getirilip “plot” komutu ile grafikleştirilebilir.  Y ekseninde ankete katılan kişilerin kiloları ve x ekseninde de ankete katılma sıraları gösterilmektedir. Örneğin ankete katılan 1. kişinin kilosu 68-69 kg civarıdır. Ya da ankete katılan 12. kişinin kilosu 65 kg’dir. Örnekler bu şekilde çoğaltılabilir.

Yukarıdaki resimdeki gibi, sayısal veriye sahip olan bir başka sütunla yeni bir grafik çizilebilir. Y ekseninde ankete katılan kişilerin boy uzunlukları, x ekseninde ise ankete katılan kişilerin katılma sırası yer almaktadır.

“plot” komutunu 2 vektör ile kullanabiliriz.

vektör 1
Görsel 7
vektör 2
Görsel 8

Yukarıdaki 2 grafiğin de aynı olduğunu görüyoruz. Bu da 2 vektörle grafik çizmek için kullanabilecek çok benzer 2 yoldur.

vektör 3
Görsel 9

Yukarıdaki görüntüde farklı tarzda yazılmış bir komut görüyoruz. ~ ile yazılan bu komutta, normalden farklı olarak ilk y ekseni daha sonra x ekseni yazılır. Grafiğe bakacak olursak y ekseninde ankete katılan kişilerin kiloları, x ekseninde ankete katılan kişilerin boyları yer almaktadır.

vektor-4
Görsel 10

Kullandığımız verinin adını sürekli kullanmak istemediğimizde en sondaki komut işimize yarar. Sütunların adları yazıldıktan sonra veri adı eklenir.

subset
Görsel 11

Yukarıdaki grafik diğerlerinden oldukça farklıdır. Bunun sebebi subset komutunun kullanılmış olmasıdır. Konsoldan son yazılan komutu incelersek, cinsiyeti kadın olan kişilerin kilo ve boy grafiğinin çizilmesinin istendiğini anlayabiliriz.

subset 2
Görsel 12

Aynı şeyi yukarıdaki gibi, cinsiyeti erkek olanlar için de yapabiliriz.

kilo-boy
Görsel 13

Örnekler bu şekilde çoğaltılabilir. Eğitim düzeyi lisans olan öğrencilerin kilo- boy grafiği yukarıdaki gibidir.

kilo boy 2
Görsel 14

Yukarıdaki grafikte İstanbul’da doğan kişilerin kilo- boy grafiğini görebiliriz.

Üst kısımlarda grafiği çizgili ve çizgiği-noktalı gösterebileceğimizi söylemiştim. Şimdi bununla ilgili örnekler yapalım.

çizgi grafiği
Görsel 15

Yukarıda görüldüğü gibi çizgi grafiği çizebilmek mümkündür. Bunun için plot komutunu kullanırız, grafiğini istediğimiz vektörü yazarız, sonuna type=”l” ekleriz.

çizgi grafiği 2
Görsel 16

Grafiği hem çizgili hem noktalı yapmak için plot komutunu kullanırız, grafiğini istediğimiz vektörü yazarız, sonuna type=”o” ekleriz.

çizgi grafiği 3
Görsel 17

Benim şuanda kullanmakta olduğum veri çok az sayıda kişinin katıldığı bir anket olduğundan grafikler oldukça okunaklı. Fakat birçok kişinin katılığı bir anket grafiğini okumak kişiyi zorlayabilmektedir. Bu sebeple grafiği belirli sınırlarda büyütmek, sadece belirli sınırlarda okumak, işi oldukça kolaylaştırır. Bunun için yukarıda görüldüğü gibi xlim ve ylim komutlarını kullanırız.

Şimdi plotla ilgili çeşitli alıştırmalar yapacağız. Faktör kavramı içeren bu alıştırmaları iyi kavramak için faktör kavramını bilmeniz oldukça önemlidir.

histogram
Görsel 18

Factor komutunu kullanarak c_factor adıyla yeni bir sütun ürettim. Sonrasında plot komutuyla grafiğini çizdim. Bu sayede ankete katılan kişilerden kaçının erkek kaçının kadın olduğunu görebildim.

histogram 2
Görsel 19

Aynı şekilde hangi ilden kaç kişinin katıldığını görebilmek için doğum_yeri sütununu faktör haline getirerek yeni bir sütun ürettim. Sonrasında bu faktörün grafiğini çizdim. Ankete Ankara’dan 3 kişi, Bursa’dan 3 kişi, İstanbul’dan 6 kişi katılmış.

histogram 3
Görsel 20

Aynı şekilde eğitim_düzeyi sütununu faktör haline getirerek yeni bir sütun ürettim. Sonrasında bu faktörün grafiğini çizdim. Ankete lisans düzeyinde 5 kişi, lise düzeyinde 4kişi, master düzeyinde 3 kişi katılmış.

c_factor sütununun sonradan ürettiğimiz bir sütun olduğunu hatırlayalım. Factor komutuyla üretmiştik. Şimdi ise Anket verisini kullanarak, y ekseninde boy ve x ekseninde cinsiyet olmak şartıyla bir grafik çizdim. Boxplot tipi ulan bu grafik tipinin okunma şekli biraz daha farklıdır. Grafiğe bakacak olursak 5 çizgi ve bu çizgilerin sınırladığı alanları görebiliriz. Orta kısımda bulunan siyah çizgi erkek için erkeklerdeki, kadın için kadınlardaki orta değeri simgeler.

kutu grafiği 2
Görsel 21

Siyah çizginin altındaki ve üstündeki aynı uzunluktaki lila rengine benzer çizgi ilk ve son yarım değerlerinin ortanca değerini simgeler. En üst ve en alttaki kısa çizgiler ise en kısa ve en uzun kişiyi göstermektedir. Bu grafiğin cinsiyete göre farklı olduğu ortadadır. Bunun sebebi ankette kadınların ve erkeklerin, boy uzunluğu sorusuna vermiş olduğu farklı cevaplardan kaynaklanmaktadır. Bu ankete göre, anketi cevaplayan kadınların erkeklerden ortalama olarak çok daha kısa olduğu yorumu yapılabilir.

Aynı örnek bu grafikte de geçerlidir. Ankara, Bursa ve İstanbul’da doğan kişilerin boy uzunlukları doğdukları şehire göre değerlendirilmiştir. Bu grafiğe göre, ankete katılan kişilerden Bursa’da doğanların ortalama boy uzunluğunun İstanbul’da ya da Ankara’da doğan kişilere kıyasla daha uzun olduğu yorumu yapılabilir.

kutu grafiği 3
Görsel 22

Benzer olarak yukarıdaki grafikte eğitim düzeyi ve boy ilişkisi gösterilmiştir. Bu ankete göre, ankete katılan öğrencilerden master düzeyinde olan kişilerin ortalama boy uzunluğunun lisans ve lise düzeyindeki kişilerin ortalama boy uzunluğundan fazla olduğu söylenebilir.

kutu grafiği 4
Görsel 23

Benzer olarak, kilo-eğitim düzeyi grafiği çizilebilir.

kutu grafiği 5
Görsel 24

Son 2 grafiğin aynı olduğunu sadece x ekseni isminin farklı olduğunu fark ettiniz mi? Son 2 görüntüdeki komutlar arasındaki fark şu şekilde açıklanabilir. İlk kilo- eğitim düzeyi grafiğinde görüldüğü üzere x ekseninin ne anlattığını anlamak biraz zor olabilir fakat ikinci kilo-eğitim düzeyi grafiğinde, x ekseni sütun ismi olduğundan anlamak daha kolaydır. 2. Grafik çizilirken, factor komutu kullanılarak yeni bir sütun oluşturulmuştur ve plot komutu ile direkt yazılmıştır.

Örnekler bu şekilde çoğaltılabilir. Farklı grafik çizme komutları da vardır. Bunlardan en çok kullanılanlar:

  1. plot
  2. barplot
  3. hist
  4. boxplot

ggplot ise daha ileri seviye grafik çizme yöntemlerindendir. Temel grafik çizmeyi iyice kavradıktan sonra, bu yöntem hakkında da içerik yazmayı umuyorum.

Bunlardan plot komutunu bu içerikte anlatmaya çalıştım. Siz de uygulayarak bu bilgiyi kavramayı denemelisiniz. Diğer içeriklerimde de barplot, hist, boxplot komutlarını da kullanarak, içerik hazırlamayı umuyorum. Herkese iyi çalışmalar.

Kaynak: https://anaraven.bitbucket.io/

Editör: Mehdi Koşaca

Ne düşünüyorsunuz?

31 Points
+ Oy - Oy

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir