Pandas ile veri analizi-3 (Aggregation and Grouping)

Cem Ayan
1 min readDec 28, 2018

--

Büyük verilerde analiz yapılırken önemli bir etken olarak önümüze özetleme çıkar. sum , mean, median, min ve max gibi fonksiyonlarla bunu yapabiliriz. Böylece veri hakkında genel bir kanıya ulaşabiliriz(**)

Aggeration metodları

  • count → Tüm elemanların sayısı
  • mean → Tüm elemanların ortalamalarını hesaplar
  • median → Tüm elemanların median’ı alır
  • first, last → İlk ve Son elemanı getirir
  • sum → Tüm elemanların toplamlarını alır
  • min, max → Tüm elemanların minimum ve maximum değerlerini getirir
  • std, var → Tüm elemanların standart sapmasını ve varyansını hesapları
  • prod → Tüm elamanların çarpımını hesaplar

Yukarıdaki metodların hepsi aynı şekilde çağırılıyor. O yüzden mean’ i göstereceğim sadece.

mean kullanımı

Grouping

Senaryo üzerinden gidelim, kullandığımız örnek veri setinde ülkelere(Country kolonu) göre toplam öğrenci(Student kolonu) sayısını görmek isteyelim.

Bu tür durumlarda groupby kullanıyoruz. (SQL’ deki ile aynı)

Pivot Tables

Pivot tablo girdi olarak basit sütun verileri alır ve girdileri çok boyutlu bir özetleme sağlayan iki boyutlu bir tablo halinde gruplandırır.

Data Cutting

Bazı durumlarda verimiz bölmek isteyebiliriz.

Şu şekilde açabilirim → Elimizdeki bir kolonda x tane veri olduğunu düşünelim. Bu verileri belli kriterlere bölerek göstermek istiyoruz.

Yani x tane veri 4'e bölünmüş aralıklar şeklinde ifade ediliyor.

Bir sonraki yazımda önceki yazımda verdiğim dataset’i üzerinde data analizi yapacağız.

İyi Okumalar,

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Cem Ayan
Cem Ayan

Responses (1)

Write a response