Blog

Türk Ekonomisine Çevrimiçi Verilerle Bir Bakış
Internette yayınlanan verilere erişebilmek ve onlar üzerinden analiz yapabilmek hem alan uzmanları hem de bazı algoritma ve yazılımları test etmek isteyenler için vazgeçilmez bir yöntem. İkinci kategoride yer alan biri olarak, birtakım analiz tekniklerini denemek üzere ulusal sitelerde yer alan kaynaklara yöneldiğimde itiraf etmeliyim ki biraz hüsrana uğradım. İlk olarak meteorolijik ve deprem verilerine erişmek istedim. Ancak bu verileri istediğim formatlarda indirebilmek bir yana, karşıma çıkan ‘veri istek’ formlarını doldurmaktan yoruldum ve sonunda vazgeçtim.  En son olarak Kandilli Rasathanesinde doldurduğum başvuru formu aradan uzun bir sonra geçmesine karşın ancak 11 Aralık 2011 itibariyle sonuçlanabildi. Bu konuda gereken iyileştirmelerin yapılması umuduyla yazıma devam ediyorum.

Datamarket.com

Datamarket, güvenilir veri kaynaklarının sağladığı güncel bilgilerin sunulduğu hatta görselleştirilebildiği harika bir web sitesi. Bu sitede dolaşırken özellikle Türkiye ile ilgili geçmişe yönelik ve güncel çok bilgilendirici veriler var. Karıştırılmaması gereken nokta, Datamarket’in bir wiki sitesi olmaması ve sadece belirli zaman serilerini içermesidir.  Yani karşınızda bilgi yok, bol bol veri var.

Datamarket verisine erişim

Verileri incelemek ve üzerinde çalışmak için çeşitli yöntemler var. Bunlardan belki de en saf olanı, veriyi indirmek. Görselleştirdiğiniz veriyi ‘import’ seçeneği ile belirli formatlarda indirebilirsiniz – örneğin csv.

R ile veriye erişim ve analiz edebilme

R programlama dili birincil olarak veri analizine yönelmiş bir dil. Genel amaçlı olarak kullanımını tavsiye etmiyorum, daha iyi platformlar işi görebilir. Ama söz konusu olan veri analizi ve onu bilgiye çevirmekse R gerçekten çok kullanışlı ve barındırdığı kütüphaneler analiz sürecinize yönelik birer alet kutusu gibi. Daha fazla bilgi için resmi sitesini  ziyaret edebilirsiniz.

Rdatamarket

Rdatamarket , datamarket.com sitesindeki verilere URL yoluyla erişebilmeniz için geliştirilmiş bir paket. Bu paketi kurmak için:

packages.install(“rdatamarket”)

fonksiyonunu R konsolunda çalıştırmanız gerekiyor.


Hangi verileri aldık?

R konsolunda öncelikle daha önce indirdiğimiz paketi yüklememiz gerekiyor:

library(“rdatamarket”)

İkinci adım olarak enflasyon verilerini çekiyoruz:

enflasyon_orani_list <- dmlist("http://data.is/vTjkv4")

Burada dikkatimizi çeken şey, bir URL ile veriye erişiyor olduğumuz. Aslında bu URL daha uzun bir URL fakat datamarket.com “Short URL” seçeneğini sunuyor.

Üçüncü adım olarak gayri safi yurt içi hasıla bilgisini çekiyoruz:

gdp_list <- dmlist("http://data.is/tKgw4Z")


Elde etmek istedğimiz son veri ise işsizlik oranları. Bunun için ise:

issizlik_orani_list <- dmlist("http://data.is/vL0FqK")

Şu an elimizde üç adet veri çerçevesi bulunmakta. Çerçeve kavramını bir tablo olarak düşünebilirsiniz. Bu üç veri çerçevesini yıl bazlı olarak birleştirmek istiyoruz. Yani SQL cümlecik setinde JOIN olarak düşünebiliriz.

enflasyon_issizlik <- merge(    enflasyon_orani_list,
                    issizlik_orani_list,by="Year")
enflasyon_issizlik_gdp <- merge(     enflasyon_issizlik,
gdp_list, by="Year")


Sonuç verisinden sadece belirli sütunları listelersek, elimizdeki en son çerçeve şu şekilde olacaktır.

S <- enflasyon_issizlik_gdp[,c("Year","Value.x","Value.y", "Value")]

Sonuçları görüntülemek için:

print(S)

   

   Year    Value.x     Value.y Value
1  1985  44.960207    11.2  67234948265
2  1988  73.666667     8.4  90852814005
3  1989  63.272553     8.6 107143348667
4  1990  60.312702     8.0 150676291094
5  1991  65.969421     8.2 151041248184
6  1992  70.072791     8.5 159095003188
7  1993  66.097083     9.0 180422294772
8  1994 106.262729     8.6 130690172297
9  1995  88.107703     7.6 169485941048
10 1996  80.346903     6.6 181475555283
11 1997  85.733242     6.8 189834649111
12 1998  84.641336     6.9 269287100115
13 1999  64.867479     7.7 249751470869
14 2000  54.915382     6.5 266567531990
15 2001  54.400184     8.4 196005288838
16 2002  44.964124    10.4 232534560775
17 2003  25.296368    10.5 303005302818
18 2004  10.584236    10.8 392166274991
19 2005  10.138405    10.6 482979839238
20 2006  10.510977    10.2 530900094505
21 2007   8.756181    10.3 647155131629
22 2008  10.444128    11.0 730337495198
23 2009   6.250977    14.0 614553921823

Tabi ki sütun adlarına daha anlaşılır isimler verilebilirdi. Bu verileri şu şekilde okuyabiliriz: “2009 yılında enflasyon oranı %6.250977 iken işsizlik oranı %14 ve gayri safi yurt içi hasıla 6,145,539,218.23 TL dir”. Özellikle Türkiye Büyük Millet Meclisinde şu sıralarda görüşülen 2012 yılı bütçe çalışmalarını takip eden gazeteciler, ekonomistler ve yorumcular için de faydalı veriler toplanabilir.

Şimdi bu verileri bir grafikte göstermek istersek, yine R ile birlikte erişebildiğimiz “scatterplot3d” fonksiyonunu kullanabiliriz. Görselleştirme konusunda birçok paket mevcut ve tamamen neyi nasıl görmek istediğinizle ilgili olarak seçim yapmalısınız.

Yukarıdaki veriyi görselleştirmek için şu betikleri takip ettim:
#
# Eger paketi daha once kurmadiysaniz
# packages.install(“scatterplot3d”) betigini calistirmalisiniz
#
library(“scatterplot3d”)

x <- S$Value
y <- S$Value.x
z <- S$Value.y
xyz <- data.frame(x, y, z)

scatterplot3d(xyz, type="h", highlight.3d=TRUE, angle=55,     xlab="GSMH(TL)", ylab="Enflasyon(%)", zlab="İşsizlik(%)")
 

Ardından çıkan grafik şu şekildedir:





Şekil 1: 1985-2009 Yılları Arasındaki Enflasyon ve GSMH değerlerine karşılık İşsizlik grafiği

Sonuçlar

Datamarket.com, sadece ekonomi ile ilgili bilgilerin yer aldığı bir site değil. Çok farklı konularla ilgili güvenilir verilere erişebileceğiniz bir yer. Bu konudaki çalışmamdan söz ettiğim analist danışman arkadaşlarımızdan Barış Şiri, bana bir adres daha gösterdi. Daha doğrusu bir derlemenin yer aldığı bir blog sayfası: http://www.inside-r.org/howto/finding-data-internet . Buradaki bağlantıları da ziyaret edip veri toplayabilirsiniz.

Yasal Bilgilendirme
Bu yazıda kullanılan verilerin orijinal kaynağı Dünya Bankasıdır (World Bank).  



SELÇUK BOZDAĞ

 
KOMTAŞ Bilgi Yönetimi ve Danışmanlık - Yazılım Ekip Lideri
 
2002 yılında Hacettepe Üniversitesi Bilgisayar Bilimleri ve Mühendisliği Bölümünden mezun oldu.
2002 - 2007 arası Ankara'da yazılım mühendisliği ve uzman yazılım mühendisi olarak çalıştıktan sonra 2007 - 2010 yılları arasında yurtdışında yazılım ekip liderliği yaptı.

2010 yılında Türkiye'ye döndü ve KOMTAŞ Bilgi Yönetimi'nde ArGe departmanında ekip lideri olarak göreve başladı. Halen bu görevini devam ettiren Selçuk, kurumsal veri analizi yazılımları ve yüksek performanslı bilişim konularıyla ilgilenmektedir.