YCSB platformu ile yeni nesil bulut veri depolama sistemlerinin karşılaştırılması
Künye
Kara, B. (2019). YCSB platformu ile yeni nesil bulut veri depolama sistemlerinin karşılaştırılması. (Yüksek Lisans Tezi). İskenderun Teknik Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü, Hatay.Özet
NoSQL veritabanı sistemleri gün geçtikçe daha hızlı bir şekilde büyük veri uygulamaları
için yaygın olarak kullanılan bir veri platformu haline gelmektedir. Farklı NoSQL
çözümleri arasından en iyi seçimi yapabilmek için belirli parametreler ışığında düşük veya
yüksek veri yüküne sahip iş yükleri kullanılarak, bu sistemlerin zayıf ve güçlü yönlerinin
analiz edilmesi gerekmektedir. Bu tezin amacı, üç farklı NoSQL veritabanı sistemlerini
Windows işletim sistemi üzerinde çalıştırıp, düşük iş yükü altındaki yeteneklerini test
ederek, her bir veritabanı sisteminin düşük iş yükü altındaki zayıf yönlerini ve güçlü
yönlerini analiz etmektir. Çalışmamızda, NoSQL veri tabanlarının performanslarını test
etmek için Yahoo’nun tasarladığı bir platform olan Yahoo Bulut Hizmet Ölçümünün
(YCSB) default değerlerle sunduğu 6 farklı iş yüklerini kullandık. Ayrıca çalışmamızda
MongoDB ve Cassandra veritabanı sistemlerinin güncel versiyonlarını kullanarak büyük
verinin depolanması ve yönetimin de yaygın olarak kullanılan bu iki NoSQL sistemin son
geliştirmelerle beraber kazandıkları yeni yeteneklerin performans analizlerini ortaya
koyduk. Böylelikle Literatür araştırmalarımızda karşılaştığımız bu konuyla alakalı benzer
çalışmalardaki MongoDB ve Cassandra gibi sistemlerin eski versiyonlarında yapılan analiz
ve test sonuçlarını, çalışmamızdaki yeni versiyonlar da yapılan test sonuçlarıyla
karşılaştırma imkânını sağladık. Bununla beraber popülerliği Çizge (Graph) veri tabanları
dünyasında günden güne artan ve bu alanda en çok bilinen ve kullanılan Neo4J’ye
alternatif olma yolunda ilerleyen OrientDB’yi MongoDB ve Cassandra gibi NoSQL
veritabanları sistemleri dünyasının amiral gemisi konumundaki 2 sistemle karşılaştırarak,
bu yeni veritabanı sisteminin NoSQL dünyasına kattıklarını gözler önüne serdik. Elde
edilen sonuçlara göre, MongoDB ve OrientDB'nin düşük yükler altında saniye de
gerçekleştirdiği iş miktarında Cassandra ya göre çok iyi performans gösterdiği, gecikme
sürelerinde ise OrientDB’nin MongoDB’nin de üzerinde bir performans sergilediğini
gözlemledik. Cassandra ise windows işletim platformu üzerindeki performansının bu iki
veritabanı sistemine nazaran verimsiz kaldığını gözlemledik. NoSQL database systems have been becoming commonly used data platform for big data
applications. It is necessary to analyze this system’s weak and strong sides by using
workload with low and high pay load in the light of specific parameters to make best
selection among different NoSQL solutions. The purpose of this thesis is to analyze that
weakness and strengths of each database system’s under low work load by launching three
different NoSQL database systems on Windows operating system and testing their abilities
under low work load. In our study, six different work loads of Yahoo Cloud Service
Benchmark (YCSB), a platform designed by Yahoo were utilized in order to test
performances of NoSQL databases. Moreover, widely used in storage and management of
big data, these two NoSQL systems ’performances’ analyses of new abilities which they
gained with the recent developments have been demonstrated by using the current versions
of the MongoDB and Cassandra database systems. Therefore, we have provided the
opportunity to compare the analysis and test results of old versions of systems such as
MongoDB and Cassandra in the similar studies we have encountered in our literature
researches with the test results in the new versions of our study. Furthermore, contributions
of OrientDB becoming more popular in graph database world and going ahead to be
alternative to Neo4J used and known most in this area were revealed by comparing
MongoDB and Cassandra two systems which are flagship of NoSQL database systems.
According to result obtained, the fact that MongoDB and OrientDB showed better
performance in throughput executed under low workload in second than Cassandra and
that OrientDB showed better performance in latency than MongoDB were observed.
Cassandra was insufficient in terms of performance on Windows operating system with
regard to these two database systems.