Oracle Big Data Appliance Nedir? 

“Oracle Big Data Appliance nedir?” sorusuna geçmeden önce Big Data kavramını tam olarak anlamlandırmakta fayda bulunmakta. Big Data kavramsal olarak zaman içinde toplanan büyük miktardaki verilerin ekonomik ve ölçeklenebilir bir şekilde ve ilişkisel veritabanı yöntemlerinin yeterli gelmediği noktalarda kullanılması ve anlamlandırılması anlamına gelmektedir. Günümüzde her geçen gün veri miktarlarının ve veri çeşitliliğinin artmasıyla  verinin önemi […]

“Oracle Big Data Appliance nedir?” sorusuna geçmeden önce Big Data kavramını tam olarak anlamlandırmakta fayda bulunmakta. Big Data kavramsal olarak zaman içinde toplanan büyük miktardaki verilerin ekonomik ve ölçeklenebilir bir şekilde ve ilişkisel veritabanı yöntemlerinin yeterli gelmediği noktalarda kullanılması ve anlamlandırılması anlamına gelmektedir. Günümüzde her geçen gün veri miktarlarının ve veri çeşitliliğinin artmasıyla  verinin önemi de şirketler ve kurumlar için artmıştır. Şirketler, temeli 2004 yılına kadar uzanan Big Data kavramına çıktığı andan itibaren büyük yatırımlar yapmışlardır. Big Data bünyesinde Hadoop Core, Hadoop Distributed File System (HDFS), Data Warehouse (Hive), HBase, ZooKeeper, Oozie, Mahout, Sqoop ve Cloudera Manager başta olmak üzere daha birçok farklı açık kaynak kodlu yazılımlar barındırmaktadır.

Hadoop Cluster’ı ve Geleneksek Mimari

Oracle, bünyesinde geleneksel mimari dışındaki Engineered Systems adı verilen mühendislik sistemlerini piyasaya sunmaktadır. Piyasaya sunulan bu sistemlerin başında Oracle Exadata Veritabanı Makinesi gelmektedir. Bu noktada amaç, yazılım ve donanımın kullanıcılara bir arada sunulması ve geleneksel mimarideki rutin hale gelen birtakım problemlerin ortadan kaldırılmasıdır. Mesela şirketler tek bir üreticiden destek alamadıkları durumlarda ortada bir problem bulunuyorsa; problemi donanım ekibi yazılım ekibine, yazılım ekibi ağ ekibine ve ağ ekibi de tekrar donanım ekibine atmaktadır. Bundan dolayı donanım sisteminin A üreticisinden, yazılım sisteminin B üreticisinden, cluster’ın C üreticisinden, ağ bileşenlerinin D üreticisinden destek aldığı durumlarda rutin birtakım problemler oluştuğu zaman şirketler çözüm ve destek almakta zorluk yaşamaktadırlar. Bu durum Hadoop Cluster’ı ve bu cluster’ın bileşenleri için de geçerli olmaktadır. Önce donanım sistemi tedarik edilip sonrasında ise ağ bileşenleri tedarik edilir ve donanımları birleştirip test etmek için uğraşılır. Sonraki süreçte ise tedarik edilen bir işletim sistemi yazılımı bu donanımlar üzerinde kurulur ve çalıştırmak için fazlasıyla zaman ve emek harcanır. Her şeyin düzgün bir şekilde çalıştığına emin olunduktan sonra sistem üzerinde kullanılacak olan yazılımların ve cluster’ın kurulumuna geçilir. Süreç sonunda Hadoop Cluster kurulumu tamamlanmış olur fakat bu sürece kadar haftalar belki aylar geçmiş olur. Ayrıca bu cluster’ın büyüme gereksinimi oluştuğu zaman süreç en başa sarılır ve farklı üreticilerden yeniden aynı tipte ürünler tedarik edilip sisteme entegre edilmesi gerekilir. Oracle, Oracle Big Data Appliance’i piyasaya sunarak şirketleri tüm bu maliyetlerden ve zaman kaybından kurtaracak çözümler getirmiştir. 

Big Data ve 4V

Oracle, verilerin ve veri çeşitlerinin depolanabilmesi, saklanabilmesi, analiz edilebilmesi, değer katılabilmesi ve anlamlandırabilmesi amacıyla bir Engineered System geliştirmiştir. Oracle Big Data Appliance olarak adlandırılan bu sistemde 4V olarak bilinen bileşenler bulunmaktadır. Bu bileşenler şunlardır:

  • Volume (Hacim): Şirketlerin ve kurumların ellerinde bulu nan verilerin hacmi her geçen gün logaritmik bir şekilde artmaktadır. Big Data kavramının ortaya çıkmasındaki en önemli etkenlerden biri olan verilerin hacminin her geçen gün artması şirketlerin BT maliyetlerini de artırmaktadır. Şirketler artan BT maliyetlerini azaltmaya ve bünyelerinde bulunan bütün verileri saklayabilecek ve yönetebilecek bir ortam arayışına girmektedirler.
  • Velocity (Sürat): Verilerin hacmi her geçen gün hızlı bir şekilde arttığı gibi aynı zamanda bu veriler sisteme çok hızlı bir şekilde geçiş sağlamaktadır. Şirketler için ilişkisel veritabanına bu kadar hızlı veriyi depolamak hem zaman açısından zahmetli hem de ekonomik açıdan maliyetli olacaktır. Bundan dolayı verinin hacmi haricinde şirketlerin sistemlerine çok hızlı bir şekilde akıyor olması da Big Data’yı ve kullanımı açıklayan diğer bir V’dir.
  • Variety (Çeşitlilik): Big Data şirketlere sosyal medya, sensör verileri, CRM dosyaları, dokümanlar, imajlar, videolar ve daha birçok veri çeşidini işleme, analiz etme ve saklama imkanı sunmaktadır.
  • Value (Değer): Yukarıda bahsedilen 3V’nin bir araya gelmesi ile oluşmuş olan value, yüksek hacimlerde, çeşitli ve çok süratli bir şekilde akan ve sistemde yer edinen verinin aynı zamanda değerinin olması gerektiği anlamına gelmektedir. Aksi durumda şirketlerin girdiği maliyet elde edilen değerden büyük olmaktadır. Big Data bu durumun yaşanmaması için şirketlerin sahip oldukları verileri anlamlandırır, değer katar ve veriler üzerinde analiz çalışmaları gerçekleştirir.

Oracle, Oracle Big Data Appliance mimarisi olarak şirketlere ihtiyaç duydukları yazılımları ve donanımları bir arada sunmuştur. Oracle Big Data Appliance üzerinde ilişkisel bir veritabanı bulunmamakta olup Hadoop Cluster ve Oracle Enterprise Linux bulunmaktadır. Aynı zamanda Oracle Big Data Appliance üzerinde RAC, ASM gibi Oracle veritabanı bileşenleri de yer almamaktadır. Bu bileşenlerin yerine Oracle, Oracle Big Data Appliance’nin üstüne “Key-Value” saklama ve sorgulama yapmakta olan NoSQL veritabanı yerleştirmiştir. Oracle kullanıcılarına Oracle Big Data Appliance üzerinde kurulu bulunan ve koşan bütüm yazılımlarını ücretsiz bir şekilde sunmaktadır. Ayrıca Oracle Big Data Appliance’in kurulumu haftalar değil günler bazında olduğundan dolayı şirketlere zaman açısından da tasarruf sağlamaktadır. Aynı zamanda diğer Oracle mimarisine sahip sistemler ile de tam entegre olabilen Oracle Big Data Applience kendi bünyesinde Infiniband (40 GB/SEC) ağ ile iletişim kurmakta ve geleneksel yapıdaki herhangi bir mimariye göre minimum 4 kat daha hızlı iletişim sağlamaktadır. 

Oracle Big Data Appliance Çözümleri Nedir?

Oracle, kullanıcılarına büyük veri için dört aşamadan oluşan Oracle Big Data Appliance çözümleri seti sunmaktadır. Acquire, organize, analyze ve decide olmak üzere 4 aşamadan oluşan Oracle Big Data Appliance çözüm setinin “Acquire” aşamasında verinin elde edilmesi gerekmektedir. Bu aşamada verilerin sisteme akışı hazırlanır ve veriler Oracle Big Data Appliance’a yüklenmesi için yapılandırılır. Ikinci aşama olan “Organize” aşamasında elde edilen veriyi fiziksel bir platformda konumlandırmak gerekmektedir. Yüksek hacme sahip olan veriler çeşitlilik ve hızla Oracle Big Data Appliance’a yani HDFS üzerine kaydedilmekte ve depolanmaktadırlar. HDFS varsayılan olarak “triple mirroring” işlemini gerçekleştirir ve böylece kurulmuş Hadoop Cluster’ı toplamda 18 düğüm üzerinde dağıtır. Bu aşamada amaç verilerle ne yapılabileceğini anlamak ve dolayısıyla bu verileri fiziksel bir yere konumlandırmaktır. Üçüncü aşama olan “Analyze” aşamasında veriler üzerinde analiz yapılması gerekmektedir. Bu aşamada Oracle Big Data Appliance’in bünyesindeki veriler “Map/Reduce” adı verilen bir Java kodundan geçirilir ve ilişkisel bir veritabanına yüklenebilecek şekle getirildikten sonra yeniden Infiniband ağ sayesinde bağlanılan Oracle Exadata’ya veriler aktarılıp, ilişkisel dünyaya dahil edilir. Son aşama olan “Decide” aşamasındaysa elde edilmiş analiz sonucuna göre cevaplanılmaya çalışılan sorular için en iyi kararın verilmesi gerekmektedir.

Oracle Big Data Connectors Nedir?

Oracle tarafından geliştirilen Oracle Big Data Connectors’un amacı verileri Big Data Appliance sisteminden Oracle veritabanına pratik bir şekilde çıkarmaktır. Şirketlerin verileri HDFS’ten yani Hadoop Cluster’ından ilişkisel ortama taşıyabilmeleri için emek ve zaman harcamaları gerekmekte olup aynı zamanda bünyelerinde bu işlemi yapabilecek yetkinliğe sahip personel bulundurmaları ve danışmanlık hizmetlerinden faydalanmaları gerekmektedir. Big Data ile Oracle veritabanının arasındaki köprü işlevini görecek ve zaman açısından tasarruf sağlayabilecek bazı connector yazılımları bulunmaktadır. Bu yazılımlar şunlardır:

  • Oracle Loader for Hadoop: Bir tür Map/Reduce aracı olan yazılım Hadoop’tan Oracle veritabanına verilerin aktarılması sırasında optimize edilmelerini sağlamayı amaçlamaktadır. Veriyi, veritabanına yüklenebilecek şekle getirmek için optimize eden Oracle Loader for Hadoop, bu işlem sırasında CPU ve I/O miktarını da azaltmaya destek olmaktadır.
  • Oracle Direct Connector for Hadoop Distributed File System (HDFS): Oracle veritabanından HDFS ortamına hızlı ve pratik bir şekilde erişim sağlamayı amaçlayan bu yazılım kullanıcılara Direct Connector aracılığıyla diledikleri zaman ilişkisel ortamdan, ilişkisel olmayan Big Data ortamına sorgulama yapabilme imkanı sunmaktadır.
  • Oracle Data Integrator Application Adapter for Hadoop: Amacı HDFS üzerinden Oracle veritabanına veri aktarmak olan yazılım ODI aracının Big Data ile birleştirilmesiyle oluşmuştur. 
  • Oracle R Connector for Hadoop: Bu yazılım sayesinde kullanıcılar istatiksel analizler yapma imkanı bulmaktadır.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir