Minggu, 18 Oktober 2015

DATA MART, DATA WAREHOUSE, ETL, ELT, DAN OLAP


EVAN SUSANTO / 1304505107
JURUSAN TEKNOLOGI INFORMASI / FAKULTAS TEKNIK /
UNIVERSITAS UDAYANA
DATA WAREHOUSE
DOSEN : I PUTU AGUS EKA PRATAMA, S.T., M.T.


DATA MART, DATA WAREHOUSE, ETL, ELT, DAN OLAP 
Sumber: http://trianzblog.com/wordpress/wp-content/uploads/2010/12/Picture2-300x167.jpg


Data Mart
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.

Data Warehouse
Data warehouse merupakan data-data yang berorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan oleh para manajer di setiap jenjang (namun terutama pada jenjang manajerial yang memiliki peringkat tinggi). Pemakaian teknologi data warehouse hampir dibutuhkan oleh semua organisasi, tidak terkecuali Perpustakaan. Data warehouse memungkinkan integrasi berbagai macam jenis data dari berbagai macam aplikasi atau sistem. Hal ini menjamin mekanisme akses “satu pintu bagi manajemen untuk memperoleh informasi, dan menganalisisnya untuk pengambilan keputusan”.
Data Warehouse menggunakan 2 server atau lebih. Memiliki data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang tetap dan saling terintegrasi menjadi satu kesatuan yang menunjang keseluruhan konsep Data Warehouse itu sendiri. Dengan kata lain informasi dikumpulkan dari data yang terpisah yang kemudian disatukan menjadi sebuah ringkasan

ETL (ExtractionTransformationLoading)
ETL adalah kumpulan proses menyiapkan data dari operational source untuk data. Proses ini terdiri dari extracting, transforming, loading, dan beberapa proses yang dilakukan sebelum dipublikasikan ke dalam data warehouse. Jadi, ETL atau extract, transform, loading adalah fase pemrosesan data dari sumber data masuk ke dalam data warehouse. Tujuan ETL adalah mengumpulkan, menyaring, mengolah dan menggabungkan datadata yang relevan dari berbagai sumber untuk disimpan ke dalam data warehouse. ETL juga dapat digunakan untuk mengintegrasikan data

Dengan sistem yang sudah ada sebelumnya. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi kriteria data warehouse seperti data historis, terpadu, terangkum, statis dan memiliki struktur yang dirancang untuk keperluan proses analisis. Proses ETL terdiri dari tiga tahap, yaitu :

1. Extract
Langkah pertama dari proses ETL adalah proses penarikan data dari satu atau lebih sistem operasional sebagai sumber data (bisa diambil dari sistem OLTP, tapi bisa juga dari sumber data di luar system database). Kebanyakan proyek data warehouse menggabungkan data dari sumber-sumber yang berbeda. Pada hakekatnya, proses ekstraksi adalah proses penguraian dan pembersihan data yang diekstrak untuk mendapatkan suatu pola atau struktur data yang diinginkan.

2. Transform
Proses membersihkan data yang telah diambil pada proses extract sehingga data itu sesuai dengan struktur data warehouse atau data mart. Hal-hal yang dapat dilakukan dalam tahap transformasi :
a). Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam data warehouse.
b). Menerjemahkan nilai berupa kode (misal, database sumber menyimpan nilai 1 untuk pria dan 2 untuk wanita, tetapi data warehouse menyimpan M untuk pria dan F untuk wanita). Proses yang dilakukan disebut automated data cleansing, tidak ada pembersihan secara manual selama proses ETL.
c). Mengkodekan nilai-nilai ke dalam bentuk bebas ( missal memetakan ”male” ,”I”, dan ”Mr ke dalam ”M”).
d). Melakukan perhitungan nilai-nilai baru (misal sale_amount = qty*unit_price).
e). Menggabungkan data dari berbagai sumeber bersama-sama.
f). Membuat ringkasan dari sekumpulan baris data (misal, total penjualan untuk setiap bagian).
Kesulitan yang terjadi pada proses transformasi adalah data harus digabungkan dari beberapa sistem terpisah, harus dibersihkan sehingga konsisten dan harus diagregasi untuk mempercepat analisis.

3. Loading
Fase load merupakan tahapan yang berfungsi untuk memasukkan data ke dalam target akhir, yaitu ke dalam suatu data warehouse. Waktu dan jangkauan untuk mengganti atau menambah data tergantung pada perancangan data warehouse pada waktu menganalisa keperluan informasi. Fase load berinteraksi dengan suatu database, constraint didefinisikan dalam skema database sebagai suatu trigger yang diaktifkan pada waktu melakukan load data (contohnya : uniqueness,referential, integrity, mandatory fields), yang juga berkontribusi untuk keseluruhan tampilan dan kualitas data dari proses ETL

ELT (Extraction, Loading, Transformation)
ELT merupakan variasi dari ETL (ExtractionTransformationLoading). pada proses ini data juga akan di extract terlebih dahulu, kemudian data akan di load ke database. Kemampuan ini sangat berguna untuk memproses set data yang besar yang diperlukan untuk Business Intelligence dan analisis data yang besar. Salah satu kemampuan utama ELT adalah pengurangan waktu loading jika dibandingkan dengan model ETL. Mengambil keuntungan dari kemampuan pemrosesan yang dibangun dalam infrastruktur data warehouse dapat mengurangi waktu yang dihabiskan data untuk melakukan transit dan lebih hemat biaya.

OLAP (OnLine Analytical Processing)
Pengertian OLAP merupakan sebuah prangkat lunak yang melakukan pemrosesan untuk menganalisa data bervolume besar dari berbagai perspektif (multidimensi). OLAP seringkali disebut analisis data multidimensi yang berfungsi sebagai data analasis (select). Data multidimensi adalah data yang dapat dimodelkan sebagai atribut dimensi dan atribut ukuran. Contoh atribut dimensi adalah nama barang dan warna barang, sedangkan contoh atribut ukuran adalah jumlah barang.

OLTP (Online Transaction Processing Systems)
OLTP (On-line Transaction Processing) memiliki karakteristik dengan jumlah data yang besar namun hanya dapat melakukan hal sederhana seperti insert,update, dan delete. Hal utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah melakukan query secara cepat, data mudah untuk diperbaiki dan dapat diakses melalui komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang memproses suatu transaksi secara langsung melalui komputer yang terhubung dalam jaringan. Seperti misalanya kasir pada sebuah super market yang menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record data, lagi pula OLTP sangat optimal untuk updating data.

DAFTAR PUSTAKA
[1] Oracle. 2014. Oracle Database 12c for Data Warehousing. http://www.oracle.com/technetwork/database/bi-datawarehousing/data-warehousing-wp-12c-1896097.pdf. 18 Oktober 2015. 
[2] Kudang Karsono. 2012. ETL (Extraction, Transformation, Loading). http://kundang.weblog.esaunggul.ac.id/2013/09/17/extract-transform-loading/ 18 Oktober 2015 
[3] Arrie0905. 2013.  Terminologi Data Warehouse, Data Mart, OLAP,. https://arrie0905.wordpress.com. 18 Oktober 2015 
Categories:

0 komentar:

Posting Komentar