1 of 37

Dimensi Modeling

2 of 37

Apa itu Model Dimensi?

  • Model dimensi adalah teknik struktur data yang dioptimalkan untuk alat Data warehousing.
  • Konsep Pemodelan Dimensi dikembangkan oleh Ralph Kimball dan terdiri dari fakta meja dan dimensi tabel.
  • Dimensi model dirancang untuk membaca, meringkas, menganalisis informasi numerik seperti nilai, saldo, hitungan, bobot, dll. di gudang data.
  • Sebaliknya, model relasi dioptimalkan untuk Selain itu, memperbarui dan menghapus data dalam Sistem Transaksi Online waktu nyata.

3 of 37

Pemodelan ER Vs Pemodelan Data Dimensi

    • Pemodelan ER cocok untuk sistem operasional sedangkan pemodelan dimensi cocok untuk gudang data.
    • Pemodelan ER mempertahankan detailnya transaksi saat ini data sedangkan pemodelan dimensi mempertahankan ringkasan baik saat ini maupun historis data transaksional.
    • Pemodelan ER memiliki dinormalisasi data sedangkan pemodelan dimensi memiliki data yang tidak dinormalisasi.
    • Pemodelan ER menggunakan lebih bergabung selama pengambilan kueri sedangkan pemodelan dimensi menggunakan a jumlah gabungan yang lebih sedikit oleh karena itu kinerja kueri lebih cepat dalam pemodelan dimensi.

4 of 37

Elemen Model Data Dimensi

  1. Dimensi

Dimensi memberikan konteks seputar peristiwa proses bisnis. Secara sederhana, mereka memberikan fakta tentang siapa, apa, di mana.

Dalam proses bisnis Penjualan, untuk fakta jumlah penjualan kuartalan, dimensi akan menjadi

  • Siapa - Nama Pelanggan
  • Dimana - Lokasi
  • Apa - Nama Produk

Dengan kata lain, dimensi adalah jendela untuk melihat informasi dalam fakta.

  1. Fakta

Fakta adalah ukuran / metrik atau fakta dari proses bisnis Anda. Untuk proses bisnis Penjualan, pengukurannya adalah angka penjualan triwulanan

5 of 37

  1. Atribut

Atribut adalah berbagai karakteristik dimensi.

Dalam dimensi Lokasi, atribut dapat berupa

  • Negara
  • Negara
  • Kode Pos, dll.

Atribut digunakan untuk mencari, memfilter, atau mengklasifikasikan fakta. Tabel Dimensi berisi Atribut

  1. Tabel Fakta

Tabel fakta adalah tabel utama dalam model dimensi.

Tabel Fakta berisi

  • Pengukuran / fakta
  • Kunci asing ke tabel dimensi

6 of 37

  1. Tabel dimensi
    • Tabel dimensi berisi dimensi fakta.
    • Mereka bergabung ke tabel fakta melalui kunci asing.
    • Jika nilai atribut tidak unik dalam hal apa pun, pertimbangkan nomor sistem yang dibuat secara berurutan sebagai kunci utama (kunci pengganti)
    • Tabel dimensi adalah tabel yang dinormalisasi.
    • Tabel dimensi tidak dimaksudkan untuk penghitungan sehingga nilai numerik jarang digunakan untuk atribut dimensi.
    • Semua atribut dalam tabel dimensi mungkin tidak terkait satu sama lain.
    • Tidak ada batasan yang ditetapkan untuk diberikan untuk jumlah dimensi (kasus nyata dengan 50 atau lebih atribut)
    • Dimensi juga dapat berisi satu atau beberapa hubungan hierarki
    • Tabel dimensi akan memiliki jumlah record yang lebih sedikit (dalam ratusan) daripada tabel fakta (dalam jutaan).

7 of 37

8 of 37

Jenis Dimensi

1) Dimensi Kecil

Dimensi kecil di gudang data berfungsi sebagai tabel pemeta dengan jumlah baris dan kolom yang lebih sedikit. Data dalam dimensi kecil dapat dengan mudah dimuat dari spreadsheet. Jika diperlukan dimensi kecil dapat digabungkan sebagai dimensi super.

9 of 37

Jenis dari Dimensi (2)

2) Dimensi yang Sesuai

Dimensi yang sesuai adalah dimensi yang dapat dirujuk dengan cara yang sama dengan setiap tabel fakta yang terkait.

Dimensi tanggal adalah contoh terbaik dari dimensi yang sesuai karena atribut dimensi tanggal seperti tahun, bulan, minggu, hari, dll. Mengomunikasikan data yang sama dengan cara yang sama di sejumlah fakta.

10 of 37

11 of 37

Jenis dari Dimensi (3)

3) Dimensi Sampah

Beberapa atribut dalam tabel fakta seperti bendera dan indikator dapat dipindahkan ke tabel dimensi sampah yang terpisah. Atribut ini juga tidak termasuk dalam tabel dimensi lain yang ada. Secara umum, nilai atribut ini hanyalah "ya / tidak" (atau) "benar / salah".

Solusi terbaik untuk ini adalah membuat dimensi sampah tunggal karena dimensi sampah mampu menahan sejumlah indikator “ya / tidak” atau “benar / salah”.

12 of 37

13 of 37

Jenis dari Dimensi (4)

4) Dimensi Bermain Peran

Dimensi tunggal yang dapat dirujuk untuk berbagai tujuan dalam tabel fakta.

Contoh terbaik untuk dimensi bermain peran adalah tabel dimensi Tanggal karena atribut tanggal yang sama dalam suatu dimensi dapat digunakan untuk tujuan yang berbeda seperti tanggal pesanan, tanggal pengiriman, tanggal transaksi, tanggal pembatalan, dll. .

14 of 37

15 of 37

Jenis dari Dimensi (5)

5) Dimensi Degenerasi

Mungkin ada beberapa atribut yang bukan merupakan dimensi (metrik) atau fakta (ukuran) tetapi mereka membutuhkan analisis. Semua atribut seperti itu dapat dipindahkan ke dimensi yang merosot.

16 of 37

17 of 37

Jenis dari Dimensi (6)

6) Mengubah Dimensi Secara Perlahan

Dimensi yang berubah perlahan adalah jenis di mana data dapat berubah perlahan kapan saja daripada dalam interval reguler berkala.

  1. Ketik 1 SCD
  2. Dalam tipe 1 ketika ada perubahan nilai atribut dimensional, nilai yang ada ditimpa dengan nilai yang baru diubah yang tidak lain adalah pembaruan.
  3. Data lama tidak disimpan untuk referensi sejarah.
  4. Laporan sebelumnya tidak dapat dibuat ulang karena tidak adanya data lama.
  5. Mudah dirawat.
  6. Dampak pada tabel fakta lebih dari itu.

18 of 37

19 of 37

  1. Ketik 2 SCD
  2. Pada tipe 2, bila ada perubahan nilai atribut dimensional, baris baru akan disisipkan dengan nilai yang dimodifikasi tanpa mengubah data baris lama.
  3. Jika ada referensi kunci asing yang ada ke rekaman lama di salah satu tabel fakta, maka kunci pengganti lama akan diperbarui di mana saja dengan kunci pengganti baru secara otomatis.
  4. Dampak perubahan tabel fakta sangat kecil dengan langkah di atas.
  5. Data lama tidak dipertimbangkan dimanapun setelah perubahan.
  6. Pada tipe 2, kita dapat melacak semua perubahan yang terjadi pada atribut dimensional.
  7. Tidak ada batasan penyimpanan data historis.
  8. Dalam tipe 2, menambahkan beberapa atribut ke setiap baris seperti tanggal yang diubah, tanggal-waktu efektif, tanggal-waktu berakhir, alasan perubahan dan bendera saat ini adalah opsional. Tetapi ini penting jika bisnis ingin mengetahui jumlah perubahan yang dilakukan selama periode waktu tertentu.

20 of 37

21 of 37

  1. Ketik 3 SCD
  2. Pada tipe 3 ketika ada perubahan nilai atribut dimensional, nilai baru diperbarui tetapi nilai lama tetap valid sebagai opsi kedua.
  3. Alih-alih menambahkan baris baru untuk setiap perubahan, kolom baru akan ditambahkan jika tidak ada sebelumnya.
  4. Nilai lama ditempatkan pada atribut yang ditambahkan di atas dan data atribut primer ditimpa dengan nilai yang diubah seperti pada tipe 1.
  5. Ada batasan penyimpanan data historis.
  6. Dampak pada tabel fakta lebih dari itu.

22 of 37

23 of 37

  1. Ketik 4 SCD
  2. Pada tipe 4, data saat ini disimpan dalam satu tabel.
  3. Semua data historis disimpan di tabel lain.

24 of 37

  1. Ketik 6 SCD
  2. Tabel dimensi juga dapat memiliki kombinasi ketiga SCD tipe 1, 2 dan 3 yang dikenal sebagai Tipe 6 (atau) Hybrid yang secara perlahan mengubah dimensi.

25 of 37

Tabel Fakta

  • Tabel fakta menyimpan sekumpulan nilai yang diukur secara kuantitatif yang digunakan untuk penghitungan.
  • Nilai tabel fakta ditampilkan dalam laporan bisnis.
  • Berbeda dengan tipe data tekstual tabel dimensi, tipe data tabel fakta secara signifikan adalah Numerik.
  • Tabel fakta dalam sedangkan tabel dimensi lebar karena tabel fakta akan memiliki jumlah baris yang lebih tinggi dan jumlah kolom yang lebih sedikit.
  • Kunci utama yang ditentukan dalam tabel fakta terutama untuk mengidentifikasi setiap baris secara terpisah. Kunci utama juga disebut kunci komposit dalam tabel fakta.
  • Jika kunci komposit hilang dalam tabel fakta dan jika ada dua catatan yang memiliki data yang sama, sangat sulit untuk membedakan antara data dan untuk merujuk data dalam tabel dimensi.
  • Tingkat data terendah yang dapat disimpan dalam tabel fakta disebut Granularitas.
  • Dalam model dimensi, tabel fakta memelihara hubungan banyak ke banyak dengan tabel dimensi.

26 of 37

27 of 37

Jenis Fakta

1) Tabel Fakta Transaksi

  • Tabel fakta transaksi menyimpan data tingkat transaksi untuk setiap peristiwa yang terjadi.
  • Jenis data seperti itu mudah dianalisis di tingkat tabel fakta itu sendiri.
  • Untuk analisis lebih lanjut, kami juga dapat merujuk ke dimensi terkait.
  • Misalnya, setiap penjualan (atau) pembelian yang terjadi dari situs web pemasaran harus dimuat ke dalam tabel fakta transaksi.

28 of 37

29 of 37

Jenis Fakta

2) Tabel Fakta Snapshot Berkala

  • Data dalam tabel fakta snapshot berkala disimpan dalam bentuk snapshot (gambar) dengan interval berkala seperti untuk setiap hari, minggu, bulan, triwulan. dll. tergantung kebutuhan bisnis.
  • Misalnya, data laporan pendapatan kinerja apa pun dapat disimpan dalam tabel fakta snapshot untuk referensi mudah.

30 of 37

31 of 37

Jenis Fakta

3) Mengumpulkan Tabel Fakta Snapshot

  • Mengumpulkan tabel fakta snapshot memungkinkan untuk menyimpan data ke dalam tabel untuk seluruh masa pakai produk.
  • Ini bertindak sebagai kombinasi dari dua jenis di atas di mana data dapat disisipkan oleh peristiwa apa saja kapan saja sebagai snapshot.
  • Dalam jenis ini, kolom tanggal dan data tambahan untuk setiap baris diperbarui dengan setiap pencapaian produk itu.

32 of 37

33 of 37

Jenis Fakta

4) Tanpa fakta Tabel Fakta

Fakta adalah kumpulan tindakan sedangkan fakta kurang hanya menangkap peristiwa (atau) kondisi yang tidak berisi tindakan apa pun.

Tabel fakta tanpa fakta terutama digunakan untuk melacak sistem.

Data dalam tabel ini dapat dianalisis dan digunakan untuk pelaporan.

Misalnya, cari detail tentang karyawan yang mengambil cuti dan jenis cuti dalam satu tahun, dll. Dengan menyertakan semua detail fakta yang tidak jelas ini, tabel pasti akan menambah ukuran fakta.

34 of 37

35 of 37

Jenis Fakta

5) Tabel Fakta yang Sesuai

Fakta yang sesuai adalah fakta yang dapat dirujuk dengan cara yang sama dengan setiap data mart yang terkait dengannya.

36 of 37

Spesifikasi Tabel Fakta

  • Nama fakta: Ini adalah string yang menjelaskan fungsionalitas tabel fakta secara singkat.
  • Proses bisnis: Pembicaraan tentang bisnis perlu dipenuhi oleh tabel fakta itu.
  • Pertanyaan: Sebutkan daftar pertanyaan bisnis yang akan dijawab oleh tabel fakta tersebut.
  • Butir: Menunjukkan tingkat detail terendah yang terkait dengan data tabel fakta tersebut.
  • Dimensi: Buat daftar semua tabel dimensi yang terkait dengan tabel fakta tersebut.
  • Tindakan: Nilai terhitung disimpan dalam tabel fakta.
  • Frekuensi beban Merupakan interval waktu untuk memuat data ke dalam tabel fakta.
  • Baris awal: Mengacu pada data awal yang diisi dalam tabel fakta untuk pertama kalinya.

37 of 37