Secara ringkasnya, data mart adalah gudang data yang terhad dalam skop dan datanya boleh diperoleh melalui meringkas dan memilih data dari gudang data atau dengan bantuan ekstrak, proses transformasi dan beban yang berbeza dari sistem data sumber.
Carta Perbandingan
Asas untuk perbandingan | Gudang Data | Data Mart |
---|---|---|
Asas | Gudang data adalah aplikasi yang bebas. | Data mart adalah khusus untuk aplikasi sistem sokongan keputusan. |
Jenis sistem | Sentralisasi | Decentralized |
Bentuk data | Terperinci | Diringkaskan |
Penggunaan denalisasi | Data sedikit dinormalisasi. | Data ini sangat dihormati. |
Model data | Top-down | Dari bawah ke atas |
Alam | Fleksibel, berorientasikan data dan jangka hayat. | Kehadiran, berorientasikan projek dan kehidupan yang singkat. |
Jenis skema yang digunakan | Konstitusi fakta | Bintang dan salji salji |
Kemudahan bangunan | Sukar untuk membina | Mudah untuk membina |
Definisi Gudang Data
Istilah gudang data bermaksud kumpulan masa, berorientasikan subjek, tidak dapat berubah, dan kumpulan data bersepadu yang membantu dalam proses membuat keputusan pengurusan. Sebagai alternatif, ia merupakan repositori maklumat yang dikumpul dari pelbagai sumber, disimpan dalam skema bersatu, di tapak tunggal yang membolehkan pengintegrasian pelbagai sistem aplikasi. Sebaik sahaja data ini dikumpulkan ia disimpan untuk masa yang lama, oleh itu ia mempunyai kehidupan yang panjang dan membenarkan akses kepada maklumat bersejarah .
Akibatnya, gudang data menyediakan pengguna dengan antara muka bersepadu tunggal kepada data yang mana pengguna boleh menulis pertanyaan sokongan keputusan dengan mudah. Gudang data membantu mengubah data menjadi maklumat. Merancang gudang data termasuk pendekatan atas ke bawah.
Ia mengumpulkan maklumat mengenai subjek yang merangkumi seluruh organisasi, seperti pelanggan, jualan, aset, barang, dan oleh itu rangkaiannya adalah seluruh perusahaan. Umumnya, skema konstelasi fakta digunakan di dalamnya, yang merangkumi pelbagai subjek. Gudang data bukan struktur statik dan ia sentiasa berubah .
Definisi Data Mart
Siaran data boleh dipanggil sebagai subset dari gudang data atau sub-kumpulan data seluruh korporat yang bersamaan dengan satu set pengguna tertentu. Gudang data melibatkan beberapa data jabatan dan data logik yang mesti berterusan dalam ilustrasi data mereka untuk memastikan kekukuhan gudang data. Data mart adalah satu set jadual yang menumpukan pada satu tugas yang dirancang dengan menggunakan pendekatan bawah.
Sebagai skema bintang dan snowflake didorong ke arah pemodelan subjek tunggal, itulah sebabnya ini biasanya digunakan dalam data mart. Walaupun, skema bintang lebih popular daripada skema salji salji. Bergantung pada sumber data, pangkalan data boleh diklasifikasikan kepada dua jenis: data berasaskan dependent dan independent .
Perbezaan Utama Antara Gudang Data dan Data Mart
- Gudang data adalah aplikasi bebas manakala data mart khusus kepada aplikasi sistem sokongan keputusan.
- Data disimpan dalam repositori tunggal, terpusat dalam gudang data. Sebaliknya, data mart menyimpan data secara mendalam di kawasan pengguna.
- Gudang data mengandungi bentuk data terperinci . Sebaliknya, data mart mengandungi data yang diringkaskan dan dipilih.
- Data dalam gudang data sedikit dinormalisasi sementara dalam kes Data mart ia sangat dihormati.
- Pembinaan gudang data melibatkan pendekatan atas ke bawah . Sebaliknya, semasa membuat data mart, pendekatan bottom-up digunakan.
- Gudang data adalah fleksibel, berorientasikan maklumat dan sifat lama yang sedia ada. Sebaliknya, data mart adalah terhad, berorientasikan projek dan mempunyai kewujudan yang lebih pendek.
- Skema konstitusi fakta biasanya digunakan untuk memodelkan gudang data sedangkan dalam skema bintang mart data lebih popular.
Kesimpulannya
Gudang data menyediakan pandangan perusahaan, sistem storan tunggal dan terpusat, seni bina dan aplikasi yang bebas sementara Data mart adalah sebahagian daripada gudang data yang menyediakan pandangan jabatan, storan terdesentralisasi. Oleh kerana gudang data sangat besar dan bersepadu, ia mempunyai risiko kegagalan dan kesukaran dalam membinanya. Sebaliknya, data mart mudah dibina dan risiko kegagalan yang berkaitan juga kurang tetapi data mart dapat mengalami pemecahan.