ذخیره سازی و مدیریت اطلاعات در جوامع امروز، از اهمیت بالایی برخوردار است و این امر سبب شده تا فناوری های متنوع و بسیاری برای پیاده سازی آن ایجاد شود که هریک دارای ویژگی ها و مزایای خاص خود هستند. دو مبحث مهم در این زمینه، پایگاه داده و انبار داده است که در ادامه به تشریح تفاوت آن ها می پردازیم.
انبار داده (Data Warehouse و یا به اختصار DW) پایگاه داده ای است که جهت ذخیره اطلاعات استفاده می شود و یک مخزن مرکزی ست که داده ها از منابع مختلف در آن تجمیع می گردند، سپس این اطلاعات جهت گزارشگیری و تحلیل های اطلاعاتی مورد استفاده قرار می گیرند. در مقایسه با آن، یک پایگاه داده (Database و یا به اختصار DB)، پایه هر مخزن اطلاعاتی و مجموعه ای سازماندهی شده از داده هاست.
یک پایگاه داده صرفا جهت ذخیره و دستیابی به اطلاعات استفاده می شود در حالیکه انبار داده غالبا جهت تسهیل گزارشگیری و تحلیل اطلاعات در مقیاس های کلان مدیریتی کاربرد داد و با نام «انبار داده تجاری» (Enterprise Data Warehouse) نیز شناخته می شود و می تواند گزارشاتی متنوع و پرطرفدار برای گزارشگیری های مدیریتی ایجاد کند، مانند مقایسه های فصلی و سالانه.
یکی از مهم ترین اهداف انبار داده ایجاد بستری مناسب برای کاربر جهت دسترسی آسان و انعطاف پذیر به اطلاعات است.
Data Warehouse به طور معمول ترکیبی از تعداد زیادی پایگاه داده در سراسر یک سازمان واحد است. این مجموعه، اطلاعات جاری و همچنین اطلاعات تاریخی Database های اصلی را ذخیره میکند.
تمامی این اطلاعات ذخیره شده در DW برای تفسیر و تهیه گزارشات مدیریتی مورد استفاده قرار می گیرند. این تحلیل ها و آنالیزهای صورت گرفته، به پیدا کردن ارتباطات (Relationships) بین داده ها و استخراج مفاهیم و نتیجه گیری هایی از داده ها کمک می کنند که در ادامه می توانند در تصمیم گیری های مدیریتی سازمان مربوطه، بسیار مفید و موثر باشند.
از سوی دیگر، یک پایگاه داده، پایه و بنیان ذخیره سازی اطلاعات است و به صورت مجموعه ای از داده های سازمان یافته، شکل می گیرد. در عملیات ذخیره سازی اطلاعات، داده ها از منابع مختلف جمع آوری شده به یک مکان واحد منتقل می گردند که این محل پایگاه داده است. این داده ها با ساختارهای خاصی شکل می گیرند و این ساختارها عمدتا وابسته به مدل پایگاه داده هستند.
رایج ترین مدلی که برای پایگاه داده استفاده می شود مدل ارتباطی (Relational Model) است، از دیگر مدل های دیتابیس می توان به مدل سلسله مراتبی (Hierarchical Model)، مدل شبکه ای (Network Model) و... اشاره نمود.
برای بازیابی داده ها از یک پایگاه داده، نیاز است تا از یک سیستم مدیریت پایگاه داده (Data Base Management System و به اختصار DBMS) استفاده شود. سیستم های مدیریت پایگاه داده برنامه های کاربردی هستند که با کاربر، برنامه های دیگر، و پایگاه داده خود، برای دریافت و آنالیز داده ها تعامل برقرار می کنند. ساختار DBMS ها به شکلی طراحی می شوند تا امکان تعریف و درج اطلاعات، ایجاد پرس وجو و گزارشگیری، به روزرسانی و مدیریت پایگاه های داده را برای کاربر فراهم آورند. از DBMS های رایج می توان به PostgreSQL، SQLite، Microsoft SQL Server، Microsoft Access، Oracle و... اشاره نمود.
در نگاه اول پایگاه داده و انبار داده ممکن است شبیه نظر برسند اما آن ها از یک جنبه کلیدی متفاوت هستند. یک Database فقط برای ذخیره سازی و دستیابی به داده ها استفاده می شود در حالی که بیشترین استفاده Data Warehouse برای تسهیل گزارشگیری و تجزیه و تحلیلهای آماری است.
اساسا، پایگاه داده جایی است که داده ها فقط ذخیره می شود. برای دسترسی به این داده ها یا تجزیه و تحلیل آن یک سیستم مدیریت پایگاه داده (DBMS) مورد نیاز است، درحالی که یک انبار داده لزوما نیاز به DBMS ندارد. هدف از انبار داده ها ایجاد یک دسترسی آسان به داده ها برای کاربر است. انبار داده همچنین ممکن است برای تجزیه و تحلیل اطلاعات استفاده شود. لازم به ذکر است که روند واقعی تجزیه و تحلیل اطلاعات، داده کاوی (Data Mining) نامیده می شود.
از دیگر تفاوت های پایگاه داده و انبارداده می توان به موارد زیر نیز اشاره نمود:
- یک پایگاه داده برای Online Transactional Processing (OLTP) استفاده می شود با این حال می تواند برای اهداف دیگری مانند انبار داده نیز مورد استفاده قرار گیرد.
- یک انبار داده برای Online Analytical Processing (OLAP) استفاده می شود و داده های تاریخی را برای کاربران جهت تصمیم گیری های تجاری جمع آوری می نماید.
- در پایگاه داده، جداول و پیوندها پیچیده هستند زیرا آنها برای Relational DataBase Management System (RDMS) نرمالسازی می شوند که این امر افزونگی را کاهش میدهد و فضای ذخیره سازی را بهینه میکند.
- در انبار داده ها، جداول و پیوندشان ساده هستند، زیرا آنها نرمالسازی نشده اند. این کار برای کاهش زمان پاسخ دهی به پرسش های تحلیلی انجام می شود.
- تکنیک های مدل سازی ارتباطی (Relational Modeling Techniques) برای طراحی پایگاه داده مورد استفاده قرار می گیرند، در حالی که تکنیک های مدل سازی (Modeling Techniques) برای طراحی انبار داده استفاده می شوند.
- یک پایگاه داده برای عملیات نوشتن بهینه شده است، در حالی که یک انبار داده برای عملیات خواندن بهینه شده است.
- در یک پایگاه داده، سطح عملکرد برای کوئری های آماری و تحلیلی بسیار کم است، درحالیکه یک انبار داده، از کارایی بالا برای گزارشگیری های تحلیلی برخوردار است.
- انبار داده یک قدم جلوتر از پایگاه داده است و دلیل آن استفاده از پایگاه داده در ساختار آن است.