מסד נתונים הוא כלי המשמש לאחסון נתונים בצורה מאורגנת כדי לאסוף נתונים לשמירת מידע והיסטוריה. אם הנתונים מאורגנים היטב, קל לשלוף את הנתונים המבוקשים ולבצע חישובים וניתוחים. מסד הנתונים צריך להיות בנוי לפי הגיון מסוים, בהתבסס על מודל רלוונטי.
סוגי מסדי נתונים
מסדי נתונים הנפוצים ביותר בנויים מטבלאות שונות - "מסד נתונים טבלאי". בסיס הנתונים נקרא "מסד נתונים טבלאי" כאשר הטבלאות השונות יכולות להיות מקושרות אחת עם השניה באמצעות מזהה המפתחות. על מנת לבצע ניתוחים, צריך לשלב מידע מטבלאות שונות (או רק אחת), באמצעות פונקציות פשוטות ומורכבות, שנכנסות לתוך זרימת תהליך העיבוד.
בסיס נתונים טבלאי
- מסדי נתונים יחסיים בנויים מטבלאות שונות. המפתחות משמשים לקשר בין הטבלאות.
- כל טבלה מייצגת סוג של נתונים לדוגמה: פרטים הספקים, איכות פריט וכו'
- כל טבלה בעלת מספר הרשומות (שורות) שבו כל רשומה מתייחסת למקרה ספציפי
- לכל רשומה יש שדה אחד או יותר (עמודות) כגון כתובת הספק. כולם יחד יוצרים את הרשומה
- לכל רשומה בדרך כלל יש מפתח ראשי. המפתח הראשי הוא מזהה ייחודי של תיעוד, כגון תעודת זהות הספק.
גם המפתח המשני זמין, כגון המדינה (המפתח המשני הוא לא ייחודי כמו ספקים, אולם זה יכול לעזור לצמצם את הרשימה בטבלה כאשר מחפשים ספק מסוים). במקרים מסוימים אין מפתח ראשי כדי לזהות את הרשומה; במקרה זה ניתן להשתמש במפתח מורכב. "מפתח מורכב" הוא שילוב של "מפתחות משניים" מרובים או שדות כדי לזהות באופן ייחודי את הרשומה.
כיוון שמבנה נתונים יכול להכיל רשומות רבות, תרשים דיאגרמה משמש להציג את הקשרים בין טבלאות בצורה חזותית (באמצעות המפתח הראשי, או על ידי מפתחות זמינים אחרים). היחסים יכולים להיות:
- 1 לרבים - רשומה אחת יכולה להיות מקושרת לרשומות רבות
- 1-1-רשומה אחת קשורה לרשומה אחת בלבד
תכנון וניתוח מסד נתונים
לפני יצירת מסד נתונים חדש, חשוב מאוד להתחיל את הניתוח מהסוף. כלומר, להבין מה הוא התוצר הסופי המבוקש. תכנון טוב לוקח בחשבון שינויים עתידיים אפשריים.
נקח דוגמה לתהליך MRB במחלקת איכות. נניח קיום השלבים הבאים בתהליך MRB:
- פריט נדחה בקו הייצור
- MRB נפתח
- פריט מועבר למחסן לתיקון
- הפריט נשלח אל הספק כדי לתקנו או נחשב פסול
- אם הפריט נשלח ספק, הוא חוזר למחסן לאחר בתיקון
הצעדים לעיל יכולים להימצא בטבלה אחת או יותר. תיעוד המידע שלהם, למשל "איכות לפי פריט" , כולל כמה פריטים משלב 1. האחריות לנזק (המשתמש או הספק), כמות ועלות, אולם זה אינו מציג את שם הספק, אשר ניתן למצוא בדוח אחר, אשר מציג את כמות הפריטים הכוללת שנדחתה לפי שם הספק. דוח נוסף מציג את מספר ההערות MRB.
אם דיווחים אלה משולבים לתוך מסד אחד, ניתן לייצר ניתוחים רבים ולגלות דפוסים רבים, לקבל מידע חדש שאינו זמין בדוח נפרד, אך זמין כאשר הדוחות מאוחדים. איסוף מידע לאורך זמן יוסיף מימד נוסף של מגמות.
להלן כמה דוגמאות ניתוח:
א) ניתוח לפי ספק:
- מספר פריטים שנדחתו על ידי הספק
- זמן תיקון במספר ימים, הפריט אצל הספק לתיקון
- הצגת התוצאות הספק לעומת (benchmark) כל השאר
- עלות תיקון
- המפתח הראשי יהיה מספר הספק בכל הדוחות. שימוש במפתח זה מאפשר לאחד נתונים בתצוגה אחת
ב) ניתוח לפי פריט:
- תדירות דחיית פריט
- זמן ממוצע לתיקון פריט
- המפתח הראשי יהיה מספר הפריט. מפתח מורכב (item_month) ישמש כדי לאפשר ניתוח לאורך זמן
ג) ניתוח זמן מחזור
- מדידת הזמן הכולל, מהיום בו הפריט נדחה בקו הייצור ועד ליוםחזרתו של אותו חלק למחסן לאחר בתיקון
- ניתוח זמן שהייה אצל הספק, איזה חלק הוא "במעבר" ואיזה חלק הוא עדיין במחסן
- ניתוח זה יכול להתבצע רק אם מסד נתונים נוצר ומידעים רלוונטיים אוחדו, כולל נתונים היסטוריים, כדי לאפשר ביצוע חישובים הדרושים
תכנון וביצוע של תרגיל כזה ידרוש את הפעולות הבאות:
שלב 1: ניתוח תוצר סופי מבוקש ו / או KPI שרוצים למדוד
שלב 2: איתור דוחות הזמינים במערכת שיכולים לתמוך במידע הדרוש בשלב 1
שלב 3: מיפוי הדוחות. כלומר ליצור טבלאות לפי דו"ח ולתאר את שדות הזמינים בדוח
שלב 4: זיהוי כל המפתחות האפשריים
לדוגמא: בעזרת איחוד הטבלאות 1 ו- 2, ניתן ללמוד על דחייה הפריט לפי הספק

שלב 5: לשלב את כל הטבלאות לתוך מסד נתונים אחד (לא יחסי) ולהתחיל לאסוף מידע היסטורי של כל אחד
שלב 6: יצירת "טבלת סיכום", לאחד רק את המידע המדויק שנדרש לחישובים
שלב 7: יצירת תהליך עבודת ניתוח. ממשקי משתמש עבור ייבוא נתונים מקבצי נתונים וחישוב מדדים. בסוף התהליך ניתן לייצא את הנתונים המעובדים להצגה בצורה ויזואלית
