תהליך האתחול של Raid
Jan 28, 2022מערכת ה-RAID היא אמצעי יעיל להגנה על נתונים מפני נתונים מאוחסנים. בתהליך יצירת ה-RAID, יש לעתים קרובות תהליך אתחול המערכת ארוך מאוד. מדוע ישנה פעולה כזו בתהליך אתחול RAID? אילו היבטים יהיו לפעולה זו ב-SSD? בואו ננתח וללמוד את תהליך אתחול RAID מנקודת מבט של פיתוח טכנולוגי.
המבנה הארגוני הבסיסי של מערך RAID מסורתי הוא שכל הדיסקים המתווספים לקבוצת RAID מחולקים לסדרה של פרוסות על סמך כתובות ה-LBA שלהם. פרוסות אלו נקראות Stripe Units. יחידות פס המתאימות לאותן כתובות LBA בדיסקים שונים מאורגנות ל-Stripe. קידוד כל הנתונים ברצועה אחת, כגון RAID6 המייצר שני בלוקי נתונים מקודדים P ו-Q, מאפשר להשחתת שני דיסקי הנתונים בו-זמנית.
לכן, במערכת ה-RAID כל הנתונים ברצועה צריכים לעמוד בכללי הקידוד והאלגוריתם של הדק, כלומר כל הנתונים ברצועה יכולים לייצר נתוני קידוד לפי כללים מסוימים, ונתוני הקידוד זהים ל- נתוני הקידוד המאוחסנים ברצועה. המצב הזה נקרא הנתונים באותה רצועה. כאשר דיסק נכשל, ניתן לשחזר את בלוקי הנתונים האבודים על ידי הנתונים המקודדים המאוחסנים ברצועה.
אם הנתונים ברצועה אינם עקביים, כלומר, תוצאת הקידוד שהתקבלה על ידי הנתונים ברצועה אינה זהה, אז ברגע שדיסק נכשל, לא ניתן לשחזר כראוי את בלוק הנתונים החסר על ידי הנתונים המקודדים המאוחסנים ברצועה. לכן, רצועה של חוסר עקביות בנתונים שתגרום לבעיות תקינות הנתונים כאשר התקלה מתרחשת.
בעת יצירת מערכת RAID, הדיסק בקבוצת RAID עשוי להיות דיסק חדש או דיסק נתונים שכבר נעשה בו שימוש, כאשר כל הנתונים לא יהיו אפס. במקרה זה, רצועות הנתונים שנבנו עם דיסקים אלו לא אמורות לענות על הצורך של עקביות נתונים. כלומר, נתוני הקידוד בכל פס המחושבים לפי כללים מסוימים אינם עולים בקנה אחד עם נתוני הקידוד בפס. פסים לא עקביים כאלה יציגו סיכון גדול לבעיה של נכונות נתוני RAID.
מסיבה זו, בעת יצירת RAID, עליך לשקול אתחול כל הרצועות במערכת כדי להבטיח את עקביות הנתונים ברצועות. אתחול הלהקה יכול להיפתר בדרך כלל בשתי דרכים:
1. מאתחל את כל הרצועות במערכת ה-RAID על ידי כתיבת האפס הכולל. כל רצועת אפס הנתונים, נתוני הבדיקה שלו הם גם אפס. לכן, נתוני אפס יכולים להבטיח עקביות הרצועה.
2. בדוק את כל הרצועות ועדכן את נתוני הבדיקה ברצועות כדי להשיג את העקביות של נתוני הרצועות.
כאשר מערכת RAID מאותחלת, הנתונים בכל הפסים יהפכו לעקביים. תהליך אתחול מערכת RAID הוא תהליך ארוך מאוד, בעיקר בגלל הצורך לאתחל את כל הפסים במערכת. איזון הביצועים בין ה-IO של המשתמש הקדמי, ולכן אתחול מערכת RAID הוא לרוב תהליך ביצוע ברקע, שיימשך זמן רב וישפיע על הביצועים של יישומי קצה.
עבור SSDS, תהליך האתחול של מערכת RAID מציג גם בעיות אחרות. במהלך אתחול המערכת, יש לכתוב נתונים ל-SSDS, לא משנה במצב עדכון נתונים אפס כתיבה או זוגיות. תהליך זה גורם להגדלת כתיבת נתונים מיותרת. לפני כתיבת נתוני משתמש, נוצרת טבלת מיפוי נתונים בתוך ה-SSD באמצעות אתחול. חיי השירות והביצועים של SSDS מופחתים. לכן, מערכת RAID עבור SSDS צריכה להיות מותאמת לתהליך אתחול המערכת, שהיא תכונה מיוחדת שה-RAID המסורתי אינו לוקח בחשבון. לכן, מערכי RAID מסורתיים לא ניתנים לפריסה ישירה על SSDS, מה שמשפיע על חיי השירות והביצועים של SSD.
מערכות RAID משתמשות ב-Striping כדי להגן על נתונים, אך שורה של בעיות מוצגות גם בתהליך הגנת הנתונים. אתחול המערכת היא בעיה אופיינית של עקביות רצועות. מערכת טובה להגנה על נתונים RAID תפתור בעיה זו במהלך תהליך התכנון. לדוגמה, ל-EMC Data Domain RAID אין את תהליך אתחול המערכת, כמובן, הוא צריך לשתף פעולה עם מערכת הקבצים, ועשה הרבה אופטימיזציה בהפצת רצועת RAID.