كيفية عمل Data Deduplication

Data Deduplication هي ميزة في نظام التشغيل ويندوز سيرفر مصممة لتوفير المساحة عن طريق إزالة البيانات المكررة من الملفات المخزنة. بدلاً من تخزين نفس البيانات مرارًا وتكرارًا، يتم تخزين نسخة واحدة من البلوك المكرر، ويتم استبدال النسخ الأخرى بمؤشرات إلى النسخة الوحيدة. فيما يلي شرح تفصيلي لعملية Data Deduplication وكيفية عملها في ويندوز سيرفر:

 

كيفية عمل Data Deduplication



كيفية عمل Data Deduplication

 

1.       تقسيم البيانات إلى بلوكات:

·         تقوم ميزة Data Deduplication بتقسيم الملفات إلى بلوكات صغيرة من البيانات. هذه البلوكات عادةً تكون بحجم ثابت (عادةً 32-128 كيلوبايت) أو متغير اعتمادًا على إعدادات النظام.

2.       تجزئة البيانات:

·         يتم حساب تجزئة (hash) لكل بلوك من البيانات باستخدام خوارزمية تجزئة مثل SHA-256. التجزئة هي تمثيل فريد للبيانات الموجودة في البلوك.

3.       مقارنة التجزئات:

·         يتم مقارنة التجزئات المحسوبة لكل بلوك مع التجزئات المخزنة بالفعل في قاعدة بيانات Deduplication. إذا تم العثور على تجزئة مطابقة، فهذا يعني أن البيانات مكررة.

4.       تخزين البيانات الفريدة:

·         البلوكات التي تكون لها تجزئة فريدة (أي ليست مكررة) يتم تخزينها في المخزن العادي للبيانات.

5.       استبدال البيانات المكررة بمؤشرات:

·         البلوكات المكررة لا يتم تخزينها مرة أخرى، بدلاً من ذلك، يتم تخزين مؤشر يشير إلى الموقع الأصلي للبلوك الفريد. هذا المؤشر يكون صغير الحجم جدًا مقارنة بتخزين البلوك المكرر.

 

المكونات الأساسية لـ Data Deduplication

 

1.       Optimization:

·         عملية التحليل والدمج، حيث تقوم بفحص الملفات وتحديد البلوكات المكررة واستبدالها بمؤشرات.

2.       Garbage Collection:

·         عملية تنظيف، تقوم بحذف البيانات غير المستخدمة أو التي لم تعد هناك حاجة إليها من المخزن الخاص بـ Deduplication.

3.       Scrubbing:

·         عملية تحقق من سلامة البيانات، تتأكد من أن البيانات المخزنة لم تتعرض لأي تلف أو خطأ.

 

أنواع Deduplication

 

1.       Post-Processing Deduplication:

·         يتم تنفيذ Deduplication بعد كتابة البيانات إلى القرص. هذا يسمح للبيانات بأن تكون متاحة فورًا للقراءة والكتابة بدون تأخير.

 

2.       In-line Deduplication:

·         يتم تنفيذ Deduplication في الوقت الحقيقي أثناء كتابة البيانات إلى القرص. هذا النوع يستهلك موارد أعلى ولكنه يوفر الفضاء بشكل أسرع.

 

الفوائد

 

1.       توفير المساحة:

·         تقليل حجم البيانات المخزنة على الأقراص مما يوفر مساحة تخزينية كبيرة.

2.       تحسين الأداء:

·         على الرغم من أن Deduplication يتطلب بعض الموارد الإضافية، إلا أنه يمكن أن يحسن الأداء من خلال تقليل كمية البيانات التي يتم نسخها ونقلها.

 

3.       إدارة سهلة:

·         يمكن إدارة وتكوين Deduplication بسهولة عبر أدوات الإدارة المتاحة في ويندوز سيرفر مثل PowerShell و Server Manager.

 

التكوين والإعداد

 

1.       تثبيت ميزة Deduplication:

    يمكن تثبيت ميزة Data Deduplication عبر Server Manager أو باستخدام PowerShell:

      PowerShell

     

Install-WindowsFeature -Name FS-Data-Deduplication

      

2.       تكوين Deduplication على حجم محدد:

   يمكن تكوين Deduplication على حجم معين باستخدام PowerShell:

   PowerShell

     Enable-DedupVolume -Volume "D:" -UsageType Default

 

3.       جدولة مهام Deduplication:

   - يمكن جدولة المهام المختلفة مثل Optimization وGarbage Collection باستخدام PowerShell:

     PowerShell

    

Set-DedupSchedule -Name "Optimization" -Type Optimization -Days Mon,Wed,Fri -Start 02:00  

 

4.       DurationHours

باستخدام Data Deduplication في ويندوز سيرفر، يمكنك تحقيق توفير كبير في المساحة التخزينية وتحسين كفاءة إدارة البيانات.






















google-playkhamsatmostaqltradent