بغرض تقليص الملفات, تستخدم معظم برامج ضغط الملفات عدة قواميس من المتواليات
" فيما بشير " القاموس " إلى المنهج المستخدم في فهرسة أجزاء المعطيات تختلف أنظمة
ترتيب القواميس لكن طريقة إنشائها سهلة وتشبه عملية ترقيم الجداول. وعند استعراض مقولة
" كينيدي” الشهيرة يمكن اختيار الكلمات المتكررة ووضعها في فهرس مرقم ومن ثم كتابة الرقم
عوضاً عن كتابة الكلمة كلها. وهكذا سيكون لدينا القاموس التالي :
لام
وبالتالي سيصبح بالإمكان قراءة الجملة على الشكل التالي "128567341 .0012345678"
عند معرفة طريقة عمل النظام سيصبح من السهل إعادة بناء العبارة الأصلية باستخدام القاموس.
وهذا تماماً ما يفعله برنامج فك ضغط الملفات عندها يعيد توسيع الملف الذي بجري تنزيله. ومن
ناحية أخرى فإن بعض الملفات المضغوطة تتوسع من تلقاء نفسها. ولإنشاء هذا النوع من
الملفات بقوم المبرمج بتضمين الملف المضغوط برنامج توسيع بسيط بعيد الملف آلياً إلى شكله
الأصلي حالما يتم تنزيله. لكن ما مقدار المساحة التي تم توفيرها مع هذا النظام؟ إن" 001
11 .2345678" ” وبالتأكيد أقصر من " تملا تهدابب كام .تملاء0) عل /جتتصسف سوب تهطاي 101 كافظ
00 0107لا 07 00 80ع”, ومن المهم عدم نسيان الحاجة إلى حفظ قاموس الضغط مع الملف. إن
احتساب مستلزمات ملف ما في مخطط ضغط حقيقي ستكون معقدة بعض الشيء ولكن بالعودة
إلى الفكرة القاتلة بن كل حرف أو فراغ يأخذ واحدة قياس واحدة من الذاكرة لوجدنا فورا بأن
العبارة كاملة ستحتل/79 / وحدة من الذاكرة فيما ستأخذ الجملة المضغوطة( بما فيها الفراغات)
/ 7 / وحدة والقاموس( الذي يتضمن الكلمات والأرقام) سيأخذ أيضاً/37 / وحدة مما سيجعل
حجم الملف الإجمالي/74 / وحدة وبالتالي لا يوجد تقليل ملموس لحجم الملف
لكن تبقى هذه جملة واحدة فقط ! ويمكن لنا تخيل ما يمكن لبرامج الضغط فعله في حال العمل
على بقية خطاب كينيدي حيث سنجد هذه الكلمات بالتأكيد بالإضافة إلى كلمات كثيرة أخرىق
بالتالى سعيد البرنامج كما سنرى لاحقاً كتابة القاموس الخاص بذلك النص للحصول على تنظيم
أكثر فاعلية
البحث عن الأنماط :
في المثال الأنف الذكر قمنا باختيار كل الكلمات المكرّرة ووضعناها في القاموس وكانت هذه
الطريقة بالنسبة لنا الأوضح لكتابة القاموس لكن برنامج الضغط يرى الأمر بشكل مختلف تماماً
فهو لا يحتوي على أي مفهوم عن الكلمات المنفصلة وإنما يبحث عن الأنماط فقط . ويقوم
البرنامج باختيار بعناية لتضمينها في القاموس ليقلل من حجم الملف قدر الإمكان . في حال
التعامل مع العبارة المثال من هذا المنظور سيتم التوصل إلى قاموس مختلفة كلياً عندما يقوم
برنامج ضغط الملفات بتفحص عبارة كينيدي فأول ما سيظهر بشكل متكرر")ا5ة 0001لا1 002 001"
هنالك نمط متكرر يمثل في الحرف"! " متبوعا بفراغ بين الكلمتين”001 "و" 031 " . وفي حال
قيام برنامج الضغط بكتابة هذه المعلومة في القاموس يمكن كنابة القيمة /1/ في كل مرة بكون
فيها الحرف"؟ " متبوعاً بفراغ . لكن هذا النمط لا يتكرر بشكل كاف في هذه العبارة القصيرة لجعل
كتابة هذا المدخل في القاموس مجدياً وبالتالي فإن البرنامج سيمحو هذا النمط
"وفي حال كانت هذه الوثيقة أطول فإن كتابة هذا النمط في القاموس سيوفر الكثير من المساحة
في العمل على هذه الجملة فإنه سيكتشف بسعة خياراً أفضل ليكون مدخلاً للقاموس . لا نتكرر_
التركيبة اللغوية" نه " فقط وإنما كامل الكلمتين ”#ن9لا "و"/00010» " ؛ وفي الواقع فهما تتكرران معاً
كعبارة واحدة "لاتتصناف «ناولا "
وفي هذه الحال سيمحو البرنامج مدخل القاموس الخاص ب"نه " لبحل مكانه مدخل آخر هو"
وبالتالي فإن البرنامج سيعد كتابة"رتاصتام ناولا " لتكون .00010" فقط ومن ثم كتابة مدخل
منفصل بخص"00لا 202 00 80 " . ويستمر البرنامج بالعمل بهذه الطريقة ليختار كل الأجزاء المتكررة
من المعلومات ليقرر بعدها الأنماط التي تجب كتابها في القاموس . وتمثل هذه المقدرة على
إعادة الكتابة في القاموس الجزء" المتكيف" من قواميس المتواليات الحسابية المتلائمة مع"7ا "
والطريقة التى يقوم بها البرنامج بعمل ذلك معقدة بعض الشيء
ل لد اقسية كمرة للمنهج المستخدم حيث باستطاعة نظام البحث المتعيق ضغط الخلف
بفاعلية أكبر بكثير من طريقة انتقاء الكلمات التي استعرضناها سابقاً. عند استخدام الأنماط
المذكورة أعلاه وإضافة "" لتمثل الفراغات سيكون لدينا قاموس اكبر على الشكل التالي
وبالتالي جملة أصغر: " 12345- 1001-2345 " . تحتل هذه الجملة/18 / وحدة من الذاكرة قيما
سيأخذ القاموس/41 / وحدة . وهكذا جرى ضغط الحجم الكلي من/79 / وحدة إلى/59 /وحدة
وتمثل هذه الطريقة واحدة فقط لضغط العبارة وقي ليست بالضرورة الطريقة الأكثر
فاعلية. سنستعرض الآن بعضاً من الطرق التي قد تختلف فيها نسبة الضغط.
مقرا الأشسذيب:
وبطريقة مبسطة يمكننا تلخيص ما سبق:
في الصورة المتواجدة لدينا بيانات قمنا بتمثيلها على النحو الاتي من اعلى لأسفل “7 وحدات حمراء ؟ خضراء و ١ زرقاء
بمجموع 6 وحدات .
البينات وتمثيلها ستصبح البيانات على الشكل.
فكما لاحظت استطعنا ضغط “7 وحدات حمراء و 7 وحدات خضراء فيما الوحدة الزرقاء بقيت على حالتها الاصلية وإذا ما
اردنا ان نجمع عدد الوحدات سنجد نفس النتيجة 7 وحدات لكن تم تمثيلها بشكل مختلف ؛ لتكون بذلك هذه هي فكرة
مثال عملي
قم بإنشاء مجلد جديد ضع ملفا مثلا حجمه حواي ؛ ميغا وليكن ملف وورد او 06م او ملف فيديو.... الخ
ثم قم بنسخ الملف ولصقه في نفس المكان عدة مرات بحيث يصبح لديك حوالي 7٠١ نسخة منه
الان قم بضغط المجلد الحاوي على هذه الملفات باستخدام ١ م(2او 1/0/1088 بشرط تطبيق خاصية الارشيف
الصلب . ع/1«ل+2 50110 06018 و ستحصل على ملف بحجم اصغر من حجم ملف واحدا!!!!!!!!
قلو مثلا كان ملفك الاصلي © ميغا ونسخته ٠٠١ مرة فستحصل على 000 ميغا من الملفات لكن بعد ضغطها سيتحول
الملف الى © ميغا او اقل و الكلام صحيح في حال كانت الملفات متشابهة و ليست نفس النسخة؛ فكلما زاد التشابه في
الملفات كلما صغر حجم الملف المضغوط.
مثال آخر :
الملف صغيرا جدا بسبب وجود الكثير من النصوص والملفات المشتركة في كل صفحة جرب و ستفهم (*_+*)
ملخص الموضوع:
كلما زاد التشابه في الملفات كلما صغر حجم الملف الناتج و كلما زاد الاختلاف كلما زاد الحجم
ويصعب على برامج الضغط غير المنقوص مثل 10/08/88 أن تضغط الملفات الصوتية والفيديو نظراً للطريقة المعقدة
لطرق أخرى لضغط الفيديو والصوتيات؛ متل تحويل ملفات) /«و/ن الصوت الخام) إلى 03م أو ملفات :ع/رج| |1162
الصوتية ذات الحجم الصغير؛ رغم أننا نفقد جزء كبير من جودة الصوت. ومثل استخدام صيغة 1/006 بالنسبة للفيديو
لضغط الفيديو الخام ,81/1
طريقة برووما
بالنسبة للضغط المنقوص؛ لا تحصل على نفس الملف بعد عملية الضغط بل يكون أقل جودة ولكن أقل حجماً. وهذا النوع
من الضغط هو المستخدم لضغط الصور والملفات الصوتية والفيديو.
على عكس الطريقة الاولى في إعادة تمثل البينات فإن اسلوب 10057 يقوم بحذف البيانات من الملف من اجل تقليل حجمه
وهذا بالفعل ما تلاحظه عندما تقوم بضغط صورة معينة ببعض البرامج حيث ان جودة الصورة تكون ضعيفة جدا وذلك
بحذف بعض البيانات المكملة كيف ؟
مثلا لدينا الصورة اسفل كما ستلاحظ فإن جودة الصورة تتلاشى تدريجيا من اليسار الى اليمين وهذا راجع الى
استعمال اسلوب ,05م الاخير الذي قام بحذف بعض الألوان ذات الدقة
غير ذلك نفس العملية غالبا ما تعتمد عليها بعض برامج الملفات الصوتية المضغوطة والتي تعمل على ضغط ملف صوتي
من ١ ميغا الى 0٠7 كيلوبايت عن طريق حذف بعض الموجات الصوتية الغير مسموعة بالنسبة للإنسان
أي هناك بعض الاصوات الموجودة في مقطع الصوت او الفيديو لا يسمعها الانسان أي ان ترددها اقل من التردد الطبيعي
للإنسان ويقوم بتميز هذه الاصوات برامج ضغط الملفات كذالك هناك اصوات تكون متداخلة ولكن عند الاستماع اليها هناك
اصوات تطغى على اصوات اخرى لذلك يقوم برنامج الضغط كذلك بحذفها لتقليل حجم الملف
عدم عمل برامج ضغط الملفات مع بعض الملفات:
عادةً ما يلجاً المستخدم إلى برنامج 210 لتصغير حجم الملفات الكبيرة للغاية؛ إلا أن هذا البرنامج لا يعمل مع بعض صيغ
ويحذر البروفيسور هارالد غورل؛ المتخصص في أنظمة التشغيل وهندسة الكمبيوتر بجامعة الجيش الألماني بمدينة ميونيخ»؛
قائلاً :”قد يودي ضغط الملفات في أسواً الحالات إلى زيادة حجمها”؛ لأن بعض الصيغ؛ مثل ملفات الموسيقى 1/03 والصور
6 والفيديو 1/00]6؛ تكون مضغوطة بالفعل؛ وعندئذ لا يمكن تصغير حجمها حتى مع استخدام أفضل البرامج لضغط
وعلى الجانب الآخر تعمل برامج ضغط الملفات بصورة جيدة عند الرغبة في تصغير حجم البرامج أو المستتدات؛ إلا أن
ملفات م00 لا يتم تصغيرها إلا بدرجة ضئيلة.
وأوضح البروفيسور هارالد غورل طريقة عمل برامج ضغط الملفات؛ بأنها تقوم بالبحث عما يسمى بالأنماط المتكررة؛ أو
سلاسل العلامات؛ التي تظهر كثيراً في الملفات؛ ثم تقوم بدمجها مع بعضها البعض وبالتالي يقل طول العلامات ويتقلص معه
حجم الملف أيضاً وكلما تمكن البرنامج من التعرف على الأنماط المتكررة بصورة أفضل؛ يظهر الملف المضغوط بحجم أقل؛
ويقول الخبير الألماني :*ونظراً لذلك تظهر اختلافات في الجودة بين البرامج”.
فوائد برامج ضغط الملفات:
ضغط الملفات لتصغير حجمها أو لأرسالها دفعة واحدة دون الحاجة إلى إرسال كل ملف منفصل .
إنشاء الملفات المضغوطة الذاتية الاستخراج .
إصلاح الملفات المضغوطة التالفة .
إمكانية فتح ملفات تصاوير أقراص ال 60 مثل 50ا و 8100 و 601 و1186
المحافظة على الملفات من الديدان .
هناك فرق بين الفيروسات (100565/ا) والديدان (0/00005/) فالاثنان عبارة عن برنامجين كأي برنامج على جهاز
الكمبيوتر والفرق وهو أن الأولى حين تصيب ملفات جهاز كمبيوتر بطريقة اعتيادية فهي تقوم بتنفيذ المطلوب منها أثناء
البرمجة وفقط )سواء كانت برمجت على مسح محتويات بارتيشن معين أو عمل فورمات له أو للهارديسك كله أو ..
آخر متصل بالكمبيوتر مثل الفلاش أو الفلوبي ديسك أو جهاز آخر متصل عبر شبكة محلية أو .......الخ (با.
لفات المستخدم ..ولعل أغلب أنواع الديدان بمجرد ان و بك فإنها تنتشر في كافة مجلداته في كافة
أقسامه ا أكثر أنواع الملفات شيوعاً وهو 6*8 والذى يمتل غالبا سورسات البرامج (5010:685 (5109180)
وهنا فينصح بضغط أي ملفات هامة لها هذا النوع من الملفات للحفاظ عليها من الفيروسات والديدان حيث يصعب إن لم
يستحيل اختراق الفيروس لها وهى مضغوطة.
إلى أي حد يمكن اعتبار هذا النظام جيداً ؟ تعتمد نسبة تقليل الملف على عدة عوامل منها نوع
الملف وحجمه ومنهج الضغط
في معظم لغات العالم تظهر بعض الأحرف والكلمات معاً في أنماط معينة وتنضغط ملفات
النصوص بشكل ممتاز بسبب هذه النسبة العالية من التكرار. وتعتبر نسبة 9650 أو أكثر نموذجية
بالنسبة للملفات النصية جيدة الحجم وتحتوي معظم لغات البرمجة الكتير من التكرار لأنها
تستخدم مجموعة صغيرة نسبياً من الأوامر التي غالباً ما تعمل معاً بشكل أنماط بالمقابل لا
يمكن ضغط الملفات التي تحتوي الكثير من المعلومات الفريدة( الغير متكررة) كثيراً . مثل ملفات
الجرافيك أو1003 باستخدام هذا النظام لأنها لا تكرر العديد من الأنماط0/010/.12:1005.20:01/ل
في حال احتوى الملف على العديد من الأنماط المتكررة فإن نسبة التخفيض تزداد طرداً مع كبر
حجمه. يمكن رؤية ذلك بتفحص مثالنا فإذا كن لدينا المزيد من خطاب كينيدي سنتمكن من
العودة إلى الأنماط الموجودة في القاموس بشكل أكبر وبالتالي تخفيض حجم الملف 1
أيضا , إن انبثاق أنماط أكثر استخداماً سيتيح إنشاء قاموس أكثر فاعلية. تعتمد هذه الفاعلية أيضا
على المتواليات الحسابية المجّددة التي يتم استخدامها في برنامج الضغط حيت بجري تصميم
بعض البرامج خصيصاً لاختيار الأنماط في أنواع معينة من الملفات وبالتالى ضغطها بإيجاز اكبر .
فيما بحتوي البعض الآخر من البرامج على قواميس ضمن القواميس والذي من شأنه زيادة فعالية
ضغط الملفات الكبيرة فقط بطبيعة الحال. وبينما تعمل كل برامج الضغط من هذا النوع اعتماداً
على نفس الفكرة الأساسية إلا أن هناك مقداراً من الاختلاف في كيفية التطبيق
وسيبقى المبرمجون يحاولون دائماً وضع نظام أفضل
الخسارة وعدمها:
يطلق على نوع الضغط الذي جرى استعراضه هنا " الضغط بدون خسارة" . وذلك لأنه يبسمح
بإعادة إنشاء الملف الأصلي تماماً كما كان . إن مبداً" الضغط بدون خسارة" مبني على فكرة
تقسيم الملف إلى أجزاء" أصغر" يبغرض نقلها أو تخزينها ومن ثم إعادة تجميعها على الطرف الآخر
مما بسمح بإعادة استخدامها من جديد. يعمل " الضغط بخسارة" بطريقة مختلفة تماما تقوم
هذه البرامج وببساطة بحذف الأجزاء " الغير ضرورية" من المعلومات مما بجعل الملف أصغر
٠ يستخدم أسلوب الضغط هذا كثيراً للتقليل من حجم الملف مع صور" 010080 " والتي تنحو
لتكون ضخمة بعض الشيء . ولمعرفة آلية حدوث ذلك لا بد من معرفة الكيفية التي بضغط بها
الحاسب صورة ما. لا يستطيع برنامج" الضغط بدون خسارة" فعل الكتير مع هذا النوع من
الملفات. وفيما تبدو أجزاء كبيرة من الصورة متشابهة .السماء بكاملها زرقاء على سبيل المثال
فإن الأجزاء الصغيرة المكوّنة لها تختلف بشكل طفيف مع بعضها البعض ؛ ولجعل هذه الصورة أصغر
دون تشويه دقتها لا بد من تغيير القيم اللونية لبعض الأجزاء فإذا كانت الصورة سماء كبيرة زرقاء
اللون فإن البرنامج سبختار لوناً واحداً أزرق يمكن استعماله مع كل الأجزاء ؛ تم يعيد البرنامج
كتابة الملف بحيث تستند القيمة اللونية لكل جزء من السماء على تلك المعلومة . وإذا عمل
منهج الضغط بشكل جيد فلن يستطيع أحد ملاحظة الفرق فيما سينخفض حجم الملف بشكل
طبعاً لايمكن استرجاع الملف الأصلي كما هو بعض ضغطه باستخدام" الضغط بخسارة" وانما
ستحصل على تصوّر برنامج الضغط لذاك الملف. ولهذا السبب لايمكن استخدام هذا النوع من
المعطبات وخطابات التن