سؤال كيف يمكنني تقليل حجم ملف ملف PDF ممسوح ضوئيًا؟


لدي ملف PDF بحجم 72.9 ميجابايت أحتاج إلى تقلصه إلى أقل من 500 كيلوبايت.

كان الملف عبارة عن صورة بتنسيق JPEG تم مسحها ضوئيًا ، ثم تم تحويلها إلى ملف pdf.


294
2018-03-16 17:12


الأصل


يعتمد ذلك على ما يستهلك المساحة ... بحاجة إلى مزيد من المعلومات. يمكن أن يساعدك ضغط مساحة الصورة ، ولكن إذا كنت تحاول استخدام ملف كومة كبير ، فلن ينجح ذلك. بحاجة ماسة إلى مزيد من المعلومات. - RobotHumans
تحويله إلى DjVu ، بدلا من ذلك محاولة للحد من حجم PDF المستحيل (حسب المصدر) - zetah
كان الملف صورة jpeg قمت بمسحها ضوئيًا ، ثم تم تحويلها إلى ملف pdf. - tamimym
يبدو فقط للمساعدة في الملفات قليلا ، ولكن pdfopt يحتوي على بنية بسيطة ويحسن سرعة التحميل والصفحة في عصر iPad. :-) - Ari B. Friedman
PDF إلى PS ليست فعالة في ملف PDF الممسوحة ضوئيًا ، أحاول تحويل ملف PDF بحجم 56 ميجا بايت إلى ملف ps ولكن تحويل ملف ps إلى 1.3 جيجا بايت ومرة ​​أخرى يتم تحويل ملف ps2pdf في ملف 45 ميجابايت


الأجوبة:


aking1012 هو الصحيح. مع مزيد من المعلومات حول الصور المضمنة الممكنة ، والارتباطات التشعبية الخ. سيكون من الأسهل بكثير الإجابة على هذا السؤال!

فيما يلي بعض البرامج النصية وحلول سطر الأوامر. استخدم على النحو الذي تراه مناسبا.


119
2018-03-16 17:28



شكرا جزيلا لاقتراحاتكم ، وعملت قذيفة ghostscript عجائب وانكمش إلى 460KB :) - tamimym
هذا ليس صحيحا بالضرورة. إذا كان المحتوى قد انتقل من صورة إلى نص ، فهذا أمر أكثر من سهل. [هذا بافتراض أن النص مقدس بدقة] - monksy
نوصي باستخدام البرنامج النصي shrinkpdf.sh ، يمكنك تخصيص الرمز لاستخدام قيمة ppi التي تريدها (72 بشكل افتراضي) والوصول بالضبط إلى الملفات التي تحتاجها للتضحية بأقل جودة. هذا جعلني قادراً على تحميل مستند ممسوح ضوئيًا يبلغ 11 ميغابايت بحد أقصى حجم 3 ميغابايت دون أن تفقد الكثير من الجودة. - Severo Raz
يعمل shrinkpdf عظيم! - AmanicA
أدى الرابط الأول ، مع إعداد "/ ebook" ، إلى تقليل حجم الملف الممسوح ضوئيًا بمقدار 19 ميغابايت إلى 4.2 ميغابايت ، ويظل النص الممسوح ضوئيًا قابلاً للقراءة. - dremodaris


استخدم ما يلي غوستسكريبت أمر:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf
  • -dPDFSETTINGS=/screen أقل جودة ، حجم أصغر. (72 نقطة في البوصة)
  • -dPDFSETTINGS=/ebook للحصول على جودة أفضل ، ولكن pdf أكبر قليلاً. (150 نقطة في البوصة)
  • -dPDFSETTINGS=/prepress إخراج مماثل لإعداد Acrobat Distiller "Prepress Optimized" (300 نقطة في البوصة)
  • -dPDFSETTINGS=/printer يختار إخراج مشابه لإعداد Acrobat Distiller "الطباعة المحسنة" (300 نقطة في البوصة)
  • -dPDFSETTINGS=/default يختار الإخراج المراد أن يكون مفيدا عبر مجموعة واسعة من الاستخدامات ، ربما على حساب ملف الإخراج الأكبر

407
2018-02-15 13:53



يمكن للمرء أيضا جعل البرنامج النصي Nautilus للوصول إلى هذه الوظيفة لكل ملف. - Sina
يجب أن يكون هذا هو الجواب المقبول. ghostscript هو ال تنفيذ PDF و XPS و PS للوحدات ويمكن أن يفعل كل شيء بشكل أساسي لتقديم أفضل جودة ... - dom0
Sina: يوجد بالفعل برنامج Nautilus Script مع واجهة مستخدم بسيطة تستند إلى Zenity والتي تستخدم هذا الأمر gs مع جميع خيارات مستوى الجودة: launchpad.net/compress-pdf - Sadi
هذه هي الإجابة الصحيحة لهذا السؤال (ضغط ملف PDF هو في الغالب بيانات نقطية). لقد وجدت أن screen كان الإعداد منخفضًا جدًا بالنسبة لي ، ولكن ebook عملت بشكل جيد ، وقطع 33 ميغابكسل القائم على المسح الضوئي أسفل إلى 3.6Mb ، ​​والحفاظ عليها مقروء للغاية. خيارات اخرى لل -dPDFSETTINGS يتم سرد الخيار هنا: milan.kupcevic.net/ghostscript-ps-pdf، وقد يكون من الأفضل تضمينها في هذه الإجابة. - naught101
gs معلمات التكوين المتاحة: ghostscript.com/doc/current/Ps2pdf.htm - Antonios Hadjigeorgalis


الطريقة المفضلة للقيام بذلك هي تحويل pdf إلى ps والعودة. ومع ذلك ، فإنه لا يعمل دائمًا ، ولكن عندما تعمل النتائج تكون جيدة:

ps2pdf input.pdf output.pdf

هذا أيضا يعمل مباشرة على قوات الدفاع الشعبي ، كما هو مقترح في التعليقات.


123
2018-01-16 09:18



هذه طريقة بسيطة وفعالة للقيام بذلك. لقد فوجئت بمعرفة حجم هذه الطريقة في ضغط الملفات. شكرا لك! - Gabriel
على الرغم من حقيقة أن هذا النهج أصبح الحل المفضل لضغط ملفات pdf ، فإنه يقطع روابط رابط قد تحتوي عليها الوثيقة (والتي لا تحدث مع نهجMichael D). وبصرف النظر عن ذلك ، الذهول هو كل ما يمكنني التفكير في تشغيل هذا المقتطف! (: - Rubens
Rubens Ah. لم يكن يعرف عن حقيقة أنه يكسر روابط رابط. شكرا لإضافة ذلك. - don.joey
هذا يتجاوز حماية كلمة المرور ... فقط قل " - jojo
سيأخذ ps2pdf ملفات pdf كمدخلات ، بحيث يمكنك القيام بذلك في خطوة واحدة: ps2pdf intput.pdf output.pdf - frabjous


اذا كان لديك قوات الدفاع الشعبي مع الصور الممسوحة ضوئيا، يمكنك استخدام convert لإنشاء قوات الدفاع الشعبي مع ضغط jpeg (يمكنك استخدام هذه الطريقة في أي ملف pdf ، ولكنك ستفقد كل المعلومات النصية).

فمثلا:

convert -density 200x200 -quality 60 -compress jpeg input.pdf output.pdf

يعدل كثافة (على سبيل المثال ، 100x100) و جودة لاحتياجاتك.

اعتمادا على المدخلات الخاصة بك JPEG ضغط قد لا يكون الخيار الأفضل بسبب عناصر الضغط. لديك الخيار بين BZip أو الفاكس أو Group4 أو JPEG أو JPEG2000 أو Lossless أو LZW أو RLE أو Zip كطرق ضغط بديل (بعضها يسمح فقط بصور b / w). لمزيد من التفاصيل انظر هنا.

تمكنت من تحقيق نسب ضغط كبيرة للمستندات الممسوحة ضوئيًا / المصورة (اعتمادًا على الإعدادات). اعتمادًا على مصدر المستند ، قد ترغب في تقليل عمق اللون (-depth جدال).


106
2018-05-19 17:39



للحصول على مستند ممسوح ضوئيًا حيث يكون النص هو ما يهمك بدلاً من ذلك ، فإن الصور وعمق الحفظ ليس مشكلة ، فإن ضغط jpeg ليس فكرة جيدة لأن القطع الأثرية تميل إلى أن تكون ملحوظة للغاية. إذا كنت تستخدم pdfimages input.pdf pages لاستخراج ملفات pbm ، فيمكنك القيام بشيء ما مثل: for page in *.pbm; do convert $page -compress Group4 -type bilevel TIFF:- | convert - output.pdf. سيتم فقدان أي OCR لذلك عادة ما أفعل ذلك pdfsandwich output.pdfوالذي يبدو أنه يقلل حجم الملف أكثر من ذلك. - Brian Z
@ brianZ بالتأكيد jpeg ضغط ليس دائما أفضل خيار ، ولكن بالنسبة لي كان أفضل نهج للمستندات مختلطة النوع. أضفت بعض المعلومات حول طرق الضغط الأخرى للإجابة. - someonr
هذه الطريقة تستخدم في نهاية المطاف gs خلف الكواليس. - alfC
اضطررت إلى استخدام شرطة مزدوجة للحصول على خيارات لتشغيل الأمر --density --quality --compress ضد -density -quality -compress. - Rotareti
إذا لم تكن qaulity الصورة هي الأكثر إثارة للقلق (وترغب فقط في الحصول على هذا المرفق عبر البريد الإلكتروني صغير بما يكفي ليتم إرساله) قد يضيف -resize 50% أيضا ، تغيير النسبة تبعا لمقدار استخدام DPI أثناء المسح - chrki


كنت بحاجة إلى تقليل حجم ملف PDF يحتوي على عمليات تفحص بالألوان الكاملة للمستند. كل صفحة من صفحاتي كانت صورة ملونة كاملة بقدر ما يتعلق الأمر بالملف. كانت صورًا لصفحات تحتوي على نص وصور ، ولكن تم إنشاؤها عن طريق المسح الضوئي إلى صورة.

استخدمت مزيجًا من الأمر ghostscript أدناه وواحدًا من سلسلة محادثات أخرى.

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dDownsampleColorImages=true \
-dColorImageResolution=150 -dNOPAUSE  -dBATCH -sOutputFile=output.pdf input.pdf

هذا تقليل دقة الصورة إلى 150 نقطة في البوصة ، وقطع حجم ملفي إلى النصف. بالنظر إلى الوثيقة ، لم يكن هناك أي فقدان ملحوظ لجودة الصورة. لا يزال النص قابلاً للقراءة تمامًا على Nexus7 لعام 2012.


30
2018-01-19 06:25



إجراء 1+ لخفض عينات العينات ولكن مع الاحتفاظ بالنص كمتجهات. صنع اختلاف كبير في الجانب دون جعل النص الخاص بي pixelated. - Jason O'Neil


هنا هو السيناريو لإعادة كتابة pdfs الممسوحة ضوئيا:

#!/bin/sh

gs  -q -dNOPAUSE -dBATCH -dSAFER \
    -sDEVICE=pdfwrite \
    -dCompatibilityLevel=1.3 \
    -dPDFSETTINGS=/screen \
    -dEmbedAllFonts=true \
    -dSubsetFonts=true \
    -dColorImageDownsampleType=/Bicubic \
    -dColorImageResolution=72 \
    -dGrayImageDownsampleType=/Bicubic \
    -dGrayImageResolution=72 \
    -dMonoImageDownsampleType=/Bicubic \
    -dMonoImageResolution=72 \
    -sOutputFile=out.pdf \
     $1

يمكنك تخصيصه قليلاً لجعله أكثر قابلية لإعادة الاستخدام ، ولكن إذا كان لديك ملف pdf واحد فقط ، فيمكنك استبداله $1 مع اسم ملف pdf الخاص بك ، وثقب في محطة.


24
2017-08-31 20:29



يعمل علاجًا ، شكرًا أولي. لقد أجبت كثيرا كل شيء لقد طلبت هنا حتى الآن: - د - Rob Cowell
هذا هو إجابة جيدة ولكن في حالتي على الأقل يأخذ قطعة أرض الوقت لتحويل ملف PDF كبير إلى حد ما (> 10 ميغابايت) (أكثر من دقيقة). - Gabriel
لست متأكدًا مما يحدث ، ولكن ينتج عن ملف PDF بحجم 30 ميغابايت ملفًا بحجم 68 ميغابايت. بدلا من الحد ، فإنه يكبر. نفس الإخراج في حالة استخدام ps2pdf مباشرة كما هو مذكور في الإجابة التالية. - Ed Villegas
EdVillegas الشيء الوحيد الذي يمكنني التفكير فيه (لشرح هذا النوع من الزيادة) هو أن الصور ذات دقة أقل من تلك التي يتم إنشاؤها (72 نقطة في البوصة). أو بطريقة أو بأخرى تضمين الخطوط هو امتصاص الكل الخطوط. - Oli♦


عادة ما أستخدم ps2pdf للقيام بذلك (بناء الجملة الأسهل) ، شيء من هذا القبيل:

ps2pdf -dPDFSETTINGS=/ebook BiggerPdf SmallerPDF

يمكنني استخدام البرنامج النصي python التالي لتقليل حجم كافة ملفات pdf في dir في خادم إنتاج (8.04). لذلك يجب أن تعمل.

#!/usr/bin/python

import os

for fich in os.listdir('.'):
        if fich[-3:]=="pdf":
                os.system("ps2pdf -dPDFSETTINGS=/ebook %s reduc/%s" % (fich,fich))

15
2017-09-01 07:26



شكرا على الحل البديل. جربت Oli الأولى وأعطتني النتيجة التي احتجت إليها ، لكني سأبقيها للرجوع إليها في المستقبل أيضًا. - Rob Cowell
-dPDFSETTINGS = / خيار الطابعة تقوم بتغيير 50٪. الكتاب الاليكتروني القيام 90 ٪ حجمها. - neouyghur


  1. أنا أستعمل LibreOffice Draw لفتح ملف pdf.
  2. ثم "تصدير كـ pdf"
  3. وتعيين "جودة ضغط JPEG" إلى 50 ٪ و "دقة الصورة" ل 150 نقطة في البوصة

هذا سيكون له نتيجة جيدة.


13
2018-06-14 09:59



أسوأ حل ممكن للمشكلة! لقد أفسدت ملفي تمامًا! - ThatIs