أداة Google Book Scraper، التي أنشأها shloop، تقوم بأتمتة جمع صفحات المعاينة من Google Books للقراءة والبحث في وضع عدم الاتصال. تعمل الأداة كبرنامج نصي من سطر الأوامر يقوم بجلب صور الصفحات الفردية وتجميعها في ملف PDF واحد. تركز على سير عمل بسيط يمكن برمجته مع معالجة متسلسلة وتحويل الصور إلى PDF. الباحثون والطلاب والأرشيفيون الذين يشعرون بالراحة مع البرمجة الأساسية يحصلون على أرشفة سريعة وقابلة للتكرار لمحتوى المعاينة المرئي للدراسة والاستشهاد.
ما الذي يفعله الكاشط وكيف يعمل
الكاشط هو أداة سطر أوامر تعتمد على بايثون تسترجع صور الصفحات من معاين جوجل للكتب وتحولها إلى ملف PDF واحد، باستخدام مكتبات مثل requests لجلب الصور وimg2pdf للتحويل. يستهدف عناوين فردية بواسطة معرف الكتاب ويعالج الصفحات بشكل متسلسل بحيث تبقى الصفحات الناتجة في الترتيب الصحيح. قاعدة الشيفرة مفتوحة المصدر، لذا يمكن للمستخدمين فحص السكربتات التي تقوم بخطوات التنزيل والتجميع.
كيف تؤثر عادةً على الموارد المحلية أثناء التشغيل
نظرًا لأن الأداة تعمل تحت مفسر بايثون بدون واجهة رسومية، فإن ملفها الشخصي للموارد يتناسب مع تنفيذ السكربت بدلاً من تطبيق كامل. تحدث نشاطات الشبكة أثناء تنزيل الصور، وتركز نشاطات المعالج والقرص المحلي أثناء خطوة تحويل الصورة إلى PDF. المعالجة المتسلسلة تتجنب التنزيلات المتزامنة، مما يقلل من ارتفاعات المعالج والشبكة المتوازية ولكن يطيل الوقت الإجمالي للتشغيل للمعاينات الكبيرة.
هل من الآمن استخدامها على محطة عمل وما الأذونات التي تحتاجها
تأتي السلامة في الممارسة من الشفافية: يسمح المستودع مفتوح المصدر بمراجعة الشيفرة قبل التنفيذ، والسكربت يصل فقط إلى الصفحات المرئية في المعاينة على الويب، لذا لا يمكنه جلب المحتوى غير المعاين. يتطلب اتصالاً بالإنترنت وبيئة بايثون 3.x مع التبعيات المذكورة مثبتة، مما يعني أنه يجب على المستخدمين منح أذونات الشبكة وكتابة الملفات لحفظ ملف PDF المجمع على القرص.
من يمكنه تشغيله بدون مخاطر وما مستوى المهارة الذي يساعد
تفترض الأداة الألفة مع سير العمل عبر سطر الأوامر وبعض البرمجة الأساسية؛ تحديد معرف الكتاب من عنوان URL لجوجل للكتب هو جزء من خطوة الإعداد. إنها متعددة المنصات حيثما تعمل بايثون 3.x، مما يجعلها مناسبة للباحثين الفنيين والأرشيفيين الذين يفضلون المهام القابلة للتكرار والبرمجة بدلاً من الأداة الرسومية. تشير تعليقات المجتمع على GitHub إلى أنها تعمل بشكل موثوق للمستخدمين المريحين مع هذه الخطوات.
خيار عملي للباحثين الفنيين، موصى به مع تحذير إعداد صغير
المسح هو خيار عملي للباحثين الذين يحتاجون إلى نسخ غير متصلة بالإنترنت يمكن تكرارها من صفحات المعاينة المرئية، بشرط أن يكونوا قادرين على تشغيل سكريبتات بايثون وتثبيت التبعيات. توقع منحنى تعلم معتدل لتشغيل سطر الأوامر وإدارة التبعيات، وتحقق من المخرجات على معرف كتاب واحد قبل معالجة عدة عناوين. موصى به.
المميزات
قاعدة الشيفرة مفتوحة المصدر تسمح بالتدقيق والتعديل
يؤتمت تحميل الصور صفحة بصفحة وتجميع PDF
المعالجة المتسلسلة تحافظ على ترتيب الصفحات الصحيح
العيوب
يتطلب Python 3.x ومكتبات محددة للتشغيل
تتطلب عمليات سطر الأوامر معرفة أساسية بالبرمجة النصية
لا يمكن استرجاع الصفحات التي تتجاوز المعاينة المرئية
تختلف القوانين الخاصة باستخدام هذا البرنامج من بلد لآخر. نحن لا ننصح باستخدام هذا البرنامج ولا نقر استخدامه إذا كان ذلك مخالفًا لهذه القوانين. قد تحصل Softonic على رسوم إحالة إذا قمت بالنقر على المنتجات المعروضة هنا أو شرائها.