От вчера, 24 февруари 2025 г., най-важната онлайн книжарница не ни позволява да изтегляме книги на компютъра си, за да ги прехвърлим на друго устройство. В тази публикация ще видим как да продължите да изтегляте книги от Amazon. Уточнявам, че ще мамим. Това не е изтегляне на самата книга, а скрипт, който прави екранни снимки и програма, която разпознава текста.
Ясно е, че не насърчаваме нашите читатели да нарушават правилата и условията или законите за интелектуална собственост. Но има случаи, като моя, тъй като страдам от зрителни увреждания, в които опциите за конфигурация на четеца на Amazon не са подходящи и трябва да можем да правим модификации.
„Защо не могат да се изтеглят повече книги на компютъра?
Това, което трябва да разберете е, че с услуги като Amazon ние не купуваме книгата, а правото да я прочетем.. Компанията си запазва правото да изтрива или променя съдържанието. През 2009 г. английските версии на 1984 y Въстание във фермата от хиляди устройства, защото издателят не е имал правата за публикуване. Миналата година Puffin Books, англоезичният издател на много книги на Роалд Дал, преработи емблематични заглавия като Матилда y Чарли и шоколадовата фабрикаи да ги направи по-политически коректни чрез безпроблемно премахване на думи като „дебел“ и „грозен“ от устройствата на купувачите.
Ако Amazon продължи да позволява изтегляне на компютъра, потребителят може да възстанови идеално оригинала. Сега, ако Безос реши да спечели обичта на Тръмп, като промени името на Мексиканския залив на Американския залив в Атласа, който сте купили, тогава ще трябва да се примирим с това.
Тази стъпка се отнася само за изтегляне на книгата на вашия компютър за прехвърляне на друго устройство; можете да продължите да я изтегляте от вашия четец Kindle на вашия компютър за използване с него.
Как да продължите да изтегляте книги от Amazon
Това, което ще направим, е да използваме облачен четец на електронни книги от Amazon и скрипт, който прави екранна снимка, автоматично обръща страницата и повтаря процеса. Ще инсталираме две програми. Xdotools и Scrot
sudo apt install xdotool scrotA
Xdotoll симулира поведението на мишката, Scrot се грижи за екранните снимки.
Сега трябва да направим следното:
- Ние отваряме четеца в облака.
- Избираме книгата, която искаме да изтеглим и я отваряме.
- Кликнете върху буквите в горния ляв ъгъл и изберете оформлението с 1 колона. Това улеснява последващото разпознаване на текста.
- Без да затваряме браузъра, отваряме терминала, намаляваме размера му и го поставяме от лявата страна на екрана.
- Пишем
xdotool getmouselocation
и без да натискаме enter преместваме показалеца до бутона за обръщане на страници на четеца Kindle - Натискаме Enter.
- Вземаме под внимание стойностите X и Y, показани от терминала.
След това ще създадем скрипта, който ще прави екранните снимки. В текстовия редактор поставяме това.
#!/bin/bash
while [ 1 ]; do
xdotool mousemove XXXX YYY click 1 &
scrot -q 100 '%Y-%m-%d-%H:%M:%S.png' -e 'mv $f ~/libro/'
sleep 20
done
Този скрипт поставя показалеца на мишката в позицията на бутона за промяна (Трябва да замените X и Y със стойностите, които сме записали, да промените страницата, да направите снимките и да изчакате 20 секунди, за да повторите процеса.
Записваме го с името script.sh
Създаваме папката с книгата с командата:
mkdir libro
Отваряме книгата в браузъра и в минимизирания терминал пишем
./script.sh
Поставяме браузъра на цял екран и чакаме да приключи заснемането на последната страница. Когато приключим, трябва да затворим терминала.
Сега инсталираме програмата, от която се нуждаем, за да комбинираме изображенията в pdf
sudo apt install img2pdf
За да направим преобразуването, използваме следната команда:
find . -name "*.png" -print0 | sort -z | xargs -0 img2pdf -o libro.pdf
Възможно е във времето, което ви е отнело да затворите предишния скрипт, да е имало повторно улавяне, така че е препоръчително да се уверите, преди да изпълните командата.
За да конвертирате pdf в текст, най-добрият начин е да използвате Google документи. Качваме файла, щракваме върху пунктираната линия, за да отворим менюто за файлове и в Отворете с Google Документи. Това автоматично извършва разпознаване на символи, които можете да запишете в odt или pdf формат.
Може да се направи и от командния ред но няма да работи добре със сложни дизайни.
Ние инсталираме програмите
sudo apt install ocrmypdf tesseract-ocr tesseract-ocr-spa
Преобразуваме PDF в текст с командата:
ocrmypdf -l spa libro.pdf libro_ocr.pdf