Освен съдържанието, файловете, които създаваме или преглеждаме на компютъра си, съдържат и информация. известни като метаданни. В тази публикация ще видим как да преглеждаме и редактираме метаданни в Ubuntu.
Функцията на метаданните е да се опише, организира и даде контекст на файл, така че да е по-лесен за разбиране, търсене, класифициране и анализ.
За какво са метаданните?
Функции на метаданните
- търсене: Файловият мениджър използва метаданни, за да ги покаже по азбучен ред, тип файл, дата на създаване или промяна.
- организация: Метаданните улесняват организирането на големи количества информация.
- разбиране: Те помагат на автоматизирани системи като модели с изкуствен интелект, търсачки или библиотеки да разбират по-добре съдържанието
Видове метаданни
Можем да ги разделим на три класа:
- Описателен: Данни, които идентифицират документа, като например заглавие, автор, описание и ключови думи.
- Структурни: Как е структуриран документът: Заглавия, подзаглавия, глави, формат.
- Административен персонал: Разрешения, дата на създаване, размер, формат.
Как да преглеждате и редактирате метаданни в Ubuntu
Има няколко графични инструмента за редактиране на метаданни, но в тази публикация ще се съсредоточим само върху тези, които използват терминала.
PDF документите са в следните формати:
- Квалификация.
- Автор.
- Тема.
- Ключови думи.
- Дата на създаване
- Дата на промяна.
- Генераторен двигател.
- Софтуер, използван за създаване.
- Защити и разрешителни.
Съществува и друг формат, наречен XMP, който също включва тази информация:
- Информация за авторските права.
- Миниатюри.
- Езици на документа.
- Персонализирани етикети.
Има две полезни команди за преглед на метаданни в Ubuntu:
PDF информация
Инсталира се с:
sudo apt install poppler-utils
използвате:
pdfinfo nombre_archivo.pdf
Exiftool
С този инструмент можем да видим метаданните във XMP формат.
Инсталира се с:
sudo apt install libimage-exiftool-perl
Употреба
exiftool nombre_archivo.pdf
За редактиране на метаданни използваме командата
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
В нашия пример, ако искаме да преведем заглавието:
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
Можем да изтрием всички метаданни с:
exiftool -all= nombre_archivo.pdf
В случай че съжаляваме, че сме го изтрили, командата създава копие на PDF файла и добавя уточнението „оригинал“ към името.
Docx
Основният формат на Word включва метаданни на документи и метаданни на приложения.
Метаданните на документа включват:
- Квалификация.
- Автор.
- Последният човек, който го е променил.
- Брой ревизии.
- Дата на създаване.
- Дата на последна промяна.T
- Тема.
- Ключова дума.
- Категория.
- Категория
- Статус (Чернова, окончателен).
Метаданни за приложението
- Шаблон
- Използван софтуер.
- Общ брой страници.
- Брой думи.
- Брой знаци.
- Брой редове.
- Брой параграфи.
- Настройки за мащабиране.
- Организация.
- Име на ръководителя на екипа.
Exiftool
Командата Exiftool Може да се използва и за преглед на метаданните на Word документ.
Употреба
exiftool nombre_archivo.docx
Друг начин за преглед на метаданните е чрез промяна на файловото разширение на zip формат. От съображения за сигурност ще направим това с копие.
cp nombre_archivo.docx copia_archivo.zip
Разархивираме файла и отваряме необходимата ни папка
unzip copia_archivo.zip -d docxinfo
Четем данните от файловете
cat docxinfo/docProps/core.xml
За метаданните на документа
cat docxinfo/docProps/apdp.xml
За метаданните на приложението
cat docxinfo/docProps/app.xml
И двамата използват exiftool Можем ръчно да редактираме метаданните. Отново, процедурата с exiftool е същата като тази, която направихме в случая с PDF файловете.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Можем да направим същото ръчно, както следва:
Правим резервно копие
cp nombre_archivo.docx copia_archivo.zip
Разархивирахме го в папка, наречена метаданни.
unzip copia_archivo.zip -d metadatos
Да отидем в папката
cd metadatos
Отваряме редактора
за метаданни на документа
nano docProps/core.xml
nano docProps/apdp.xml за метаданни на приложението
Преопаковаме файла като docx
zip -r ../nombre_archivo2.docx *
Командата създава новия документ извън директорията. метаданни.