Как да преглеждате и редактирате метаданни в Ubuntu

Преглеждайте и редактирайте метаданни в Linux

Освен съдържанието, файловете, които създаваме или преглеждаме на компютъра си, съдържат и информация. известни като метаданни. В тази публикация ще видим как да преглеждаме и редактираме метаданни в Ubuntu.

Функцията на метаданните е да се опише, организира и даде контекст на файл, така че да е по-лесен за разбиране, търсене, класифициране и анализ.

За какво са метаданните?

Функции на метаданните

  • търсене: Файловият мениджър използва метаданни, за да ги покаже по азбучен ред, тип файл, дата на създаване или промяна.
  • организация: Метаданните улесняват организирането на големи количества информация.
  • разбиране:  Те помагат на автоматизирани системи като модели с изкуствен интелект, търсачки или библиотеки да разбират по-добре съдържанието

Видове метаданни

Можем да ги разделим на три класа:

  • Описателен: Данни, които идентифицират документа, като например заглавие, автор, описание и ключови думи.
  • Структурни: Как е структуриран документът: Заглавия, подзаглавия, глави, формат.
  • Административен персонал: Разрешения, дата на създаване, размер, формат.

Как да преглеждате и редактирате метаданни в Ubuntu

Има няколко графични инструмента за редактиране на метаданни, но в тази публикация ще се съсредоточим само върху тези, които използват терминала.

PDF

PDF документите са в следните формати:

  • Квалификация.
  • Автор.
  • Тема.
  • Ключови думи.
  • Дата на създаване
  • Дата на промяна.
  • Генераторен двигател.
  • Софтуер, използван за създаване.
  • Защити и разрешителни.

Съществува и друг формат, наречен XMP, който също включва тази информация:

  • Информация за авторските права.
  • Миниатюри.
  • Езици на документа.
  • Персонализирани етикети.

Има две полезни команди за преглед на метаданни в Ubuntu:

PDF информация

Инсталира се с:

sudo apt install poppler-utils

използвате:

pdfinfo nombre_archivo.pdf

PDF метаданни

Пример за командата PDFINFO

Exiftool

С този инструмент можем да видим метаданните във XMP формат.

Инсталира се с:

sudo apt install libimage-exiftool-perl

Употреба

exiftool nombre_archivo.pdf

Пример за метаданни във XMP формат

Пример за използване на програмата Exiftool

За редактиране на метаданни използваме командата
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
В нашия пример, ако искаме да преведем заглавието:

exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf

Метаданните за заглавието са променени с Exiftool

Командата Exiftool може да променя метаданните

Можем да изтрием всички метаданни с:

exiftool -all= nombre_archivo.pdf

В случай че съжаляваме, че сме го изтрили, командата създава копие на PDF файла и добавя уточнението „оригинал“ към името.

Docx

Основният формат на Word включва метаданни на документи и метаданни на приложения.

Метаданните на документа включват:

  • Квалификация.
  • Автор.
  • Последният човек, който го е променил.
  • Брой ревизии.
  • Дата на създаване.
  • Дата на последна промяна.T
  • Тема.
  • Ключова дума.
  • Категория.
  • Категория
  • Статус (Чернова, окончателен).

Метаданни за приложението

  • Шаблон
  • Използван софтуер.
  • Общ брой страници.
  • Брой думи.
  • Брой знаци.
  • Брой редове.
  • Брой параграфи.
  • Настройки за мащабиране.
  • Организация.
  • Име на ръководителя на екипа.

Exiftool

Командата Exiftool Може да се използва и за преглед на метаданните на Word документ.

Употреба

exiftool nombre_archivo.docx

Преглед на метаданни на Word документ

Командата exiftool може да се използва и за преглед на метаданни от Word документ.

Друг начин за преглед на метаданните е чрез промяна на файловото разширение на zip формат. От съображения за сигурност ще направим това с копие.

cp nombre_archivo.docx copia_archivo.zip

Разархивираме файла и отваряме необходимата ни папка

unzip copia_archivo.zip -d docxinfo

Четем данните от файловете

cat docxinfo/docProps/core.xml

За метаданните на документа

cat docxinfo/docProps/apdp.xml

За метаданните на приложението

cat docxinfo/docProps/app.xml

И двамата използват exiftool Можем ръчно да редактираме метаданните. Отново, процедурата с exiftool е същата като тази, която направихме в случая с PDF файловете.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Можем да направим същото ръчно, както следва:

Правим резервно копие

cp nombre_archivo.docx copia_archivo.zip

Разархивирахме го в папка, наречена метаданни.

unzip copia_archivo.zip -d metadatos

Да отидем в папката

cd metadatos

Отваряме редактора

nano docProps/core.xml
за метаданни на документа

nano docProps/apdp.xml за метаданни на приложението
Преопаковаме файла като docx

zip -r ../nombre_archivo2.docx *
Командата създава новия документ извън директорията. метаданни.