Dokumenty PDF (nejen) v MIS

Dokumenty ve formátu PDF je pro MIS potřeba exportovat nebo tisknout[1] ze zdrojového formátu jako PDF-A (standard pro archivaci dokumentů ve formátu PDF)[2]. Tato volba je možná jak v plné verzi Acrobatu, tak ve většině jiných SW nástrojů, jimž je možno vytvářet dokumenty ve formátu PDF.[3]

Pokud dokument vložený do MIS nemá korektně vloženy použité fonty nebo je ve verzi PDF nekompatibilní s MIS, textový obsah dokumentu se při vkládání do MIS korektně nenačte (V MIS jsou v detailu dokumentu (textový obsah - na stránce detailu dokumentu nahoře) vidět divné znaky nebo dokonce vůbec žádné znaky). Korektní načtení textového obsahu PDF dokumentu je přitom důležité, protože MIS umožňuje jeho prohledávání při fulltextových dotazech.


Problém může být již ve zdrojovém dokumentu (většinou použití nevhodných fontů). Pro ověření lze použít testovací text např.:

Times New Roman PS MT - OT - česky:

Řádný občan šikovně s ďábelskou úporností slézá po průběžné žulové římsičce. Vůkol zuří smršť, v níž naň číhá daň.

Řádný občan šikovně s ďábelskou úporností slézá po průběžné žulové římsičce. Vůkol zuří smršť, v níž naň číhá daň.

Řádný občan šikovně s ďábelskou úporností slézá po průběžné žulové římsičce. Vůkol zuří smršť, v níž naň číhá daň.

Řádný občan šikovně s ďábelskou úporností slézá po průběžné žulové římsičce. Vůkol zuří smršť, v níž naň číhá daň.

Pro testovací text tedy použijeme všechny řezy příslušného písma. Soubor vyexportujeme nebo vytiskneme do PDF a vložíme jako neveřejný do MIS. V detailu dokumentu (textový obsah - na stránce detailu dokumentu nahoře) zkontrolujeme, zda jsou znaky načteny korektně.

Dokumenty PDF je před jejich vložením do MIS nutno zkontrolovat i co do korektně vyexportovaného obsahu a jejich vlastních metadat. V MIS dokument PDF totiž nemá náhled na na stránky, ale zobrazuje se ve výsledcích vyhledávání pouze jako ikonka. Na případné vady se tak přijde až při otevření dokumentu. Kontrola dokumentů tímto způsobem až v MIS se ovšem z pochopitelných důvodů časové náročnosti neprovádí a případně chyby lze odhalit je náhodně. Vedle chybně vytištěných stran, ilustrací a tabulek, jsou to velmi často vlastní metadata PDF dokumentu.:

Každý PDF dokument (stejně jako fotografie vkládané do MIS) má vlastní metadata. Ta, pokud nejsou uživatelem upravena, jsou vyplněna podle nastavení pro export resp. tisk v aplikaci, z níž exportujeme / tiskneme do PDF I v Adobe Readeru si můžete ověřit, jaké údaje jsou u dokumentu vyplněny ve vlastnostech dokumentu / document properties v oddíle popis / description. Nemusí (i když je pochopitelně lépe, jsou-li i metadata vlastního PDF dokumentu řádně vyplěnna) zde být vyplněno vše, ale neměly by zde být uvedeny údaje, které jsou v rozporu s obsahem dokumentu. 

Pozn.:

Oprava převzatých dokumentů PDF, které se nezobrazují korektně v MIS. 

Do této skupiny patří bohužel většina publikovaných vyhlášek MK a nařízení vlády.

Lze použít nástroje Acrobat Professional (verze 9.0 +):

(v menu pod Advanced / Preflight / PDF fixups)

Podmínkou úspěšné konverze je uložení fontů v dokumentu, který potřebujeme opravit.


obr.1: ukládání dokumentu Word jako PDF dialogem Uložit jako - Jiné formáty - v roletě vybrat PDF - tlačítko možnosti - předposlední položka Kompatibilní s normou ISO ...

obr. 2: Uložit jako - Adobe PDF - tlačítko Volby - druhé zatržítko odshora Vytvořit soubor kompatibilní …

obr. 3: uložení přes nástrojovou lištu Acrobat, nastavení předvoleb. V tomto případě si aplikace nastavení pamatuje.


[1] Tisk do PDF vyžaduje alespoň základní verzi Acrobatu s virtuální tiskárnou PDF Distiller.

Videotutotiál pro tisk i převod Acrobat 9.0 viz. http://www.jaknapdf.cz/?p=277.

Videotutoriál ověřování shody s PDF/A pomocí Acrobat 9 Pro viz.: http://www.jaknapdf.cz/?p=281

[2] Ke standardu PDF/A viz. http://www.pdfa.org/doku.php?id=pdfa:en:pdfa_whitepaper podrobnosti viz. : http://www.pdfa.org/doku.php?id=pdfa:en:articles; http://www.adobe.com/enterprise/standards/pdfa/; základní info česky: http://cs.wikipedia.org/wiki/PDF/A

[3] Aplikace sady Microsoft Office 2007 umožňují také ukládat (exportovat) dokumenty do PDF podle ISO standardu PDF/A-1b. Tato vlastnost však není součástí základní verze této sady, nýbrž je obsažena až v jejím oficiálním samostatném rozšíření Save as PDF or XPS (stažitelném na http://www.microsoft.com/downloads/en/details.aspx?FamilyID=f1fc413c-6d89-4f15-991b-63b07ba5f2e5), jež je také součástí vydání 2. servisního balíčku aktualizací (Microsoft Office Service Pack 2 dostupné na http://www.microsoft.com/downloads/en/details.aspx?FamilyID=b444bf18-79ea-46c6-8a81-9db49b4ab6e5).

Postup exportu:

Uložit jako -> Adobe PDF -> Možnosti -> Vytvořit soubor kompatibilní s normou ISO 19005 (PDF/A), resp. zatržítko Kompatibilní s formou...podle cesty ukládání. JE TŘEBA ZATRHNOUT VŽDY ZNOVA. Existují dvě varianty postupu uložení, viz obrázky 1 a2 níže.

Pokud máte spolu s MS Wordem instalován i Adobe Acrobat (jakékoli verze) tak v předvolbách, karta nastavení je totéž ve čtvrtém zatržítku (Vytvořit ….vyhovující PDF/A). viz obrázek 3.