Porditav dokumendivorming
| Vajab täiendamist. |
Portable Document Format ehk PDF on PostScriptil põhinev arvuti riist- ja tarkvaraplatvormist sõltumatu elektrooniliste dokumentide vorming. PDF-failist on saanud üldlevinud dokumendivorming, mida kasutatakse peamiselt virtuaalse paberina, trükiettevalmistuses ja dokumentide arhiveerimiseks.

Formaat on avaldatud 1993. aastal Adobe poolt, ent praegusel ajal haldab PDF-i standardit ISO tehniline komitee nr 171,[1] mille alamkomitee nr 2 juhtivaks osaks on ka rahvusvaheline koostööorganisatsioon PDF Association, mis koondab suurt hulka vormingu kohta käivat oskusteavet ja teaduslikke uuringuid, samuti aitab välja töötada kõiki standardi arendusega seotud tehnilisi aspekte.[2]
PDF on kinnitatud rahvusvahelise ISO standardiga ISO 32000-2:2020 (PDF 2.0)[3], mis avaldati 2020. aastal ning on ühtlasi standardi hiljutisim versioon.
PDF-ist on välja töötatud ka mitmeid funktsionaalsuselt eriotstarbelisi failitüüpe, millest mõned on samuti ISO poolt standardiseeritud. Näiteks, PDF/X ISO 15930[4] sätestab trükiettevalmistuseks sobilikku PDF-faili rahvusvahelise standardi, PDF/A ISO 19005[5] sätestab nõuded dokumentide arhiveerimiseks sobiliku PDF-failitüübi jaoks.
2023. aastal teatas PDF Association, et tänu suurimate failivorminguga seotud firmade sponsorlusele võimaldatakse edaspidi kõigil soovijatel ISO 32000-2:2020 standardi dokumenti tasuta alla laadida.[6]
Ajalugu
[muuda | muuda lähteteksti]PDF-vormingu loomine on tihedalt seotud kontoritehnoloogia arengusuundadega 1980. aastate lõpus. 1984. aastal avaldas Adobe programmeerimiskeele PostScript, mis võimaldab süsteemideüleselt kirjeldada dokumendilehekülje omadusi, ning see leidis peagi laialdast rakendust ettevõtete ja kirjastajate juures laserprinterite töökvaliteedi ja ühilduvuse suurendamiseks.[7]
Kiire tehnoloogiline areng toitis ka tulevikuvisiooni “paberivabast kontorist”, mis innustas arendajaid, nagu Adobe asutaja John Warnock, suunama rohkem tähelepanu digitaalsele dokumendihaldusele trükitarkvara asemel.[7]
Seoses erinevate tootjate ja operatsioonisüsteemide suure levikuga oli tekkinud praktiline vajadus ühtlustatud dokumendivormingu järele, mida oleks võimalik saata ja jagada erinevate süsteemide vahel. Selle pinnalt sündis “Project Camelot”, mille ühe tulemusena avaldati PDF spetsifikatsiooni versioon 1.0 aastal 1993.[7]
Warnock ise kirjeldas projekti ideekavandis oma eesmärke kui dokumendikäitlemise demokratiseerimist – et igaühel oleks võimalik mistahes arvutimudeli ja kuitahes võimsa masinaga luua dokumente, mida saab lihtsalt e-kirja teel jagada mistahes teisele masinale vaatamiseks ja printimiseks, nii et säiliks lehekülje originaalkujundus.[8]
Esialgu oli PDF-vormingu puhul tegemist Adobe intellektuaalse omandiga, mistõttu oli selle levik esimestel aastatel tagasihoidlik ning sellele leidus turul ka mitmeid konkurente. PDF versioon 1.7 (2006) oli viimane, mis avaldati kui Adobe eraomand,[9] ning 2008. aastal anti selle põhjal välja ISO standard 32000-1:2008.[10] PDF standardi haldamine on sellest ajast peale läinud ISO tehnilise komitee kätte, ent seda tehakse siiski koostöös Adobe ning teiste tööstusharu organisatsioonide ja huvilistega.[11]
2017. aastal anti välja ISO 32000-2 (PDF 2.0) ning 2020. aastal avaldati see paranduste ja täiendustega uuesti. See on ühtlasi standardi kõige hiljutisem versioon.[3]
PDF standard ja selle omadused
[muuda | muuda lähteteksti]Algtasandil koosneb PDF fail baidijadadest, mis osaliselt järgivad ASCII kodeeringut ning osaliselt sisaldavad muud kontekstipõhist infot binaarkoodis. Nendest moodustuvad tähikud (tokens) ja andmestruktuuri kõrgemad süntaktilised osised.[12]
Kõrgemal tasemel on PDF faili koostiseks neli süntaksielementi: objektid (objects), failistruktuur (file structure), dokumendistruktuur (document structure) ja sisuvood (content streams).[12] PDF-faili maksimaalne suurus on ligikaudu 10 Gigabaiti.[12]
Põhilised funktsioonid
[muuda | muuda lähteteksti]PDF-fail
- võib sisaldada teksti ja graafikaelemente, millele on võimalik lisada hüperlinke, järjehoidjaid, märkusi, vormivälju ja muid interaktiivseid elemente;
- võib sisaldada fonte;
- toetab pakkimisstandardeid JPEG, CCITT, ZIP ja LZW;
- säilitab dokumendi kujunduse nii ekraanil kui ka väljatrükil.
Graafika
[muuda | muuda lähteteksti]PDF-i põhieesmärk on teha digitaalset infot inimloetavaks selle kuvamise kaudu ning selle ülesande täitmiseks on formaadis sätestatud mitmesuguseid võimalusi ja funktsioone.
Iga PDF töötlusprogramm (PDF processor) toetab vähemalt 14 põhilist kirjafonti (Standard Type 1 Fonts), ent lisaks neile on võimalik paigaldada fondi objekti abil kõiksuguseid fonte dokumendi sisse.[12] Tekstitasemel eristatakse tähemärki (character) ja trükimärki (glyph) ning teksti esitatakse lehekülje peal tekstiobjektidena, millele antakse parameetritena juurde omadused, näiteks paiknemine, kirjasuurus, font.[12] PDF toetab Form XObject sisuvoogude abil täidetavate tekstiväljade lisamist, et luua ankeete.[12]
PDF toetab kujutiste lisamist dokumendile ning nende muutmist läbipaistvaks (transparent), vaikesätteks on läbipaistmatu (opaque).[12] Formaat võimaldab mitmesuguste värviruumide kasutamist, sealhulgas seadmest sõltumatu värviruumi sätestamist dokumendi juurde, mille põhjal arvutatakse kasutatavas masinas välja õige värvikombinatsioon näitamiseks.[12] Samuti saab luua mustreid[219] Pilte saab lisada nii välise objektina kui ka tuvastada sisse skannides.[12] Lisaks toetatakse valikuliste graafikaelementide peitmist, et muuta lugemist kasutajale hõlpsamaks.[12]
Lisaks tavalistele piltidele võimaldab PDF lisada multimeedia objekte, näiteks videoid, heli, animatsioone, 3D objekte, lubades dokumendi sisse manustada erinevaid meediafailide andmetüüpe. Peale selle toetatakse ka nende kuvamist mitmetel erinevatel viisidel, kas eraldi aknas või hõljuvalt.[12]
Ühilduvus
[muuda | muuda lähteteksti]Mitmekihiline abstraheerimine annab PDF-failile ühe selle põhiomadustest, milleks on ühilduvus ja ülekantavus. Selle saavutamiseks kasutatakse mitmeid matemaatilisi konstrukte ja arvutusalgoritme. Eraldi dokumendivahetuse funktsionaalsus (document interchange) võimaldab sujuvat edastust erinevate seadmete vahel ning selle rakendamiseks kasutatakse metaandmeid, failiidentifikaatoreid, sisu loogilist struktureerimist ning sõnastikke PDF-i enda siseandmete jaoks.[12]
Teksti ja kujutiste ülekandmiseks erineva pikslitihedusega (dpi) seadmete vahel kasutatakse koordinaatruume, mis teisendatakse maatriksite abil näitamiseks või printimiseks sobilikeks.[12] Graafilised objektid ning nende renderdamine rastergraafilistel seadmetel kuvamiseks on sätestatud eraldi protsessidena kujutiste loomise mudeli poolt, mis võimaldab kasutada seadme spetsiifiliste omaduste infot, et kujutisi võimalikult tõetruult kuvada.[12]
Infotöötlus ja turvaohud
[muuda | muuda lähteteksti]PDF suudab lisaks graafilisele produtseerimisele ka tekstiinfot kasutada – arvutis loodud PDF-failid on harilikult eksporditavad (kopeeritavad), indekseeritavad ja otsingufunktsiooniga.[12] PDF toetab mitmesuguseid infofunktsioone, sealhulgas hüpertekst, dokumendisisesed viitelingid, digiallkirjastamine.[12]
Seoses PDF-i laialdase leviku ja mitmekesise funktsionaalsusega võidakse seda kasutada ka rünnete korraldamiseks. Näiteks formaadi poolt toetatud JavaScripti abil saab PDF-faili sisse ära peita koodi, mis käivitab sihtmärgi arvutis pahatahtlikke protsesse. Samuti on võimalik lisada linke pahavara sisaldavatele veebilehekülgedele või siis peita faili sisse programme, mis kasutavad ära PDF-lugerite turvaauke. Lisaks on võimalik maskeerida faile näiliselt PDF-i moodi välja nägema ning tegelikult käivitama rünnakut masinale, kui kasutaja faili avab.[13]
Samuti on potentsiaalseid ohte seoses digiallkirjastatud PDF-failidega. Näiteks oli mõnede aastate eest murekohaks selliste failide usaldusväärsus, kui Ruhri ülikooli teadlased leidsid turvaaugu, kuidas faili modifitseerimise läbi invalideerida sellele pandud digitaalne allkiri. Need vead parandati arendajate poolt enne uurimistulemuste avalikustamist.[14]
PDF failitüübid
[muuda | muuda lähteteksti]PDF põhispetsifikatsiooni alusel on aastate jooksul välja töötatud erinevaid PDF failitüüpe, mis on mõeldud eriotstarbeliseks kasutamiseks mitmetes valdkondades. Enamik neist on ka ISO poolt standardiseeritud.[15]
PDF/A ehk “Archival” on formaat, mis on mõeldud dokumentide pikaajaliseks säilitamiseks. Selleks on failitüübilt eemaldatud funktsioonid, mis võiksid ohustada sisu säilimist originaalkujul, näiteks pole lubatud heli- ja videosisu ega krüpteerimine ning kõik dokumendi kujundusega seotud info (fondid, värvid) hoiustatakse faili sees, et seda hiljem tõetruult reprodutseerida saaks.[16]
PDF/E ehk “Engineering” on formaat, mis on mõeldud kasutamiseks insenertehnilise teabe jagamiseks peamiselt tööstuses. Selle jaoks on lihtsustatud erinevate mudelite (2D ja 3D) ning interaktiivse sisu kasutamist dokumendis. Samuti on sellele sisse ehitatud PDF standardikontroll, et lugeja saaks veenduda dokumendi koostamise vastavuses nõuetele.[17]
PDF/X ehk “Exchange” on formaat, mis on mõeldud kasutamiseks graafilises disainis ning trükitööstuses, kus ühtlase kujunduse säilimine jagamisel ja printimisel on kriitilise tähtsusega. Trükitavuse tagamiseks on selles failitüübis keelatud videod ja 3D kujutised ning sõltuvalt projektile vajaliku ranguse astmest eksisteerivad ka alamtüübid, PDF/X-1a, X-3, X-4, X-5.[18]
PDF/VT ehk “Variable and Transactional Printing” on formaat, mis on samuti mõeldud kasutamiseks graafika- ja trükitööstuses. See on paljuski sarnane PDF/X failitüübile, ent sellel on mõned lisafunktsioonid, näiteks on lihtsustatud dokumendi jooksvalt muutmist ning isikustatud info lisamist trükitöö toimetamise või automatiseeritud arvepidamise jaoks.[19]
PDF/UA ehk “Universal Accessibility” on formaat, mis on mõeldud ligipääsetavuse suurendamiseks puuetega inimeste jaoks. Selle jaoks on failis nõutud, et kõik lehekülje elemendid oleks sildistatud ning loetavad abiprogrammidele, mis hõlbustavad kasutajal olulise info eristamist vähemolulisest.[20]
Searchable PDF on formaat, mis on mõeldud sisseskannitud PDF dokumentide sisu otsitavaks muutmiseks. See ei erine põhistandardist millegi muu poolest.[21]
ISO standardi alla mitte kuuluvad PDF failitüübid
[muuda | muuda lähteteksti]PAdES ehk “Advanced Electronic Signatures” on PDF failitüüp, mis on mõeldud oluliste dokumentide lihtsamaks ja turvalisemaks allkirjastamiseks ning leiab kasutust peamiselt ärinduses ja tööstuses. See võimaldab unikaalse digitaalse allkirja ja sertifikaadi abil tuvastada dokumendi autentsust ja väljaandjat.[22]
PDF/H ehk “Healthcare” on formaat, mis on mõeldud spetsiifiliselt tervishoiuandmete käitlemise hõlbustamiseks. Sellel on lisatud turvalisusfunktsioone, et vastata tundlike isikuandmete töötlemise nõuetele. Seda failitüüpi kasutatakse valdavalt vaid Ameerika Ühendriikides.[23]
Vaata ka
[muuda | muuda lähteteksti]Viited
[muuda | muuda lähteteksti]- ↑ "ISO/TC 171 - Document management applications". ISO (inglise). Vaadatud 4. mail 2026.
- ↑ "About us – PDF Association" (Ameerika inglise). Vaadatud 4. mail 2026.
- 1 2 Document management — Portable document format Part 2: PDF 2.0
- ↑ Graphic technology -- Prepress digital data exchange -- Use of PDF (PDF/X) ISO 15930
- ↑ Electronic document file format for long-term preservation (PDF/A) ISO 19005-1:2005
- ↑ "Announcing no-cost access to ISO 32000-2 (PDF 2.0) – PDF Association" (Ameerika inglise). Vaadatud 4. mail 2026.
- 1 2 3 "The history of Adobe PostScript". Prepressure (Ameerika inglise). 1. september 2025. Vaadatud 4. mail 2026.
- ↑ Warnock, John. "The Camelot Project" (PDF). www.planetpdf.com. Originaali (PDF) arhiivikoopia seisuga 4. märts 2009. Vaadatud 4. mail 2026.
- ↑ "Wisdom of the PDF Sage » History of PDF Openness". www.acrobatusers.com. Originaali arhiivikoopia seisuga 14. oktoober 2007. Vaadatud 4. mail 2026.
- ↑ "PDF Specification Archive – PDF Association" (Ameerika inglise). Vaadatud 4. mail 2026.
- ↑ Communications, Adobe Corporate. "Who Created the PDF?". blog.adobe.com. Vaadatud 4. mail 2026.
- 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ISO 32000-2. Document management — Portable document format — Part 2: PDF 2.0. International Standard. ISO. 2020. Lk 437.
- ↑ "Beware of threats lurking in booby-trapped PDF files". ESET (inglise). Vaadatud 5. mail 2026.
- ↑ "Recently identified PDF digital signature vulnerabilities – PDF Association" (Ameerika inglise). Vaadatud 5. mail 2026.
- ↑ "Different PDF File Types Explained | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PDF/A File Format - What is a PDF/A file? | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PDF/E File Format - What is a PDF/E File? | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "What is a PDF/X File and How to Use it | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PDF/VT file format - what is a PDF/VT file? | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PDF/UA File Format - What is PDF/UA? | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "Searchable PDF Files & How to Create Them | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PAdES Format & Electronic Signatures Explained | Adobe". www.adobe.com. Vaadatud 5. mail 2026.
- ↑ "PDF-Healthcare Files - What They Are & How They Work | Adobe". www.adobe.com. Vaadatud 5. mail 2026.