Soru:
PDF / A uyumluluğunu kontrol etmek için ücretsiz veya açık kaynaklı yazılım var mı?
Jan-Philip Gehrcke
2015-03-23 21:58:51 UTC
view on stackexchange narkive permalink

PDF / A, elektronik belgelerin dijital olarak korunması için özelleştirilmiş Taşınabilir Belge Biçiminin (PDF) ISO standartlaştırılmış bir sürümüdür.

( http: / /en.wikipedia.org/wiki/PDF/A)

Bu harika, ancak tek bir PDF dosyasının herhangi bir PDF / A ile uyumluluğunu kontrol etmek için ücretsiz araçlar var mı alt standartlar (PDF / A-1, PDF / A-2, PDF / A-3)?

Bu (eski) web sitesinde ticari olarak mevcut araçlar:

  • Acrobat 8 ​​Preflight (callas yazılımı tarafından geliştirilmiştir)
  • PDF Tools AG: 3-Heights PDF Validator
  • LuraTech: LuraDocument PDF Doğrulayıcı
  • Mühür Sistemleri: PDF Denetleyicisi
  • Intarsys: PDF / A Live!
  • callas: pdfaPilot”
  • Apago: PDF Appraiser (Actino tarafından satılır) )

Bununla birlikte, bu konunun önemi göz önüne alındığında, umarım ücretsiz olarak kullanılabilen bir tür araç vardır. Bir vizyon olarak, poppler gibi yerleşik bir açık kaynaklı PDF araç setinin böyle bir analizi desteklemesi güzel olurdu.

Belgenin PDF / A uyumlu olup olmadığını kontrol etmek mi istiyorsunuz yoksa gerçekten PDF / A uyumlu olup olmadığını kontrol etmek mi istiyorsunuz? İlk durumda, Adobe Reader gibi meta verileri görüntülemek için bir araca ihtiyacınız olacaktır. İkinci durumda, büyük olasılıkla ticari bir aracın etrafından dolaşmayacaksınız (çünkü uygunluğun belirlenmesi önemsiz bir görev değildir).
Uygunluğu kontrol etmek istiyorum. Bunun önemsiz bir görev olmadığının farkındayım. Yine de, açık kaynak kodlu (ghostscript ve poppler, sadece ikisini belirtmek için) oldukça karmaşık ve yüksek kaliteli birçok PDF kodu var, bu yüzden ücretsiz veya işletim sistemi yazılımının kullanılabilirliğini * görevin karmaşıklığı * :-). Ama sanırım sahada da biraz tecrüben var ve internet araştırması yaptın mı? :)
Ücretsiz PDF / A doğrulayıcı diye bir şey yoktur. Avrupa Komisyonu, böyle bir doğrulayıcı oluşturmak için bir proje başlattı. Bununla ilgili daha fazla bilgiyi burada okuyabilirsiniz: http://www.pdfa.org/news/a-consortium-including-the-pdf-association-wins-phase-1-of-an-eu-commission-tender-to- create-a-definitive-pdfa-validator / Önemsiz bir görev olmadığından, bu projenin tamamlanmış olmaktan çok uzak olduğunu hayal edebilirsiniz. Halihazırda mevcut olan herhangi bir çıktıdan haberdar değilim.
üç yanıtlar:
Jan-Philip Gehrcke
2015-03-31 04:31:51 UTC
view on stackexchange narkive permalink

JHove var. JHove, PDF / A uyumluluğunu belirli bir dereceye kadar "doğrulamak" için açık kaynaklı bir araçtır. Birçok kütüphane / kurum bunu kullanıyor, bu nedenle bu bakış açısından soruma iyi bir cevap.

Son zamanlarda, modern belge depolama sistemleri bağlamında JHove hakkında bir makale yayınlandı: http://www.pdfa.org/wp-content/uploads/2014/12/PDF_A_JHOVE_Friese_28112014_en1.pdf

Bundan alıntı yapmak için:

JHOVE pdf, tiff, jpeg, aiff ve wave gibi yaygın formatları tanımlamak, karakterize etmek ve doğrulamak için açık kaynaklı bir araçtır. JHOVE, PDF dahil on iki farklı dosya biçimi için doğrulama modülleri içerir.

ve

birçok bellek kurumu esas olarak PDF biçimini ve dosyalarının kalitesini kullanır PDF / A'ya dönüştürmek için her zaman yeterli bir argüman olmuyor, standart bir PDF doğrulayıcının her zaman olduğu gibi gerekli olduğuna inanıyorum. Genel olarak, JHOVE, sınırlamalarına rağmen kullanılmaya devam edecek ve belirli bir dosyanın arşivlenebilirliğine ilişkin kararlar, JHOVE'nin verdiği sonuçlara bağlı olacaktır.

JHOVE, kullanıcıların hatasını anlaması koşuluyla yine de yararlı olabilir. raporlar ve bunları çözme yollarının farkındadır. Şimdiye kadar bu konuda çok fazla belge yok. Hem nestor (AG Format Recognition) hem de Open Preservation Foundation yakında bu durumu iyileştirmek için üzerlerine düşeni yapmayı hedefliyor.

JHove hata mesajının bir listesi: http: // wiki.opf-labs.org/display/KB/JHOVE+Error+Messages

Birisi denemeli ve iText tabanlı doğrulamanın ne kadar iyi gittiğini görmeli: http://api.itextpdf.com/pdfa/
johan
2015-10-27 17:01:55 UTC
view on stackexchange narkive permalink

PDFBox

(Açık kaynak) Apache PDFBox kitaplığına göz atmak isteyebilirsiniz:

https://pdfbox.apache.org

Bu, oldukça iyi olan bir PDF / A doğrulayıcı (yalnızca PDF / A-1b) içerir. PDFBox 2.0.0'a (şu anda bir sürüm adayı) bakmanızı tavsiye ederim; burada bulabilirsiniz:

https://pdfbox.apache.org/download.cgi#20x

Ardından önceden oluşturulmuş Preflight bağımsız sürümünü indirin ikili (şu anda preflight-app-2.0.0-RC1.jar).

Aşağıdaki blog yazısı, bir araştırma projesinin parçası olarak Apache Preflight ile yaptığımız bazı çalışmaları özetlemektedir ( yararlı bulabileceğiniz bazı diğer kaynaklara bağlantılar içerir):

https://www.bitsgalore.org/2015/07/08/why-pdfa-validation-matters-part-2

VeraPDF

Bir yan notta, Bruno Lowagie AB tarafından finanse edilen yeni bir doğrulayıcıdan bahsetti. Bu artık VeraPDF olarak bilinir; henüz (Ekim 2015) PDF / a1b'yi (ve PDF / A-1a, PDF / A-2 & PDF / A-3'ün kısmi desteğini) tamamen kapsayan bir erken sürüm yayınladılar. Daha fazla bilgi burada:

http://verapdf.org/2015/11/02/complete-pdfa-1b-coverage-now-available-in-0-6-release-of- verapdf /

Bu hala erken aşamalarında, ancak hızlı ilerleme kaydettikleri için kesinlikle göz önünde bulundurulması gereken bir şey.

VeraPDF için +1.
Franck Dernoncourt
2017-05-17 08:53:31 UTC
view on stackexchange narkive permalink

veraPDF 'yi kullanabilirsiniz:

  • açık kaynak (veraPDF, GNU Genel Kamu Lisansı v3 veya üstü (GPLv3 +) ve Mozilla Kamu Lisansı v2 altında çift lisanslıdır veya üstü (MPLv2 +).)
  • Linux, Mac OS X, Microsoft Windows
  • Java ile yazılmış
  • CLI veya GUI

enter image description here

enter image description here

enter image description here

enter image description here enter image description here

  Kullanım: veraPDF [seçenekler] DOSYALAR Seçenekler: -x, - Ekstraktları Çıkar ve PDF özelliklerini bildirir. Varsayılan: false --fixmetadata Meta veri düzeltmeleri gerçekleştirir. Varsayılan: false -f, --flavour Yerleşik Doğrulama Profili çeşidini seçer, ör. '1b'. Alternatif olarak, bir dosyanın meta verilerine göre otomatik çeşni algılama için '0' sağlayın veya hiçbir bağımsız değişken sağlamayın. Varsayılan: 0 Olası Değerler: [0, 1a, 1b, 2a, 2b, 2u, 3a, 3b, 3u] --format Çıktı formatını seçer. Varsayılan: mrr Olası Değerler: [xml, mrr, metin] -h, --help Bu mesajı gösterir ve çıkar. Varsayılan: false -l, --list Yerleşik Doğrulama Profillerini listeler. Varsayılan: false --maxfailures Maksimum başarısız denetim miktarını ayarlar. Varsayılan: -1 --maxfailuresdisplayed Her kural için görüntülenen maksimum başarısız kontrol miktarını ayarlar. Varsayılan: 100 -o, --off PDF / A doğrulamasını kapatır Varsayılan: false --policyfile Bir politika şeması veya XSL dosyası seçin. --prefix Sabit dosyalar için dosya adı önekini belirler. Varsayılan: veraFixMd_ -p, --profile Verilen yoldan bir Doğrulama Profili yükler ve yükleme başarısız olursa çıkar. Bu, -f / --flavour seçeneğinin ima ettiği herhangi bir seçeneği veya varsayılanı geçersiz kılar. -r, --recurse Dizinler aracılığıyla yinelenir. Yalnızca .pdf uzantılı dosyalar işlenir. Varsayılan: false --savefolder Herhangi bir sabit dosya için çıktı dizinini ayarlar. Varsayılan: <empty string> --success, --passed Başarılı doğrulama kontrollerini günlüğe kaydeder. Varsayılan: yanlış
-v, --verbose Başarısız test bilgilerini metin çıktısına ekler. Varsayılan: false --version veraPDF sürüm bilgilerini görüntüler. Varsayılan: falseveraPDF, STDIN'i işliyor ve bir EOF işaretçisi bekliyor. Niyetiniz bu değilse, bir EOF eşdeğeri yazarak sonlandırabilirsiniz: - Linux veya Mac kullanıcıları CTRL-D yazmalıdır - Windows kullanıcıları CTRL-Z  code yazmalıdır > 


Bu Soru-Cevap, otomatik olarak İngilizce dilinden çevrilmiştir.Orijinal içerik, dağıtıldığı cc by-sa 3.0 lisansı için teşekkür ettiğimiz stackexchange'ta mevcuttur.
Loading...