← DokArh Portal
povijest_razvoja

PDF SKIN PROTOKOL — Povijest razvoja, testovi, zamke i rješenja

Kreator: genesis Datum: 2026-05-14 Status: ARHIV
WeisE3™ ID: 03bf18f2eff5c873adfa3a66d1e7475b0af135bc64ef4172e10c1cae47e1cd74
tippovijest_razvoja
statusARHIV
sesija2026-05-14
trajanje~4 sata aktivnog razvoja
pocetno_stanje{ "media_proc_verzija": "v2 (464 linije)", "algoritam": "fiksni prag 230 za binarizaciju", "problem": "isti prag za bijelu i kremast — kremasta pozadina nije čišćena" }
faze_razvoja[ { "faza": 1, "naziv": "Analiza — je li inovacija opravdana?", "pitanje": "Što je najveća stavka u digitalnom PDFu?", "odgovor": "Digitalni PDF: fontovi 40-70%, inline slike, content streams. DEFLATE kompresija radi na streamovima, ne na fontovima. Scanned PDF: svaka stranica je JPEG slika — tu je prostor." }, { "faza": 2, "naziv": "Zamke — što ne vidimo?", "zamke_otkrivene": [ "Digitalni potpis (e-Potpis) — kompresija invalidira signature", "PDF/A
test_rezultati_finalni{ "metodologija": "Sintetički skenirani PDF iz Democracy.pdf, 5 stranica, DPI=200", "varijante_testirane": 4, "sve_varijante_prosle_70pct_cilj": true, "prosjek_ustede": 72.4, "obuci_nazad_radi": true, "qpdf_digitalni": { "mind_enhancing_0_6MB": "19.5%", "crop_improvement_2_8MB": "18.9%", "energy_2_2MB_vec_komprimiran": "0.5%", "democracy_14MB_vec_komprimiran": "0.1%", "zakljucak": "Digitalni bez font-subsettinga max 20% — to je fizika, ne greška" } }
zamke_koje_smo_izbjegli[ "Ghostscript AGPL — koristimo qpdf (Apache 2.0)", "Potpis invalidacija — _detektuj_tip_pdf() vraća 'potpisan' → SKIP", "Pixel-by-pixel loop sporiji na velikim stranicama — prihvatljivo za arhivski kontekst" ]
sto_nedostaje_v2[ "SSIM mjerenje gubitka (Structural Similarity Index)", "Svjedoci blok u ProcessResult (hardver, softver, čovjek)", "jbig2 za crno-bijele skenove (10x bolji od JPEG za sudske spise)", "Font subsetting za digitalne (mutool -F flag)", "obuci-nazad API endpoint (GET /api/v1/docs/{w3}/original)" ]