Witam,

chciałbym wyświetlić plik PDF za pomocą PDF.js w canvasie, a później całość zinterpretować przez ocred.js, żeby dodać dane z zeskanowanego dokumentu do bazy. Jest sens się w to bawić? Czy mój pomysł jest nie na miejscu?

Pytam, bo JS znam powierzchownie (tyle co do pisania w PHASER'rze) i nie chcę przekombinować.

Pierwszym problemem jaki napotkałem jest zaimplementowanie pdf.js. Znaczy chyba nie tak implementuje pdf.worker.js, bo błąd własnie z tym plikiem mi chrome wywala :(

Fragment kodu:

        <div class="preformarray">
            <canvas id="the-canvas"></canvas>
<script>
    pdfjsLib.GlobalWorkerOptions.workerSrc = "pdf/pdf.worker.js";
    var loadingTask = pdfjsLib.getDocument('pdf/19662.pdf');
    loadingTask.promise.then(function(pdf) {
        // you can now use *pdf* here
        pdf.getPage(1).then(function(page) {
            // you can now use *page* here
            var scale = 1.5;
            var viewport = page.getViewport({ scale: scale, });

            var canvas = document.getElementById('the-canvas');
            var context = canvas.getContext('2d');
            canvas.height = viewport.height;
            canvas.width = viewport.width;

            var renderContext = {
              canvasContext: context,
              viewport: viewport
            };
            page.render(renderContext);
        });
    });
</script>

a tu błędy z conslosi w dev tools:

Warning: Setting up fake worker. pdf.js:468
Warning: decodeScan - unexpected MCU data, current marker is: ffff pdf.worker.js:1014