Witam,
chciałbym wyświetlić plik PDF za pomocą PDF.js w canvasie, a później całość zinterpretować przez ocred.js, żeby dodać dane z zeskanowanego dokumentu do bazy. Jest sens się w to bawić? Czy mój pomysł jest nie na miejscu?
Pytam, bo JS znam powierzchownie (tyle co do pisania w PHASER'rze) i nie chcę przekombinować.
Pierwszym problemem jaki napotkałem jest zaimplementowanie pdf.js. Znaczy chyba nie tak implementuje pdf.worker.js, bo błąd własnie z tym plikiem mi chrome wywala :(
Fragment kodu:
<div class="preformarray">
<canvas id="the-canvas"></canvas>
<script>
pdfjsLib.GlobalWorkerOptions.workerSrc = "pdf/pdf.worker.js";
var loadingTask = pdfjsLib.getDocument('pdf/19662.pdf');
loadingTask.promise.then(function(pdf) {
// you can now use *pdf* here
pdf.getPage(1).then(function(page) {
// you can now use *page* here
var scale = 1.5;
var viewport = page.getViewport({ scale: scale, });
var canvas = document.getElementById('the-canvas');
var context = canvas.getContext('2d');
canvas.height = viewport.height;
canvas.width = viewport.width;
var renderContext = {
canvasContext: context,
viewport: viewport
};
page.render(renderContext);
});
});
</script>
a tu błędy z conslosi w dev tools:
Warning: Setting up fake worker. pdf.js:468
Warning: decodeScan - unexpected MCU data, current marker is: ffff pdf.worker.js:1014