JavaScriptでPDFファイルのページを分割(抽出)する
JavaScriptでPDFファイルのページを分割(抽出)するサンプルです。JSのライブラリはオープンソースの「pdf-designer.js」を使用します。
PDFの分割(抽出)
PDFファイルの1ページ目を抽出するサンプルコードです。
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <script src="pdf-designer.js" type="text/javascript"></script> <script type="text/javascript"> var Analyst = null; function onChangeFile(event) { var reader = new FileReader(); var file = event.target.files; document.getElementById("errmsg").innerHTML = ''; reader.onload = function (event) { var Stream = new Uint8Array(reader.result); Analyst = new TPDFAnalyst(); try { Analyst.LoadFromStream(Stream); if (Analyst.Encrypt) { document.getElementById("p1").innerHTML = 'PDFファイル - 未対応'; document.getElementById("errmsg").innerHTML = '暗号化されているファイルには対応していません。'; } else { document.getElementById("p1").innerHTML = 'PDFファイル - [' + Analyst.PageCount + 'ページ / PDF' + Analyst.Version + ']'; } } catch (e) { Analyst = null; document.getElementById("p1").innerHTML = 'PDFファイル - 未対応'; document.getElementById("errmsg").innerHTML = 'このファイルは未対応です。'; } } reader.readAsArrayBuffer(file[0]); } function run() { var PDFKnife = new TPDFKnife(); if (Analyst != null) { try { PDFKnife.SaveToFile(PDF_GetDateTime_Now() + '.pdf', Analyst,1,1); } catch (e) { Analyst[0] = null; Analyst[1] = null; document.getElementById("errmsg").innerHTML = 'PDFファイルの抽出に失敗しました。 '; } } else { document.getElementById("errmsg").innerHTML = 'ファイルを選択して下さい。'; } } </script> </head> <body> <h1>PDFファイルの分割(抽出)</h1> <hr> <p>1ページ目を抽出します。</p> <p id="errmsg" style="color:red;"></p> <p id="p1"></p> <input type="file" id="inputfile1" accept="application/pdf" onchange="onChangeFile(event)"><br> <br> <br> <br> <button id="run" style="width:200px;height:30px;" onclick="run();">開始</button> </body> </html>
対応しているファイル
「Microsoft Office、OpenOffice、Chrome」などで作成されたPDFファイルです。形式で言いますとPDF1.4形式(ISO 19005-1など)に準拠しているファイルです。「PDFの純正ツール」で作成したPDF1.5形式以降のファイルは基本的に対応していません。但し、PDF1.5形式以降のファイルでも内部的にPDF1.4形式ならば読み込めます。
スポンサーリンク
関連記事
公開日:2015年12月30日
記事NO:01670