ホーム > カテゴリ > HTML5・JavaScript >

JavaScriptでPDFファイルのページを分割(抽出)する

JavaScriptでPDFファイルのページを分割(抽出)するサンプルです。JSのライブラリはオープンソースの「pdf-designer.js」を使用します。

PDFの分割(抽出)

PDFファイルの1ページ目を抽出するサンプルコードです。

<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<script src="pdf-designer.js" type="text/javascript"></script>
<script type="text/javascript">
var Analyst = null;    

function onChangeFile(event) {
    var reader = new FileReader();
    var file = event.target.files;
    
    document.getElementById("errmsg").innerHTML = '';
    
    reader.onload = function (event) {
        var Stream = new Uint8Array(reader.result);
        
        Analyst = new TPDFAnalyst();
        
        try {
          
            Analyst.LoadFromStream(Stream);
            
            if (Analyst.Encrypt) {
                document.getElementById("p1").innerHTML = 'PDFファイル - 未対応';
                document.getElementById("errmsg").innerHTML = 
                   '暗号化されているファイルには対応していません。';
            } else {
                document.getElementById("p1").innerHTML = 
                    'PDFファイル - [' + Analyst.PageCount +
                    'ページ / PDF' + Analyst.Version + ']';
            }
        } catch (e) {
            Analyst = null;
            document.getElementById("p1").innerHTML = 'PDFファイル - 未対応';      
            document.getElementById("errmsg").innerHTML = 'このファイルは未対応です。';
        }
    }
    reader.readAsArrayBuffer(file[0]);
}

function run() {        
    var PDFKnife = new TPDFKnife();

    if (Analyst != null) {
        try {
           
            PDFKnife.SaveToFile(PDF_GetDateTime_Now() + '.pdf', Analyst,1,1);
            
        } catch (e) {
            Analyst[0] = null;
            Analyst[1] = null;
            
            document.getElementById("errmsg").innerHTML = 
              'PDFファイルの抽出に失敗しました。 ';
        }
    } else {
        document.getElementById("errmsg").innerHTML =
          'ファイルを選択して下さい。';
    }
}
</script>
</head>
<body>
<h1>PDFファイルの分割(抽出)</h1>
<hr>
<p>1ページ目を抽出します。</p>
<p id="errmsg" style="color:red;"></p>   
<p id="p1"></p>
<input type="file" id="inputfile1" accept="application/pdf" onchange="onChangeFile(event)"><br>
<br>
<br>
<br>
<button id="run" style="width:200px;height:30px;" onclick="run();">開始</button>
</body>
</html>

対応しているファイル

「Microsoft Office、OpenOffice、Chrome」などで作成されたPDFファイルです。形式で言いますとPDF1.4形式(ISO 19005-1など)に準拠しているファイルです。「PDFの純正ツール」で作成したPDF1.5形式以降のファイルは基本的に対応していません。但し、PDF1.5形式以降のファイルでも内部的にPDF1.4形式ならば読み込めます。





関連記事



公開日:2015年12月30日
記事NO:01670