紙文書の電子化を成功させる方法!

これまで紙で利用していた文書を電子化することで、 様々なメリットが生まれます。 しかし無計画に電子化を進めれば、 たちまち使い物にならない電子ファイルが氾濫し、 コストのみを浪費して効果は出ません。 今回は電子化を成功させるための方法をお伝えします。

まずは不要な文書を捨てること!

オフィス内に保管されている文書のうち、 約半分は不要だと考えてください。 文書削減活動に取り組んだことのない企業であれば、 不要文書が7割を超えることもあります。 このサイトの記事でも再三お伝えしていますが、 まずはこのような不要文書を廃棄してください。 その後で次項でご紹介する電子化基準に従って電子化対象文書を絞り込みます。

電子化文書選定基準

電子化するにはコストがかかるので、 電子化対象文書を絞り込まなければなりません。 絞り込みの基準は以下のようなものがあります。

これらの基準に適合するものは電子化を進めます。 適合するか否かは各人の感覚的に依存するところもあるため、 文書の利用者たちからヒアリングを行った上で決定するとよいと思います。

原稿の状態調査を行う

電子化対象の文書が定まったら、 原稿の状態について、調査を行います。

契約書の原稿状態の調査などについてはこちら

①量を調査する

電子化対象文書の全体数量を調査します。 この全体数量をもとにスケジュールなどの計画を行うことになります。 全体数量とはスキャニングをするページ数です。 もちろん1枚1枚数えるわけにはいかないので、 ファイルメーター(fm)を測定します。 1cmあたり、おおよそ100枚程度でカウントしますが、 バインダーやフォルダに入っている場合は、 その分を考慮して0.8掛けくらいで試算します。

fmが20fm(2000fcm)あった場合

2000fcm×100枚/cm×0.8=160,000枚

これに両面/片面の比率を考慮します。 全て両面文書であれば、単純にスキャニングページ数は枚数の2倍になります。

②用紙サイズを調査する

用紙サイズ(A4、A3、A2など)ごとの数量を調査します。 こちらも当然1枚ずつ数えることは不可能なので、 それぞれのサイズごとのおおよその比率を把握します。

③保管状態を調査する

電子化対象文書がどのように保管されているかによって、 使用するスキャナやフォルダ体系、ファイル名称のつけ方が変わります。

〇保管用具(バインダー、フォルダ、クリアファイルなど) 〇保管用具に付けられているタイトルや見出し(年月日別、文書別、顧客名別など)  →紙の利用方法を踏襲する場合は、これらの情報がフォルダ名・ファイル名となる 〇ホッチキス留めや製本物の有無とバラシの可否 →可能ならADFスキャナ、不可能ならフラットベットやフェイスアップスキャナを使用 〇ホッチキスの留めなおしやファイリング用具への再収納など、復元の要否

仕様を決める

電子化対象を決め、原稿状態の調査を終えたら、 どのようなデータを作成するかについての仕様を決定します。

①スキャニングサイズ(実寸、A4、A3など)

多くは実寸で取り込みますが、 利用しやすいサイズで取り込むケースもあります。

②解像度(200dpi、300dpi、400dpi・・・)

解像度は高ければよいというものではありません。 高いほどファイルサイズが大きくなり、利用しにくくなります。 PCから出力したような通常の文書であれば、 200~300dpiでもほぼ十分です。 一方手書き文書や昔の青焼き図面などは、高解像度で取り組むことをお奨めします。

③諧調(カラー、グレースケール、白黒二値)

カラー→グレースケール→白黒二値の順にファイルサイズは大きくなります。 色の識別がどうしても必要な図面やカタログなどはカラー、 白黒の写真を含む雑誌などはグレースケール、 その他一般文書は白黒二値にするなど、 書類の性質に応じて決定します。 ちなみに契約書は、弊社請けた業務のほとんどが白黒二値です。 印影などを考えるとカラーが良さそうに思いますが、 契約書を電子化する目的の多くは契約内容を即座に閲覧することにあり、 原本自体は廃棄しないため、 印鑑部分の再現性はほぼ関係ないからです。

④フィル形式(PDF、TIFF、JPEGなど)

スキャニングした電子化データで最も多く利用されているのはPDFですが、 データが重い写真ファイルなどはJPEG、 保存用のデータはTIFFをお奨めしています。

⑤ファイルの編集(シングルファイル・マルチファイル)

PDFやTIFFファイルを、 書類1ページごとに作成するか(シングルファイル)、 ある特定の単位で作成するか(マルチファイル)を決定します。 例えば契約書は、契約1件でマルチファイル化することがほとんどです。 使用するシステムとの親和性も考慮して決定する必要があります。

⑥ディレクトリとファイル名

ディレクトリの構成は原則、 原稿のファイリングの状態を踏襲しますが、 原稿を収納しているファイルにタイトルや見出しが付いていなかったり曖昧な場合は、 別途検討しなければなりません。 ファイル名についても統一されたルールを定めなければなりません。 ディレクトリの構成やファイル名の付与は、検索スピードにも直結します。 弊社ではこのようなルール作りを支援しています。

⑦属性データの作成

電子化したデータを文書管理システムなどで利用する場合、 DB(データベース)に登録するための属性データを作成しなければなりません。 例えば1件の契約書のPDFであれば、「契約先」「契約件名」「契約内容」「締結日」・・・など、どのようなキーワードで検索するかを考え、入力する属性項目を決定します。

契約書を管理するシステム(参考)

⑧OCR

OCR処理を行うか否かを決めます。 つまり全文検索を行うかどうかです。 ここで注意しておきたいのは、 全文検索だけを頼りに検索を行おうとすると失敗します。 検索には前述したようなディレクトリやファイル名、属性データが最も役に立ち、 全文検索は補完的に活用すべきです。 またOCR処理を行う場合は、OCRソフトを決めます。 OCRソフトには、文字情報のみの文書や図面、新聞・雑誌など、 対象となる文書によって相性があります。 使用するソフトによって精度が変わりますので注意しましょう。

⑨検査

作成したデータの検査は必須です。 検査項目をあらかじめ決定しておきます。

・画像品質(判読性・向き・傾きなど) ・入力漏れの有無 ・ファイル名が正しく入力されているか ・フォルダに正しく格納されているか ・属性データが正しく入力されているか

作業工程

調査や仕様の策定が終わったら、 実作業に入ります。

これらを内製で行うか、専門業者に外注するかについては、 コストを比較して検討しなければなりません。

コストの比較方法や作業の実施計画(日程計画・工程計画・生産管理)についてはこちらの記事をご覧ください。

専門業者に外注したい、見積りがほしいという方はこちらをご覧ください。

コンサルティング事業部/鈴木

新着記事

アルパカアイコン
CONTACT

文書管理でお悩みの方は、お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください
文書管理のお役立ち資料は
こちらから
お電話でのお問い合わせはこちら
平日10:00~17:00

組織の知カラとは?

文書管理の専門家が長年培ってきたノウハウを企業担当者に向けて配信するサイトです。


文書管理サービスページから6つの資料がダウンロードできます。

このページでは以下の説明と資料のご案内をしています。

文書管理ルール
ファイルサーバー共有フォルダ
ペーパーレス化支援
法定保存文書
文書管理研修サービス
維持管理支援



「文書管理の教科書」を 見てみましょう

問題はあるのだけど何から始めていいかわからない、文書管理の手順を確認したい、そんな方はこの資料を見てみましょう。


記事カテゴリ一覧

会社情報