もし、文書管理システムの導入担当になってしまったら(2)

あなたの目の前には、文書管理システムに入れるべきデータが山積みになっています。お金も必要、データの選別のため社員の知恵も必要です。

さあ、「何を」「どのように」整備していけばよいのでしょうか。

第2回 データ整備

あなたがもしも文書管理システムの担当になってしまったら、前回は、その前に考えること、システム導入以前の体制・制度・ルールについて説明しました。そして、この回はシステムに入れるデータについて考えて見ましょう。

文書管理システムのような蓄積したデータを使用するシステム(データベース)は、データの質や量がシステム全体の品質に大きく影響します。

具体的には、質の点では、検索に必要なキーワードがデータ中に適切に含まれているか、スキャンしたデータはページの抜け漏れ、本文の見切りなどがなく情報を正しく読み取れるものものとなっているかなどがありますし、量の点では、カバー範囲はムラのない状態で提供されているか、その範囲を意識して優先順位をつけて計画的データづくりを行っているかなどとなります。

2つのデータ

文書管理システムで1つの文書は、2種類のデータで構成されます。1つは、文書そのもののコンテンツデータ、もう一つはそれが何であるかを示したメタデータです。

具体的な例を契約書を例に取って示してみます。

コンテンツデータは、契約書そのものをデータ化したものです。Wordなどの文書作成ソフトウェアから直接PDF化したり、契約締結後にスキャニングして画像データを作成しPDF化したものです。

メタデータは、この契約書を表す必要事項をテキストデータとして表すものです。主な項目は、分類、契約書名、契約先、契約年月日、保存年限、ロケーション番号、責任部署などで文書の取扱い情報などが追加されることもあります。

右は、コンテンツデータの例で契約書のPDFを表しています。一方、左はメタデータの例となります。

データを作成する時に配慮すべきこと

■コンテンツデータを作成するとき

品質に関する基準を決めておきます。電子化を外注する場合も社内で進める場合も、複数の人が大量の文書を電子化することになりますので、ある一定以上の品質を担保し、成果物を均一化するために必要なことになります。

ポイントは以下のとおりです。

・カラー・グレースケール・モノクロ2値 カラーは一番情報量が多いのですが、ファイル量は多くなります。何をカラーでスキャンするのかを決めておきます。 外注する場合は、コストで表れます。

・許容範囲の設定(傾き、白飛び、ピンぼけ、裏写り) 社内で展開する場合には、複合機の自動設定で問題無くスキャンができることが多いです。ただし、原本があまりにも問題があれば設定を変更してスキャンを行う必要もあります。

ここに示した、傾き、白飛び、ピンぼけ、裏写りなどは、主観的な項目であり、人による解釈の違いが顕著に表れるため、OKなもの、NGなものを示した限界見本の作成を行うとよいでしょう。

※e-文書法の画像要件

各府省により定められるため一定ではなく、法令や文書の種類によって要件が異なりますので注意が必要です。

■メタデータを作成するとき

①要件を満たす項目を配置する 利用に配慮した項目の配置を考慮します。例えば、契約書を管理する場合には、それを参照する人によって要求事項が変わります。そして、その要求事項を満たすための項目化が必要なこともあります。

・総務部門では   ・法改正への対応をしたい    →契約書名や年代などで探す必要がある。

・営業部門では   ・契約内容の確認をしたい    →契約先や契約書名、     担当者などで探す必要がある。

・法務部門では   ・契約書作成を効率化したい    →似たような契約書を     契約書名や分類などで探す必要がある。   ・既存契約の経緯確認をしたい    →関連づけのIDでの確認をする必要がある。

②項目値を揃える 項目にそれぞれ入力された値を一定の条件で揃えます。 文字の揺れをなくし、検索漏れを無くすことが目的です。

情報システム側でも、多少の文字の揺れがあってもプログラムによってそれらをカバーしていることもありますので、余計な労力をかけないためにも、システムがどこまで対応しているのか確認しておくとよいでしょう。

どういうことかというと。

インターネット検索では多くの人がGoogleを使っていると思いますが、Googleでのキーワード検索は、綴りが間違っていようが、うろおばえであろうが、Google側で推測して「○○ってこと?」として検索してくれます。 導入した文書管理システムはこういうことのどこまでをやってくれるか確認しておくということです。

具体的にはこんなことです。  ・英語の大文字小文字は、正確に入力しないとダメ?  ・旧漢字と新漢字を展開してくれる?  ・半角と全角は混在していていいの?

もちろん、データはキレイである方がよいですが、上記のようなことが予め確認できできていれば、データ作成の効率化が図れます。

コンテンツデータとメタデータの関連性

次は、コンテンツデータとメタデータの関連性について考えてみます。関連付けは、3種類あります。 メタデータ対コンテンツデータとして、

①1対1 ひとつのメタデータにひとつのコンテンツデータを紐つけるやり方です。契約書で考えると、契約書の件名や契約先のメタデータに、1つのスキャンして作成したPDFファイルをコンテンツデータとして紐つけるやり方です。

②1対多 ひとつのメタデータに複数のコンテンツデータを紐つけるやり方です。契約書で考えると、契約書の件名や契約先のメタデータに、1つのスキャンして作成したPDFファイルと関連するメモのファイルををコンテンツデータとして紐つけるやり方です。

システムとしては、「複数ファイルを紐つけることができる」となっていることが条件です。PDFファイルを紐つけるのではなく、ページをそれぞれファイルにしてページ管理までシステムで対応するものもあります。

③多対1 複数のメタデータに1つのコンテンツデータを紐つけるやり方です。文書を管理するシチュエーションからは、このパターンにはあまり遭遇しませんが、例えば、人物をメタデータとして不動産に関する権利を示した文書のコンテンツデータを紐つける場合などがあげられます。

左から、①1対1、②1対多、③多対1 のイメージとなります。

データ間の関連性について

最後に、データ間の関連性について考えてみましょう。 文書を閲覧するときに関連の強いものがをまとめたり、参照すべき文書を案内すれば、よりいい効果効用が得られます。

関連の付け方には、グループ分けをするのとリンク付けするのと2種類があります。

①グループ分けする 関連のある文書を近くに配置することによって、文書の参照性が高まります。前回の運用ルールのところで決定した分類に基づいてグループ分けします。具体的には、メタデータに分類を入れるということになるでしょう。

②リンク付けする 文書管理システムによっては、関連して閲覧して欲しい文書を選択して直接リンク付けすることができるものもあります。

このような機能によって、個々のデータを芋づる式に確認することができます。

左は①グループ分け、右は②リンク付けのイメージです。

情報システムのコストよりも、データ作成のコストの方が高額になります。そして、そのデータは世界で唯一のものです。 データは1つ1つの蓄積になりますが、1つ1つにフォーカスしすぎれば、全体を見失います。 次回は、どう現実に向かい合うかをみていきます。

アルパカアイコン
CONTACT

文書管理でお悩みの方は、お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください
文書管理のお役立ち資料は
こちらから
お電話でのお問い合わせはこちら
平日10:00~17:00

組織の知カラとは?

文書管理の専門家が長年培ってきたノウハウを企業担当者に向けて配信するサイトです。


文書管理サービスページから6つの資料がダウンロードできます。

このページでは以下の説明と資料のご案内をしています。

文書管理ルール
ファイルサーバー共有フォルダ
ペーパーレス化支援
法定保存文書
文書管理研修サービス
維持管理支援



「文書管理の教科書」を 見てみましょう

問題はあるのだけど何から始めていいかわからない、文書管理の手順を確認したい、そんな方はこの資料を見てみましょう。


記事カテゴリ一覧

会社情報