全文検索導入で失敗しない!

全文検索システムはなんでも見つけられそうで、実はなかなか見つけられない。それが何故なのか、どうしたら解決できるのか考えてみます。

全文検索システム導入での失敗

紙文書を電子化する場合には、OCR(Optical character recognition)機能で透明テキスト付きPDFを作成することをお勧めしています。なぜなら、電子の状態で生まれてくる電子文書と同様に書いてある文字を使ってテキスト検索が可能になり利便性をあげることができるからです。

つまり、全文検索できるようになります。

しかし、これだけでは文書が多いとヒットしすぎて、文書が見つけにくいとか結局探せないとか

必要なデータにたどりつけない

ということが起こりがちです。

「再現率」は高い、「適合率」は低い

実は、全文検索はデモ効果がとても高いです。OCR処理したPDFなどを作成してお客様に見ていただくと、キーワードが文書中に反転していてわかりやすく表示されます。文中の単語が一目瞭然!!すごく便利です。
こんなに便利に見えたのに、なぜ「必要なデータにたどりつけない」ことが起こるのでしょうか。

検索結果の文書 文書全体 見つからなかった文書 検索された中で欲しかった文書

①よく見えるのは「再現率」が高いから。
文書の中にある文字が全て検索対象になることから、メタデータだけの検索よりも多くの検索結果を検出できます。その結果、あっても見つけられないという懸念からは開放されます。

なんでも見つかりそうな気がします。

②たくさんあり過ぎてその選別に苦労する。「適合率」が低い

逆に見つかり過ぎます。メタデータの項目の1つであるキーワードはその文書を代表とするテーマから付与しますが、全文検索は全ての文字列が対象となりますので、その文書のテーマ以外でも表現のために使われた文字列は検索対象となってしまいます。したがって、検索ノイズが出てしまいます。

③データが少ないうちは気づきにくい。
デモなどで見る時は、少ないデータで行うことが多いです。また、全文検索では1つの文書を例にしてご覧いただくことばかりなので、検索テーマに適合しているかの選別の過程を検討することがないので気づきにくいです。

インターネットと社内システムでの情報検索

インターネット検索エンジンのGoogle はインターネット全体を検索対象としますが、ユーザーファーストの方針によって、上位表示はGoogle のフィルタにかけられて表示されます。利用者側もそれをよく知った上で利用します。

情報の海からピックアップ

する感覚です。

一方、社内の文書を探すときはどうでしょう。

根性で何が何でも探し出し

ますよね。なぜなら、絶対あるのはわかっている、なければ最初から作りなおさければならない。なので、何が何でも探し出す。ことになります。
全文検索で候補がたくさん見つかって、どれだかを選別するのに時間がかかってしまうこともよくあります。

全文検索有効利用のための方策

全文検索システムを導入したけれどもうまく活用されていないという話は聞きますが、ないほうがいいとか人間の目で探した方がいいとかそういう人はいないと思います。やっぱり、使うべきところにコンピュータを使った方がいいということだと思います。
では、有効利用をするためにはどうしたらいいのでしょうか。ここでは2つのデータ管理を考えてみます。

①データの階層(グループ)化の有効性
データを階層化して整理し、全文検索はその範囲内で行い、後に来る選別の手間を縮小します。
おおざっぱでもある程度小分けの箱に入れて、その中を探す感覚です。

②タグ付けの有効性
階層化は、データの配置を示すため、1つの文書は1つの箱にしか入れられません。複合的に主題を表すためにタグも付与しておきます。タグは文字利用の揺れをなくすために登録制にしておくとよいでしょう。
(コンピュータを表すのに「コンピュータ」と付与する人と「電子計算機」と付与する人がいたらうまく探せません。)

階層は、予め入れる箱を用意して、文書を片付けていくイメージです。タグは、ひとつの文書にいくつでも付与できます。

なんでも同じ袋の中に雑多に入れて「はい、探しましょう!」では、なかなかうまくいきません。

情報が多くなればなるほど、検索の精度を高める工夫は必要となります。

コンサルティング事業部/石川

「組織の知カラ」に相談してみる

文書管理を導入を検討してみたい、導入はしたが運用がうまくいっていないなど、文書管理についての不安はないでしょうか。まずは、お話を聞かせていただくところから始めます。お気軽にお問い合わせください。

まずは文書管理3点セットを手に入れてみましょう

サンプル無料配布中です。
文書管理には、規程/ガイドライン/法定保存年限の3点セットが必要です。あなたの会社のものを作成する前や見直しをする際にサンプルを見てみましょう。

組織の知カラとは?

文書管理の専門家が長年培ってきたノウハウを企業担当者に向けて配信するサイトです。

■お役立ち記事 

文書管理の悩みを解決するのに役立つ記事やセミナーなどのお知らせを掲載しています。

■サービス

文書管理の問題を解決するサービスを紹介しています。

■お客様事例

お客様の各種事例を紹介しています。

記事カテゴリ一覧

スタッフブログ アルパカのあしあと

まずは文書管理3点セットを手に入れてみましょう

サンプル無料配布中です。
文書管理には、規程/ガイドライン/法定保存年限の3点セットが必要です。あなたの会社のものを作成する前や見直しをする際にサンプルを見てみましょう。

タグ
図書館文書管理システムセキュリティコスト博物資料リスクマネジメント事例業務効率化方法整理整頓コツ契約書BCP対策規程情報共有属人化e文書法電子帳簿保存法スキャナ保存広報サポート・広報ツール制作写真ファイリング広報人材育成活性化成功事例文書図面紙文書ファイル研修削減移転文書管理コンサル維持管理成功ルール共有分類e-文書法情報管理電子ファイル意欲成果組織力組織化森友学園南スーダン保存期間保存媒体情報労働生産性情報収集非定型定型公文書館セミナー専門家メリットデメリットデザイン秘密文書文書管理保管効果人件費情報漏えい電子化ラベリング動向スペース検索廃棄整理経理書類展示リスクランキング文書管理規程紙の電子化コミュニケーション失敗事例契約書管理ワークフロー職場環境マニュアル目標ナレッジマネジメント文書管理マニュアル文書のライフサイクルアーカイブ文書保管文書保存ナレッジ公文書管理法文書管理規則情報公開説明責任マイクロフィルムアート記録全文検索組織文書削減基準C文書管理導入C文書管理規程作成C文書管理コンサルC文書管理事例C契約書管理C秘密情報CリスクマネジメントC業務効率化C情報共有Ce-文書法C番外編C紙文書電子化Cスキャナ紙文書 電子化契約書 電子化電子化 成功文書管理 メリット誤廃棄ペーパーレス働き方改革内部統制訴訟
会社情報