全文検索で資料が膨大になったらどうしたら良いか

こんばんは。今日は、全文検索システムを運用するときに、検索対象図書が増えてきてしまったらどうしたら良いかという話を書いていきたいと思います。これを読めば、大量の資料からユーザーの意図に合わせて、探している資料がヒットされやすくなる仕掛けをつくれるかもしれません。

そもそも上手く検索するコツというものもあって、そのあたりについてはこちらの記事をご参照ください。今日ご説明するのは、どちらかといえばユーザーさんに努力してもらうところではなく、ソフトウェア側でしっかり検索をサポートしちゃいましょうというお話です。いろんな方法ありますが、その中でも一番シンプルな考え方で、”ユーザーの属性を考慮する”というものです。

読者のみなさまのまわりにも実にさまざま属性の人がいると思います。属性というと少しわかりづらいかもしれませんが、例えばこんな感じです。

名前:宮迫博之、性別:男性、出身:大阪、職業:You Tuber

わかりやすく言えば、その人を特徴づけるものを教えてくれますね。

設備保全の仕事にまつわるユーザーであれば、こんな感じになるかもしれません。

名前:伊集院 ヒカル、職位:係長、担当:Unit 1、設備:バルブ、配管

仮に10万件の資料の中から、この伊集院さんが”蒸気配管”に関する図面を探しているとしましょう。しかもこの人の職場は全文検索システムが導入され、比較的資料を探しやすくはなっていますが、何しろ定期検査の繁忙期なので、すぐに取り出して、業者と話しをしなければならないわけです。こんな時、伊集院さんが検索キーワードに「蒸気配管」と入力すると、おそらく大変なことになるわけです。Unit 5の蒸気配管が書いてある図面であったり、Unit 10の蒸気配管の図面もヒットしてしまうし、そもそも蒸気配管というものは工場の中にたくさんのラインで存在しているわけです。

伊集院さんとしては、本当は担当しているUnit 1の蒸気配管に関する図面を取り出したいところですが、10万件の中には、Unit1から10まで含まれていたりするとなかなか簡単に欲しい資料がヒットしてくれません。

そこで「Unit1 蒸気配管」というキーワードに変えて検索する作戦もあるかもしれませんが、図面に書いてある名称が実は”Unit1″ではなくて”ユニット1”だったりしたり、蒸気配管という言葉の”蒸気”だけでヒットしてしまって全然関係ない”蒸気タービン”の資料が出てきてしまう問題に遭遇したりわけです。

こんなことばかりしていたらユーザーさんはがっかりして、そのうち使ってもらえなくなっちゃいますよね?そこで、まずシンプルに使える方法が、ユーザーの属性を参考にするというものです。

伊集院さんは、Unit1を担当していて、配管とバルブを担当していましたね。これが、いわゆる属性というやつです。10万件の資料の方にもあらかじめ属性をつけておいて、これはUnit1の図面、これはバルブの図面、これは配管の図面とか属性を渡しておけば、伊集院さんが検索した時は、Unit1の図面でかつ、バルブと配管の図面を優先的に検索結果に表示させるようにしてあげることができるわけです。きっとユーザーさんの満足度も高いでしょう。

この手法は、私たちも様々なサービスを利用するときに知らないうちに使っているかもしれません。何かWEBサービスを登録するときにちょっと思い出してみてください。その時に入力した自分の属性がどのようにサービスに埋め込まれているか考えるといろいろ発見があって、結構面白いです。

膨大な資料からユーザーが探したいものをサッと取り出すには、ユースケースがはっきりしているならまず属性を使うのが最も効率的だと思います。まずはシンプルな技術から試してみましょう!

ちなみに、オンラインショッピングサイトでは、過去の閲覧履歴や購買履歴からそのユーザーが喜びそうな商品を推薦してくれたりしますよね。ユーザーが直接検索しているわけではないけど、ひょっとしてこういう資料も欲しいかなというケースもあると思います。そのあたりもまた別の記事で説明していきますね。

以上です。最後まで読んでいただき、ありがとうございました!気に入っていただければ、スキ、フォローよろしくお願いいたします!

コメントを残す

%d人のブロガーが「いいね」をつけました。