技術情報 検索システム構築
弊社の検索システム構築技術について
弊社では主にオープンソースの検索エンジン (Lucene や Solr) を用いて、お客様のニーズに応じた検索システムを構築いたします。また、クロール技術と組み合わせて、サイト内検索や、ウェブ上の特定のデータの検索に特化した専用検索システムなどを構築することができます。
日本語検索
英語などのように、単語と単語がスペースで区切られた言語と違い、日本語は単語と単語の間には空白などの区切りはありません。そこで、検索インデックスを構築するために、日本語の場合は文章を単語に分割する方法として、N-gram 方式と形態素解析方式があげられます。それぞれ長所・短所があり、目的やデータの特性に合わせて選択することができます。
自動分類・類似検索
類似検索・自動分類技術により、大量のデータの中から、エンドユーザーが必要としているものを効率よく提供することができます。
類似検索の応用例としては、弊社が開発した OpenCms の「関連ページ」モジュールのように、特定のページに類似したページを検索することができます。
自動分類の応用例として、大量のニュース記事の中から、同一の事象を扱っている記事の集まりを自動的にグループ化することができます。
また、取得したページを指定した規則にしたがってカテゴリに分類したり、タグを付与して分類することが可能です。
用途に応じた検索ナビゲーション・インターフェイス
自動分類によってカテゴリ分け、タグ付けをしたページをタグクラウドからナビゲートできるようなインターフェイスを構築することが出来ます。
また、Ajax などを用いて、リッチなインターフェイスを構築することが出来ます。詳しくは リッチインターネットアプリケーションをご覧ください。
応用事例

ニュースアグリゲートサイト 「mediajam」 構築
mediajam では、大量のニュース記事の分類や、同一の出来事を扱った記事の自動的なグルーピングや、Wikipedia からの類似記事検索、記事への自動的なタグの付与、規則に従ったカテゴリ分け機能などは、この技術により実装されております。
不動産情報ポータル構築 マンションエンジン
新築マンションポータルの「マンションエンジン」では不動産情報を検索する手段として、地域や路線からのナビゲーションや、キャッシュ内からの全文検索などを実現しています。さらにユーザーの検索履歴を全アクセスユーザーで共有する仕組みやタグ機能なども提供しております。
サイト内特殊検索
超大手企業(NDA対象)サイト向けの特殊なサイト内検索を開発しました。ユーザーのさまざまな属性に従って、検索結果を表示し、実務に利用していただいております。






