製品ページ:最近の更新

2010-05-13

サービスページ:最近の更新

2009-10-26
2009-05-06
2009-04-21
2009-04-10

企業ページ:最近の更新

2010-05-13
2009-09-03
2009-04-21
2009-04-17

Wikiガイド

FrontPage > 製品 > Webシステム > 検索 > Apache Lucene

Apache Lucene

1000万ドキュメントくらいの規模まで1台のマシンで対応できる。 それ以上を複数のマシンで分散検索できるようにするHadoopというサブプロジェクトがある。

製品概要

1000万ドキュメントくらいの規模まで1台のマシンで対応できる。 それ以上を複数のマシンで分散検索できるようにするHadoopというサブプロジェクトがある。

検索エンジン(ライブラリ)だけの提供であり、ウェブアプリとしての機能はSolr、クローラーの機能はNutchというサブプロジェクトで開発されている。

日本語のデータをインデックスするためには、CJKAnalyzerかJapaneseAnalyzerを使う。CJKAnalyzerはbi-gram方式である。JapaneseAnalyzerを使うには、形態素解析エンジンを組み込む必要があり、オープンソースのSen(MeCabのJava実装)を使う。 また、ベイシステクノロジー社から販売されているJLAでも日本語のデータを形態素解析してインデックスできる。

2007年1月にApacheのトップレベルプロジェクトになり、現在はPMC(Project Management Committee)での開発スタイルをとっている。

Wikipediaより転載)

製品カテゴリ Webシステム > 検索
対象ユーザー エンドユーザー、SIer、デベロッパー
ライセンス Apache License
価格 無償
開発元 Apache Software Foundation
資料