8.6 フルテキストデータベース
データベースの中には、**フルテキストサーチ(全文検索)**を行うための特殊なタイプのものがあります。 この種のデータベースは、格納されたテキストのすべての単語にインデックス(索引)を作成するため、「風車」や「巨大なチーズ」といった特定のキーワードを含む文章を高速に見つけ出すことができます。
人気のあるオープンソースシステムとPython API
Section titled “人気のあるオープンソースシステムとPython API”本書では、代表的なオープンソースのフルテキストデータベースシステムと、それに対応するPython API(ライブラリ)が紹介されています。
| システム名 | Python API | 備考 |
|---|---|---|
| Lucene | pylucene | Javaベースの強力な検索ライブラリ。 |
| Solr | SolPython | Luceneをベースにしたエンタープライズ検索サーバー。 |
| ElasticSearch | pyes | 分散型RESTful検索・分析エンジン。近年非常に人気があります。 |
| Sphinx | sphinxapi | 高速でスケーラブルなフルテキスト検索サーバー。 |
| Xapian / Whoosh | xappy | WhooshはAPIを含め純粋なPythonで書かれた検索エンジンライブラリです。 |