Skip to content

8.6 フルテキストデータベース

データベースの中には、**フルテキストサーチ(全文検索)**を行うための特殊なタイプのものがあります。 この種のデータベースは、格納されたテキストのすべての単語にインデックス(索引)を作成するため、「風車」や「巨大なチーズ」といった特定のキーワードを含む文章を高速に見つけ出すことができます。

人気のあるオープンソースシステムとPython API

Section titled “人気のあるオープンソースシステムとPython API”

本書では、代表的なオープンソースのフルテキストデータベースシステムと、それに対応するPython API(ライブラリ)が紹介されています。

システム名Python API備考
LucenepyluceneJavaベースの強力な検索ライブラリ。
SolrSolPythonLuceneをベースにしたエンタープライズ検索サーバー。
ElasticSearchpyes分散型RESTful検索・分析エンジン。近年非常に人気があります。
Sphinxsphinxapi高速でスケーラブルなフルテキスト検索サーバー。
Xapian / WhooshxappyWhooshはAPIを含め純粋なPythonで書かれた検索エンジンライブラリです。