lista de stopwords en español para sphinx

Los stopwords de Sphinx son palabras que no queremos indexar en nuestro motor de búsqueda.
El formato por defecto del archivo de stopwords.txt es una lista de palabras separadas por coma, en un archivo de texto plano.
En un indexer se pueden especificar varios stopwords si se precisa

Si necesitas … Continuar leyendo

Sphinx configuración. Busquedas con y sin acentos y carácteres utf8

Para aquellos que usen Sphinx como motor de búsqueda en sus aplicaciones y que necesitan realizar búsquedas independientes de los acentos (buscar “jose” y encontrar “jose” y “josé”), también que sea capaz de buscar eñes, les vendrá muy bien la siguiente configuración del charset para español.

ejemplo de uno de … Continuar leyendo

Indexar las búsquedas full-text con Sphinx. Tutorial como usar Sphinx

¿Cómo realizar búsquedas full-text en una tabla con miles o millones de registros, sin que el mysql falle y el site siga siendo relevante y no se caiga?
La solución se llama Sphinx.
Es un motor de búsqueda (search engine) que proporciona velocidad, gran eficiencia y proporciona a aplicaciones … Continuar leyendo