Artículos tageados con:

Sphinx

Motor de búsqueda desarrollado en C. Su función principal es indexar en disco todo el contenido de una tabla o una base de datos entera. Descargando de trabajo a la base de datos y mejorando la rapidez de las consultas.

lista de stopwords en español para sphinx



Los stopwords de Sphinx son palabras que no queremos indexar en nuestro motor de búsqueda. El formato por defecto del archivo de stopwords.txt es una lista de palabras separadas por coma, en un archivo de texto plano. En un indexer se pueden especificar varios stopwords si se precisa Si necesitas saber mas sobre stopwords puedes ver la documentacion oficil de Sphinx http://www.sphinxsearch.com/docs/current.html#conf-stopwords A continuación dejo mi listado de palabras que no quiero indexar de mi stopwords.txt espero que os sirvan!! Tags de búsquedas:stopwords español,sphinx español,español sphinx,ficheros de stopwords en español,Reindexar en sphinx,sphinx español,sphinx stopwords,stopwords caracteres

Sphinx configuración. Busquedas con y sin acentos y carácteres utf8



Para aquellos que usen Sphinx como motor de búsqueda en sus aplicaciones y que necesitan realizar búsquedas independientes de los acentos (buscar “jose” y encontrar “jose” y “josé”), también que sea capaz de buscar eñes, les vendrá muy bien la siguiente configuración del charset para español. ejemplo de uno de mis index en Sphinx ACTUALIZACIÓN (05-04-2010) Después de mucho pelearme con los acentos y las eñes con Sphinx he conseguido optimizar y dar con el charset adecuado. Ejemplo de uno de mis index es muy importante tener las tablas y los datos en las tablas en UTF8 y en el source añadir la siguiente instrucción. Tags de búsquedas:sphinx utf8

Indexar las búsquedas full-text con Sphinx. Tutorial como usar Sphinx



¿Cómo realizar búsquedas full-text en una tabla con miles o millones de registros, sin que el mysql falle y el site siga siendo relevante y no se caiga? La solución se llama Sphinx. Es un motor de búsqueda (search engine) que proporciona velocidad, gran eficiencia y proporciona a aplicaciones y webs la función de búsquedas full-text relevantes. Básicamente lo que hace es indexar todo el contenido de una tabla, o varias tablas, en el disco duro, cuando se realiza una búsqueda el servidor requiere espacio en disco duro y memora RAM para realizar la búsqueda. Al tenerla indexada es capaz de procesar una búsqueda full-text en 6GB de texto en 0.1 segundos, mientras que esto en SQL sería imposible o tardaría muchísimo. Tremendo descubrimiento…. recomiendo usarlo Bueno esto es algo de la teoría, la práctica es otra cosa, yo he estado 2 días para entender, implementar y dejarlo funcionando. Para poder instalarlo necesitareis tener permisos como root en vuestro servidor. Las librerías necesarias son mysql-devel y los compiladores gcc y g++. En el caso que no vengan instaladas ejecutar los siguientes comandos para descargar los paquetes e instalarlos. $ yum -y install mysql-devel $ yum -y install gcc $ yum [...]