Locaweb - Edição 43 - page 59

lw
programação
padrão, como um subconjunto de SQL,
chamado SphinxQL. Com esse dialeto
é possível realizar todas as chamadas
padrões de consulta com SELECT, de
modificação com INSERT, REPLACE e
DELETE, e muito mais.
Já o SphinxSE permite usar a
ferramenta como mecanismo de
armazenamento. Ao instalar o plugin
de MySQL, é possível enviar um grande
conjunto de resultados ao servidor
MySQL para um pós-processamento.
Esse plugin funciona com MySQL e
seus forks. Em especial, o fork MariaDB
é distribuído com o SphinxSE.
Algumas vantagens
A grande vantagem do Sphinx está
justamente na velocidade de indexação
e busca. No entanto, a ferramenta
também é bastante famosa por sua
grande escalabilidade.
A velocidade de indexação é
extremamente rápida porque as
conexões são feitas diretamente com
o banco de dados. O Sphinx consegue
indexar vários megabytes de texto por
segundo em um computador pessoal.
A velocidade de busca também não
fica a desejar. Uma informação que
consta no site do projeto é que se pode
fazer mais de 500 chamadas ao banco
de dados por segundo para buscar em
como Craigslist, Living Social,
MetaCafe, Groupon e Tatoeba. No
Craigslist, por exemplo, são feitas mais
de 300 milhões de buscas por dia.
Mas não é só na velocidade e na
escalabilidade que o Sphinx se destaca.
Como o Sphinx disponibiliza uma
grande quantidade de funcionalidades
para processamento de texto, é possível
realizar um ajuste fino de acordo com
as exigências de sua aplicação e
assegurar que os textos recuperados
em uma busca sejam de alta qualidade.
Indexação dos textos
É possível fazer a indexação dos
textos tanto por lote (batch) como em
mais de 1 milhão de documentos, com
aproximadamente 1.2 GB de textos.
Esse teste foi feito em uma máquina de
2 cores com 2 GB de RAM.
O Sphinx permite uma grande
escalabilidade horizontal, ou seja, a
busca pode ser facilmente distribuída
em várias máquinas. Isso permite não
só um aumento de desempenho, mas
uma maior robustez, pois se ocorrer
um problema com uma das máquinas
ainda há outras para suprir a demanda
do sistema.
Sendo altamente escalável, funciona
muito bem em sites com uma grande
quantidade de usuários. Grandes sites
usam Sphinx clusters para milhares de
buscas em até bilhões de documentos,
Como a Craigslist, sites usam Sphinx
clusters para milhares de buscas de textos
Caso deseje suporte dedicado, você pode
comprar um plano a partir de US$ 1.499,99
Para usar o
Sphinx como
servidor de
banco de dados,
é necessário
usar a biblioteca
SphinxAPI
A página oficial do projeto que
busca textos,
a documentação e
possíveis planos de contratação de
suporte podem ser conferidos nos
sites abaixo:
Página oficial:
Documentação da ferramenta:
Planos de suporte:
LINKS OFICIAIS
locaweb
59
1...,49,50,51,52,53,54,55,56,57,58 60,61,62,63,64,65,66,67,68
Powered by FlippingBook