indeksacja serwisu: Solr vs Sphinx

0

Pisze ten temat tutaj, pozniej przeniose do dzialu Coyote.

Zastanawiam sie z jakiego engine skorzystac w serwisie 4programmers.net. Wczesniej myslalem, ze z Lucene (a konkretnie - implementacji Zend Lucene). Napisalem juz nawet pewne fragmenty kodu - ba - spora czesc kodu. Jak sie okazuje wszystko do wyrzucenia bedzie, bo Zend Lucene jest woolne :( Na moim komputerze samo includowanie klasy zajmuje 2 sek, a nie wiem co bedzie jak wrzuce tysiace danych.

Stad moj post. Zastanawiam sie nad engine Sphinxa lub Solr. Interesuje mnie indeksacja tresci calej witryny wiec zarowno forum jak i tekstow. I szukanie w calosci danych i wyrzucanie wynikow. Nie wiem jednak jak Sphinx sobie z tym radzi. Stad moje pytanie.

Jakie sa Wasze doswiadczenia? Ja co prawda mam faworyta, w postaci Sphinxa ale chcialbym uslyszec Wasza opinie.

UPDATE: lipa z tym sphinxem chyba. Otoz nie umozliwia wyszukiwania w dwoch roznych indeksach (tabelach) IMHO. Albo umozliwia ale nie sortuje polaczonych wynikow tylko wyswietla posortowane wyniki z jednej tabeli a potem z drugiej :/

0

Adam, dziś na spotkaniu zagaiłem o Lucene. My go przez chwilę wykorzystywaliśmy, teraz jest projekt by go włączyć na wszystkie nasze wikie. Ponoć śmiga świetnie. Może jest problem z tym klientem, którego używałeś? Rzuć okiem na repo MediaWiki, tam ponoć jest szybki klient.

0

No, bo on byl pisany w PHP - oryginalny Lucene jest pisany w Javie.

Poczytalem poszperalem i zdecydowalem sie na Solr. Jest to projekt oparty na Lucene, napisany w Javie, oparty o komunikacji poprzez XML. Calkiem fajny :) Pozostaje napisac klase PHP do komunikacji (a sa tez jakies dostepne w sieci, ale jakies kobylaste) i mozna dzialac :) Mam juz calkiem sporo nowego kodu na nowy 4programmers.net (tylko na SVN jeszcze nie puscilem bo strasznie rozgrzebany jest), wlasciwie forum mi brakuje tylko i troche grafiki dorobic. Mam nadzieje, ze w lutym uda sie wszystko odpalic...

0

Ale ten klient w MW to też PHP :)
Ale ja nie testowałem, tylko przekazuje o nim opinie ludzi z firmy.

0

Hmm... IMO biblioteka PHP ktora laczy sie z biblioteka Lucene napisana w Javie. Popraw mnie jezeli sie myle.

A ja testowalem silnik, w calosci napisany w PHP (implementacja Lucene dla PHP).

0

Ah, tutaj mówimy o silniku w Javie i kliencie w PHP.

0

Tak, a w przypadku Solr mowiac o kliencie mam na mysil klase, ktora bedzie sie z nim komunikowac. A to proste, bo wykorzystujemy protokol HTTP oraz standard XML. Wiec pozostaje jedynie laczenie sie z silnikiem na danym porcie i wysylaniem/odbieraniem XML'a.

0

Heh, jak tak bardziej się dopytałem to wyszło, że my też na Solr się teraz opieramy :D

1 użytkowników online, w tym zalogowanych: 0, gości: 1