Solr 1.4 med kjekke forbedringer

apache_solr_logoApache Solr 1.3 søkeserver er allerede veldig kraftig og stabil, så det er ingen grunn til å vente med å ta den i bruk selv om en ny versjon er på trappene. Oppgradering vil også være enkelt.

Så hva blir egentlig nytt i 1.4?

Apache Tika integrasjon

En av de mer nyttige nyhetene for dere som indekserer intranet er integrasjon med Tika (eller Solr Cell), som er en dokument-konverterings-komponent med støtte for MS Office, PDF og mange flere formater, til og med MP3 metadata.

Bedre ytelse

Du får forbedret fasett-søk (navigator) gratis, og med en mindre endring i skjema-fila får du også nytte av en betydelig forbedret nummer (inkludert flyttall og og dato) range søk. Dette er fordi man har laget en smart intern implementasjon, så man ikke lenger behøver å ekspandere en nummer-rekke til en OR mellom ALLE distinkte streng-verdier. Si du vil søke intervallet 0-1234. I v1.3 ville det bety en ekspansjon til (0, 1, 2, 3, 4…1229, 1230, 1231, 1232, 1233, 1234). La oss tenke oss at den nye implementasjonen deler opp i 10-desimal-grenser. Da kunne det nye søket sett slik ut (th0, hu0, hu1, te0, te1, te2, 1230, 1231, 1232, 1233, 1234), altså en reduksjon fra over tusen termer til titalls.

Enklere indeks-replikering

Å replikere indeksen for større systemer har ikke vært for amatører så langt. Man har behøvd å sette opp alle nodene manuelt (ingen installerings-støtte), og oppsett av rsync-script for replikering til slavene. I v1.4 er standard replikeringsmetode Java prosess-til-prosess, enklere å sette opp og virker til og med på Windows 🙂

Og mer

Det er også mange flere nyheter, blant annet endel Lucene-forbedringer som Solr nyter godt av. Du kan lese mer her.

Så følg med og se etter Solr 1.4 på en web-side nær deg…

Dette innlegget ble publisert i Åpen kildekode, Søketeknologi, Teknologi. Bokmerk permalenken.