Visualisering av Lucene segment-merging

Lucene guru Mike McCandless har lansert et imponerende stykke arbeid på bloggen sin som visualiserer hvordan Lucene’s MergePolicy fungerer i praksis gjennom en rekke YouTube videoer. Han mater Solr først med en 10Gb Wikipedia dump og så med mer random add/delete data feed, og så logger hvert eneste segment som skrives eller merges gjennom hele prosessen.

Mike forklarer også hvordan en ny kul merge-policy, TieredMergePolicy (LUCENE-854) fungerer. Denne er mye smartere og noe mer effektiv enn det som er standard i Lucene/Solr nå. Håper dette kan bli den nye standarden i Solr på sikt!

Dette innlegget ble publisert i Søketeknologi. Bokmerk permalenken.