zoeken en gevonden worden met Solr

wat is Solr?
Om te beginnen, je spreekt het uit als Solar. In een wereld waar “gevonden worden” steeds belangrijker is, is een zoekmachine niet meer weg te denken. Je kunt Solr typeren als een (enterprise) zoekmachine en behoort tot de Apache familie. De historie van Sorl kun je vinden op Wikipedia. Solr maakt zoeken in allerlei soorten omgevingen eenvoudig. Solr is krachtig omdat het een eigen omgeving heeft om in te zoeken. Zo maak je van het bezoeken van je site en het zoeken op je site twee aparte processen. Door het inrichten voor een index komen de zoekresultaten razendsnel terug. Solr richt zich op een eigen omgeving waarbinnen je producten of diensten gepresenteerd worden aan de buitenwereld. Inzetten van Solr heeft verschillende voordelen en maakt het zoeken voor een eindgebruiker erg snel en efficiënt.

waarvoor is Solr geschikt?
Solr kan worden ingezet voor omgevingen met een grote hoeveelheden gestructureerde en ongestructureerde data (statisch of dynamisch); zij profiteren optimaal van de snelheid en accurate resultaten. Een sterk punt van Solr is de capaciteit om ‘full text’ te zoeken, dus door de documenten heen. Je kunt Solr heel laagdrempelig inzetten maar ook heel geavanceerd met allerlei filteropties.
Leuke features van Solr
–    Geavanceerde auto complete (de zoekmachine maakt je zoekterm zelf af)
–    Arceren van de zoekterm in de gevonden resultaten
–    Synoniemen en spelling aanbevelingen
–    Fonetisch zoeken

wat maakt Solr anders?
In theorie kun je op alle webomgevingen Solr gebruiken. Omdat Solr schaalbaar is kun je je index eenvoudig uitbreiden of extra Solr servers toevoegen. In de praktijk blijkt dat je met Solr vele malSOLR1en minder servers nodig hebt dan een traditionele setting. Dit scheelt behoorlijk in de kosten! Door een Solr server in te zetten wordt de webserver niet belast en hebben bezoekers van de site geen last van vertragingen. De pagina’s op de site blijven geladen worden met de gewenste snelheid. De zoekopdracht gaat namelijk direct naar een geïndexeerde Solr server. De Solr server wordt periodiek geïndexeerd, de mate van index momenten kun je zelf bepalen. Bij statische websites is 1 x per dag voldoende en dynamische site met veel bezoekers is iedere 5 minuten wellicht een betere keus.

YES open source!
Solr is een open source tool. Door het open karakter kun je op vrijwel alle soorten omgevingen aansluiten door API’s in te zetten. Dit maakt de tool erg krachtig voor een omgeving met bijvoorbeeld verschillende bronnen waarin de informatie is opgeslagen.  Solr kun je op verschillende manieren beveiligen. De administrator is altijd afgeschermd. Je wilt namelijk niet dat iemand zomaar je configuratie kan verstrooien… omdat het een aparte Solr server is zal je site niet onderuit gaan. Zwaarder beveiligen kan ook door eerst een zoekopdracht naar de webserver sturen en van daaruit naar de Sorl server. Dit vraagt wel om meer performance.

aan de slag
Solr is geen complexe oplossing en net als met alle tools is het prettig om enige technische kennis te hebben (of in te schakelen).
1.    Een sorl server opzettenSOLR2
2.    Configureren
3.    Index omgeving opzetten

wat gebeurt er achter de schermen
Als er een zoekopdracht wordt opgegeven, wordt er direct in de Solr index gezocht (tenzij ervoor gekozen wordt dat het verkeer via de webserver moet verlopen). Het doorzoekbaar maken van de index vergt een script. Omdat het een open source toepassing is kun je gebruik maken van bestaande scripts die enige vorm van aanpassing nodig hebben. Zo hoef je niet het wiel opnieuw uit te vinden. Een index bestaat uit verschillende velden bijvoorbeeld een titel, body, keywords. Je kunt vervolgens zelf aangeven in het script welk veld belangrijker is ten opzicht van het andere veld. Je kunt de velden op mate van de importantie waardes meegeven. Indien een zoekwoord in de titel belangrijker is dan geef je deze een hogere waarde dan in bijvoorbeeld de body.

e-office en Solr
Bij e-office doen we regelmatig zelf (onafhankelijk) onderzoek naar producten en diensten die de bestaande omgevingen kunnen verrijken of verbeteren. Solr is een van de producten waar onderzoek naar gedaan is en naar tevredenheid wordt ingezet bij onze klanten. e-office verzorgt de installatie op de server, het aanpassen van scripts en het beheer van de server(s).

working out loud: podcast to the max

Podcast

working out loud: podcast to the max

Tja, podcasts, is dat niet iets van 10 jaar terug? Maar als je steeds meer collega's hoort vertellen hoeveel kennis zij opdoen door het luisteren van podcasts tijdens hun woon-werk-verkeer, dan ga je je er toch eens in verdiepen. En

lees verder
website VeiligheidNL live

blogpost

website VeiligheidNL live

e-office ontwikkelt al sinds 1996 applicaties voor VeiligheidNL, zo ook de corporate website en vele themasites. VeiligheidNL is al meer dan 30 jaar de onafhankelijke expert op het gebied van ongevallen en veilig gedrag. VeiligheidNL staat in Nederland onder andere

lees verder
feedback