Zoekresultaten moeten aansluiten bij zoekvraag

04-01-2013 11:23 | Door Anja van der Lans | Lees meer artikelen over: Metadata | Er zijn 2 reacties op dit artikel | Permalink
Computable Expert
Anja van der Lans
Anja van der Lans MBA

Senior Consultant Advisory

Expert van Computable voor de topics: ECM, BPM en Business Intelligence

Meer

Het kunnen terugvinden van informatie door middel van zoeken op metadata lijkt steeds minder van belang te zijn; de maker bekommert zich meer om het willen zenden van een boodschap dan om het publiek dat daarmee wordt bereikt. De relatie tussen de zoekvraag en het zoekresultaat is op losse schroeven komen te staan; vraag en aanbod zijn uit elkaar gegroeid. In deze blog vijf tips om de zoekresultaten beter aan te laten sluiten bij de zoekvraag.

In het verleden deden makers van content veel moeite om te zorgen dat hun content ook gevonden zou worden op het moment dat deze gezocht werd. Dat deden ze door vooraf veel aandacht te besteden aan een goede titel, een goede samenvatting en het toevoegen van trefwoorden om toch vooral op de juiste plek in de catalogus boven water te komen. Het aanbrengen van ‘terugzoekwoorden’ (metadata) is tijdrovend en intensief. Daarom hebben veel organisaties deze activiteit de laatste jaren geschrapt.

Of het nu gaat om social media waar iedereen in een minimum aantal tekens laat weten wat hij/zij van iets vindt of om websites waar pagina’s content niet worden voorzien van terugzoekwoorden (gelabeld), de zoekmachine moet het maar kunnen presenteren en zo nodig intelligentie toevoegen zodat de resultaten gaan aansluiten bij de zoekvraag. De realiteit is dat dit zelden of nooit lukt. De opbrengst van een zoekactie(recall) en de relevantie van de gevonden resultaten (precision) liggen mijlenver uit elkaar.

Voor zoeken op het internet (websearch) ervaren we dit fenomeen niet als hinderlijk omdat het meestal gaat om het snel kunnen vinden van een feitje of een indruk krijgen van een onderwerp. Maar voor zoeken binnen organisaties is dit echter een kleine ramp. Medewerkers krijgen teveel resultaten, het selecteren van de juiste relevante informatie kost teveel tijd en de betrouwbaarheid van de informatie komt onder druk te staan. Ook voor de ontsluiting van informatie geldt garbage in is garbage out. De enige oplossing voor dit probleem lijkt toch weer de mens in te schakelen. Als we de intelligentie niet meer vóóraf willen toevoegen, bij het moment van aanbieden aan de zoekmachine, dan moet het misschien achteraf alsnog als we gaan zoeken naar de informatie.

Hoe brengen we zoekvraag en zoekaanbod bij elkaar? Dat is de vraag waarop iedereen een antwoord wil. De gouden tip die een 100 procent match garandeert is er (nog) niet.

Hier vijf tips om de zoekresultaten tot die tijd alvast beter aan te laten sluiten bij de zoekvraag:

• Social tagging
Vraag de gebruikers van de zoekmachine om de zoekresultaten te voorzien van trefwoorden (tags). Wat we zien is dat gebruikers heel goed in staat zijn om aan te geven onder welke woorden zij verwacht hebben de content te vinden; al deze woorden bij elkaar kunnen dienen om alsnog kenmerken aan de content toe te kennen; in de vakliteratuur noemt men dit een folksonomie bouwen versus een traditionele thesaurus gebruiken; actie gebruiker

• Social rating
De betrouwbaarheid van informatie staat sterk onder druk. Hoe weet ik als argeloze gebruiker of de content waardevol is, of de inhoud klopt. 100 procent zekerheid hierover is onmogelijk te geven maar een waardering voor de content vanuit een aantal eerdere gebruikers geeft een goede indicatie; actie gebruiker

• Facet navigatie
De content in de juiste rubriek (facet) tonen noemen we classificeren van de informatie. Een zoekmachine kan facetten tonen als we aangeven welke onderdelen onder het facet vallen. De onderdelen uit een facet noemen we een entiteit. De lijstjes met entiteiten bepalen wat de gebruiker ziet in de rubriek (facet). Door de zoekmachine achteraf deze lijstjes te laten matchen op de inhoud van de index kan een rubriek worden getoond. De rubriek helpt de gebruiker om snel het aantal resultaten te beperken en tegelijkertijd alleen relevante content over te houden in het zoekresultaat; actie beheerder

• Synoniemenlijsten bouwen en onderhouden
Een taal ontwikkelt zich; elke dag worden nieuwe woorden gevormd of geleend uit een andere taal, afkortingen ontstaan. Het is de kunst om relaties tussen deze woorden aan te brengen zodat de resultaten uit het nu én het verleden samen gepresenteerd kunnen worden aan de gebruiker; actie beheerder

• Analyseren van zoekgedrag van gebruikers op internet en op de site
Gebruikers gaan naar Google.com of een andere (web)zoekmachine om snel informatie te vinden. De termen waarop men zoekt worden vastgelegd in log files. Door deze te bekijken en een patroon te vinden in het gedrag van de gebruiker kan de eigenaar van de content besluiten deze content aan te passen; andere woorden te gebruiken in de content, tags mee te geven die aansluiten, facetten aan te passen, synoniemen toe te voegen.; actie beheerder

Al met al een hele klus om dit goed te doen. Niet alle zoekmachines kunnen deze tips volledig standaard ondersteunen, vaak moet extra functionaliteit worden ingebouwd, let daar dus op wanneer je moet gaan kiezen/implementeren. De content wordt niet voor niets gemaakt, het moet uiteindelijk iets opleveren; geld, kennis, ontwikkeling of conversie genereren. Daar mag dan ook van verwacht worden dat er aandacht aan besteed wordt, men wil gevonden worden. De beste manier om dit te doen is niet te vertrouwen op alleen de ingebouwde intelligentie van (web)zoekmachines maar toch vooral het heft in eigen handen te nemen.
Reacties op dit artikel
De redactie vindt deze reactie: OKEwout Dekkinga, 04-01-2013 22:11
Anja,
 
Ik heb toch enige vragen omtrent het voorkomen van garbage in, garbage out principe aangaande je tips. Zo hebben deze volgens mij het nadeel dat hierbij het aantal uiteindelijk een zwaardere weging lijkt te hebben dan kwaliteit en relevantie waardoor de zoekresultaten dus wederom te beïnvloeden zijn. Iets wat we dan ook elk jaar weer zien met de nieuwe woorden van het jaar, waarvan we er gemiddeld 1500 per jaar van hebben in onze taal. Maar dat is waarom je waarschijnlijk elke tip beëindigd met 'actie beheer' waarmee bij mij dus de vraag opkomt hoeveel werk dit is?
De redactie vindt deze reactie: OKAnja van der Lans, 07-01-2013 9:14
Dag Ewout,
Goede vragen die ook in de praktijk regelmatig aan mij en mijn collega's gesteld worden. Kwaliteit en relevantie zijn subjectieve begrippen die zeer persoonsgebonden zijn als we het hebben over zoekresultaten; wat voor de een heel bruikbaar is in de beantwoording van de vraag bevat voor een ander geen nieuwe informatie en dan vaak niet relevant. Je stelt terecht dat een levende taal nieuwe woorden oppikt die dan tijdelijk aandacht vragen, toch blijft van deze grote verzameling nieuwe woorden na verloop van tijd heel weinig over dat in ons collectieve geheugen blijft hangen en daarmee een kans maakt om teruggezocht en gevonden te worden. Het werk dat de beheerder heeft (en dat is dan de functionele beheerder of applicatiebeheerder) is om de logfiles van de zoekapplicatie uit te pluizen en de content of de metadata van de content aan te (laten) passen op veelgevraagde zoekvragen waarop geen resultaten terugkomen terwijl er wel content over het onderwerp aanwezig is. De match "gebruikte zoekterm" versus "aangeboden content" kan de beheerder op die manier tot stand brengen. Tja en hoeveel werk dat is? Dat hangt van veel factoren af, maar een heel belangrijke factor is dat de contentproducent een goed gevoel heeft voor het publiek waarvoor geschreven wordt, gebruik geen termen die alleen intern gebruikt worden als je content gepubliceerd wordt op het internet. Daar zien we het in de praktijk nogal eens misgaan; het is voor organisaties blijkbaar heel moeilijk om outside in te denken in plaats van inside out. Het is een kwestie van bewustwording kweken en in het begin kan dit wel een paar uur per week kosten, na verloop van tijd wordt dat steeds minder, maar helemaal verdwijnen (in de zin van helemaal geen tijd meer kosten) zal het nooit omdat ontwikkelingen nu eenmaal niet stoppen en dus nieuwe termen/woorden zullen blijven komen.
6 vacatures
MS Dynamics NAV Specialist

Ammeraal Beltech B.V. , Heerhugowaard

Co\u00f6rdinator datawarehouse

Inspectie van het Onderwijs, Directie Kennis , Utrecht

Database Administrator

Waterland Ziekenhuis , Purmerend

Data Migration IT Specialist

Uitzendburo de Werkstudent , Amsterdam

Senior Database Administrator

VWE voertuiginformatie en -documentatie , Heerhugowaard

Top 10 Reagerende members
  Aantal reacties
met 3+ sterren
Gemiddelde
waardering
Klik voor meer info1 1563 6.2
Klik voor meer info2 1299 6.0
Klik voor meer info3 1266 6.2
Klik voor meer info4 1069 6.2
Klik voor meer info5 976 6.1
Klik voor meer info6 901 6.1
Klik voor meer info7 755 6.2
Klik voor meer info8 521 6.1
Klik voor meer info9 397 6.0
Klik voor meer info10 391 6.2