Internet / Achtergrond
Semantisch web lijkt intelligent
Betekenissen die voor mensen zinnig zijn worden ook voor machines ‘zinvol’
Het menselijk brein weet dat het euroteken voor een getal vijf in een catalogus betekent dat het ding ernaast vijf euro kost. U en ik weten ook perfect hoe we op het web de goedkoopste dvd kunnen vinden. Computers weten niet eens waar het over gaat. Het semantisch web kan daar verandering in brengen.
Voor eindgebruikers kan het semantisch web voor dagelijkse dingen een soort expertsysteem worden. Je wilt een afspraak met de kapper op een vrije dag? Het semantisch web zal daar ooit voor kunnen zorgen. Voor het zover is moeten leveranciers als Oracle, IBM, Adobe, Discovery Machine en vele anderen nog hard aan de weg timmeren. In zijn ruwe vorm is de technologie er al, maar zijn er ook al producten?Welbepaalde structuur
Wat het semantisch web zal kunnen, kan in sommige gevallen nu ook al. Het semantisch web is echter wel zo handig, omdat het gebaseerd is op open standaarden en de brug slaat tussen menselijk en machinaal denken. Het semantisch web, een geesteskind van ‘www-uitvinder’ Tim Berners-Lee, is ontwikkeld als aanvulling op het huidige web. Berners-Lee ontwierp het met zijn team om de betekenis van stukjes informatie een welbepaalde structuur te geven, waardoor machines ermee aan de slag kunnen in een voor mensen zinvolle context.Binnen een semantisch kader kunnen we bijvoorbeeld gegevens definiëren en onderling verbinden op zo’n manier dat ze inzetbaar zijn voor een effectieve ontdekking van kennis, de automatisering daarvan en de integratie met van elkaar verschillende toepassingen. Daarnaast moeten de gegevens zelf herbruikbaar zijn over verschillende toepassingen heen. Vooral hier wringt de schoen: informatie uit een erp-systeem is niet noodzakelijk op dezelfde manier gestructureerd als databasegegevens. Het semantisch web overbrugt de verschillen door betekenissen die voor mensen zinnig zijn ook voor machines ‘zinvol’ te maken.
Er zijn diverse toepassingen die van de technieken van het semantisch web gulzig gebruik maken. Een tot de verbeelding sprekend voorbeeld is Adobe’s xmp (extensible metadata platform). In alle Adobe-producten opent de gebruiker na het selecteren van de menukeuze ‘document eigenschappen’ een venster waarin allerlei metadata over een bestand is terug te vinden. Voor digitale foto’s kan dat exif-informatie (exchangeable image file format) zijn die de camera aan de foto heeft gekoppeld, maar het venster bevat veel meer. Ook auteursrechtelijke gegevens, adressen en zelfs instructies voor de ontvanger kunnen in verschillende panelen worden ingevuld.
Ontologie
Semantisch wordt xmp pas echt doordat het gebruik maakt van XML en rdf (resource description framework), en de machine de data kan gebruiken om een automatische werkstroom te organiseren. In drukkerijen resulteert dat in het gebruik van xmp-data om de drukpers te voorzien van de correcte instellingen wat betreft kleuren, resolutie enzovoort. Adobe levert een softwareontwikkeltoolkit waarmee de xmp-gegevens ook kunnen dienen om een jdf-werkstroom (job description format) te organiseren. De programmeur vertaalt de beschrijvende xmp-gegevens dan naar de voorschrijvende jdf-data. Jdf is de schakel tussen de werkstroom op de werkvloer in een drukkerij en de administratieve afdeling.IBM werkt ook aan het semantisch web. Het concern richt zich daartoe op ontwikkelwerktuigen waarmee organisaties zelf systemen kunnen uitbouwen voor bijvoorbeeld webgebaseerde services. Het concern levert vooral instrumenten voor handmatige creatie en ontologie (eigenschappenleer) en werktuigen om toegang daartoe te verschaffen via zoeken en bladeren door zowel mensen als toepassingen. Daarnaast levert het tools om automatisch eigenschappen te creëren uit documenten, om multimedia, foto’s en dergelijke te verrijken met metadata door deze te voorzien van labels.
IBM is ook betrokken bij het ontwikkelen van de standaarden die nodig zijn om dat alles in een gedistribueerde omgeving te kunnen gebruiken, wat een stap verder is dan gewone webservices: semantische webdiensten. Vooral in het domein van het onttrekken van eigenschappen aan documenten begeeft IBM zich in het vaarwater van wat vroeger kunstmatige intelligentie heette. Het semantisch web heeft dan ook raakvlakken met natuurlijke taalanalyse en -generatie. IBM’s ai-werktuig (artificial intelligence) heet ABLE (Agent Building and Learning Environment).
Het concern legt de nadruk wat betreft praktische toepassingen voorlopig vooral op soa (service-oriented architecture). Webservices zijn ‘intelligent’ en efficiënt te maken via semantischwebtechnologie. Daarnaast ziet IBM nu al toepassingen in de farmaceutische industrie, waar dankzij die technologie onderzoekers razendsnel de verbanden tussen moleculen en hun werking kunnen zien in een simpele browser.
Beslissingsbomen
Een kleine leverancier die in Europa slechts marginaal aanwezig is, Discovery Machine, gebruikt semantischwebtechnologie om trainingen te leveren aan de Amerikaanse marine. Dit bedrijf maakt geen gebruik van kunstmatige intelligentie, maar wel van eigenschappen en een zelf ontwikkeld systeem dat net als IBM’s ABLE leert - in dit geval van wat de gebruiker in het systeem invoert als antwoord op vragen.Ook Oracle werk aan het semantisch web. De database ondersteunt SPARQL/rdf, XQuery/XML en SQL/rdbms. Verder herkent de database beslissingsbomen. Ondersteuning voor OWL (Web Ontology Language) is er nog niet, maar voor de nabije toekomst wel gepland. Oracles Han Wammes, market development manager Spatial Information Management, zegt dat zijn eigen specialisme, gis’en (geografisch informatie systeem), terugkomt in bepaalde concepten voor de ondersteuning van het semantisch web van zijn bedrijf. Het ‘netwerk data model’ bijvoorbeeld is in eerste instantie ontwikkeld voor routering, maar ook geschikt voor beslissingsbomen.
Wammes wijst op toepassingen die partners nu al ontwikkelen. Het Amerikaanse Cerebra bijvoorbeeld concentreert zich net als IBM op soa, maar dan met Oracles 10g Release 2 databasetechnologie als fundament. In Nederland ziet Wammes toepassingen van het semantisch web voorlopig vooral nog in de academische sfeer, en ‘life sciences’ zijn er volgens hem druk mee bezig. “Verder is er grote belangstelling vanuit overheidshoek”, aldus Wammes. “Organisaties als het ministerie van Landbouw en het Kadaster tonen belangstelling omdat de met het semantisch web geassocieerde technieken de informatie kunnen helpen ontsluiten over het web, naar eindgebruikers toe.”
Dat ook de defensie-industrie grote belangstelling heeft, is niet verbazingwekkend. Ook de Europese Commissie blijft niet achter: in juni sponsort ESSI (EU 6th framework programma) de derde Annual European Semantic Web Conference in Budva (Montenegro). Daar komen de jongste resultaten op het vlak van onderzoek en toepassingen aan de orde. Deelnemers kunnen ook cursussen volgen om meer te leren over de laatste semantischwebtechnieken.[Erik vlietinck
De basislaag gebruikt uri’s (uniform resource identifier) die urn’s (uniform resource name) omvatten waarmee concepten en dingen op een unieke wijze te identificeren zijn. Daarnaast zijn er binnen het domein van uri’s de url’s (uniform resource locator) om de dingen te lokaliseren. Deze laag is vrijwel identiek aan het http-systeem voor het lokaliseren van webpagina’s. Hoger in het model gebruikt het semantisch web XML (eXtensible Markup Language) en een XML-extensie voor ‘namespaces’ . In een namespace is een uri gemodelleerd als qName; een ‘qualifier’ die het gebruikte woordenboek en het element daarin waar het uri-element op slaat aanduidt. In het semantisch web kunnen verschillende, zelfs overlappende woordenboeken bestaan. Namespaces leveren de unieke identificatie voor elk item in elk woordenboek. De XML-laag is vergelijkbaar met HTML. De volgende laag is ‘rdf model & syntax’ (resource description framework). W3C beveelt deze datalaag aan. De rdf-datastructuur bestaat uit een triplet, waarin een onderwerp, een attribuut en een voorwerp zijn opgenomen. Het zegt iets over een stukje data, gebruikmakend van die structuur. RDF Schema is een taal die rdf-woordenboeken beschrijft. Met deze taal zijn klassen en eigenschappen in hiërarchieën te beschrijven, en het domein en het gamma aan eigenschappen te beperken. Ze zijn daarom belangrijk voor het deduceren van betekenis (inferencing). Een eenvoudige implementatie van deze laag komt overeen met wat bloggers rss (really simple syndication) noemen - een manier om inhoud naar de gebruiker toe te pushen in een nieuwslezertoepassing. De hoogste laag is de ontologie of semantische laag. W3C beveelt op dit niveau het gebruik van OWL (Web Ontology Language) aan. Ontologie is de leer van de algemene eigenschappen van dingen. OWL ondersteunt de uitwisseling tussen alle vormen van eigenschappen. Die zijn namelijk op verschillende manieren uit te bouwen: in een systeem van vakjes, gebaseerd op diagrammen met verbindingen, of gewoon door betekenissen te beschrijven. Met de ontologielaag zijn eigenschappen terug te brengen tot hun fundament. Op die manier is deze laag te gebruiken voor geavanceerdere betekenisdeductie dan met RDF Schema mogelijk is. De semantische laag zorgt dat machine en gebruiker het over hetzelfde onderwerp hebben. Iets vergelijkbaars is er niet in het gewone webmodel, afgezien van de ‘tags’ waarmee bloggers tegenwoordig hun inhoud labellen opdat websites als Technorati en De.licio.us gecategoriseerde lijsten kunnen maken.
- 15:55 Werksfeer belangrijkste reden overstap
- 11:41 Kaminsky vond DNS-lek dankzij fitnessongelukje
- 15:59 200 miljoen IPv4-adressen uitgedeeld in 2008
- 10:41 Marktaandeel Firefox groter dan twintig procent
- 09:20 VeriSign dicht SSL-lek
- 15:52 Paspoortchip kan identiteitsfraude vermijden
- 09:14 Microsoft: Lek in SSL is geen groot gevaar
- 13:42 Het einde van de IT-afdeling
- 13:11 Internetbankieren niet meer veilig door SSL-lek
- 14:59 '2009 wordt het jaar van Google'
Het wat en hoe van Systeem & Netwerk Bewaking
Het monitoren van zakelijke TCP/IP-netwerken verdient een goede strategie vanwege het bedrijfskritische karakter ervan. Door zaken vroeg te signaleren kan downtime, problemen met hardware en aanverwante systemen voorkomen worden. Deze whitepaper behandelt hoe je processen voor mapping,...... Download nu
Kansen voor klantenservice telecombedrijven
Hoe hebben ICT-oplossingen invloed gehad op de klantenservice van telecombedrijven? Voor 95 procent van alle ondervraagde telecombedrijven heeft klantenservice de hoogste prioriteit. In hoeverre zij ook voldoen aan hun eigen verwachting en waar verbeterpunten liggen valt in deze whitepaper te lezen.... Download nu
Meer Internet whitepapersIE 7 versus Firefox
Het aandeel Firefox in de browsermarkt is toegenomen ondanks de komst van Internet Explorer 7. Daarmee is het Microsoft met zijn nieuwste internetprogramma niet gelukt om de groei van concurrent Mozilla af te zwakken, stelt Forrester Research.
'Microsoft kon groei van Firefox niet dempen'Twinpack doet financieën via internet
16-07 10:21 Een van de grotere verpakkingsgroothandels in Nederland, Twinpack, is gebruiker van Covide CRM-Groupware en daarover bijzonder tevreden. 'We kunnen nu een goed en op onze...
Meer internet praktijkHet einde van de IT-afdeling
31-12 13:42 Cloud computing, het succes van Salesforce.com, de groei van digitale sociale netwerken. Allemaal tekenen aan de wand: informatietechnologie wordt het domein van een paar grote...
Meer internet achtergrondSlim omgaan met de traditionele database
16-12 14:47 Met de huidige technologieën lijkt het voor bedrijven steeds gemakkelijker te worden om nieuwe klanten te vinden. Zoekmachine marketing, Google AdWords en e-mailmarketing zijn op...
Meer internet opinieAccess point voor geleidelijke migratie naar 11n
03-12 15:17 Lancom Systems introduceert de L-315agn dual Wireless, een dual draadloze access point. Het apparaat omvat twee draadloze modules die zowel werken op de 2,4 als de 5 GHz...
Meer internet productenBekijk de leveranciers op het gebied van Internet.

