In het Europese onderzoekscentrum van Xerox in Grenoble is software ontwikkeld die automatisch documenten scant en rubriceert. De software is bedoeld om bedrijven te helpen bij het opslaan en ordenen van elektronische documenten.
|
De software kan uit enkele voorbeelden zelf leren hoe documenten hiërarchisch geclassificeerd moeten worden in bestaande categorieën. Ongeorganiseerde elektronische bestanden komen automatisch terecht in zuiver gelabelde documentverzamelingen. Bovendien kan het systeem zelf nieuwe categorieën aanmaken; de software ontdekt nieuwe of zich ontwikkelende onderwerpen en doet vervolgens dynamische voorstellen voor nieuwe categorieën.
De categoriseringstechnologie is geschreven in Java en draait op Unix, Linux en Windows. Xerox hoopt dat de technologie in licentie zal worden genomen door softwareontwikkelaars of bedrijven die deze technologie willen inbouwen in hun documentsystemen, zoals systemen voor ‘customer relationship management’, informatie-opvraging en gegevensbeheer.< BR>