BrainCreators lanceert BrainMatter, een nieuw platform waarmee organisaties data kunnen labelen. Via BrainMatter kunnen op grote schaal datasets worden beoordeeld en voorbereid op geavanceerde AI-toepassingen. Ieder AI-project begint met het analyseren van beschikbare datasets. Hiervoor is het noodzakelijk om de data eerst te labelen, oftewel als een bepaald type informatie te kenmerken. BrainMatter stroomlijnt dit proces en levert zo op een efficiënte manier de input voor AI-projecten.
“Data is de brandstof van AI en BrainMatter helpt om de kwaliteit van de data te verbeteren”, zegt Jasper Wognum, medeoprichter en CEO van BrainCreators. “Modellen en algoritmes zijn niet de grootste uitdaging bij machine learning, de uitdaging ligt bij de data. Ons platform stelt gebruikers in staat om grote datasets eenvoudig te importeren en te prepareren.”
Voorbeelden van rauwe, ongestructureerde data die met BrainMatter gelabeld kunnen worden zijn audiofragmenten, afbeeldingen, numerieke data en tekst. De bruikbaarheid, en dus de waarde van deze data, hangt vaak af van het feit of individuele items een label krijgen om een bepaalde duiding te geven. Bijvoorbeeld: over welk onderwerp gaat deze tekst of welke objecten zijn zichtbaar op deze afbeelding? Correcte labels zijn cruciaal om het gebrek aan structuur in de gegevens te verhelpen. Gelabelde gegevens zijn daarom essentieel voor de toepassing van AI.
Het BrainMatter-platform is uniek omdat het zelflerend is. Zodra een bepaalde hoeveelheid data is gelabeld, zal het systeem vervolgens labels adviseren en gebruikers helpen om de overige data snel en correct te labelen. Met elke iteratie maakt het model betere voorspellingen, waardoor de gebruiker efficiënter kan werken. Verder kunnen via BrainMatter teams worden aangestuurd en beleidsregels worden ingesteld die ervoor zorgen dat labels op de juiste manier aan de data worden toegewezen.
Het is voor gebruikers mogelijk om gedurende iedere stap in het proces een audit uit te voeren. Zo is altijd terug te leiden welke data op welke manier werd gelabeld. Indien wenselijk kunnen er op deze manier ook gericht aanpassingen worden gedaan.Het is belangrijk dat de gelabelde data consistent en goed verdeeld zijn over de diverse labels die het model zou moeten leren. Bruikbare hoeveelheden data kunnen oplopen tot miljoenen database-rijen of terabytes aan afbeeldingen. Het bouwen van een grote, hoogwaardige dataset kan dus een arbeidsintensieve en kostbare operatie zijn. Uiteindelijk verbetert BrainMatter de kwaliteit van de AI-oplossingen.