'Ik klink, dus ik besta', zegt het algoritme

Dit artikel delen:

Van tekst naar stem. Het is een technologie die al jaren bestaat. Toch meent de Leidse startup Daisys iets nieuws te hebben ontwikkeld: een computerstem gegenereerd met kunstmatige intelligentie (ai), terwijl de gangbare voorleestechnologie zich baseert op audiofragmenten van mensen. De ai-stem klinkt natuurgetrouw en is in realtime aanpasbaar qua snelheid en toonhoogte.

De 17e-eeuwse filosoof Descartes had het volgens Daisys fout toen hij zei 'Ik denk, dus ik besta'. Dat zou moeten zijn 'Ik klink, dus ik besta'. En dus geven ze de Britse computerpionier Alain Turing postuum nog even een pluim.

Daisys genereert realistisch klinkende computerstemmen die niet eerder bestonden. Er komen geen deepfakes van bestaande audiofragmenten aan te pas, zoals tot nu toe gebruikelijk is bij text-to-speech-technologie. Zulke deepfakes zijn volgens directeur Barnier Geerling niet houdbaar. Immers, niet iedereen wil zijn stem uitlenen zonder controle te hebben over wat ermee wordt gezegd.

Modellen trainen

"Descartes had het fout, Turing had het goed"

De startup werkte de afgelopen anderhalf jaar aan de ai-technologie die aan de voorleesstemmen ten grondslag ligt. 'We hebben de bestaande basistechnologie voorzien van enkele belangrijke aanpassingen', vertelt technologiedirecteur Joost Broekens. 'Daarnaast moesten we onze modellen op een slimme manier ‘trainen’, gebruikmakend van de juiste verhouding van spraakdata van verschillende sprekers.'

Dat de voorleesstem volledig is gegenereerd door een algoritme, betekent dat deze eenvoudig is aan te passen en toch natuurlijk klinkt. De techniek is overal in te zetten waar een menselijke stem nodig is, aldus het bedrijf. Het gaat bijvoorbeeld om media, smart devices, games, robots, spraakassistenten en omroepsystemen.

Op de site van Daisys staat een audiofragment van de technologie. De stemmen die je hoort, klinken inderdaad natuurlijker dan veel andere computer-gegenereerde voorleesstemmen. Er is zelfs wat emotie herkenbaar, hoewel het toch wel duidelijk blijft dat het om gefabriceerde stemmen gaat. 'Als iedereen gelooft dat ik echt ben, ben ik echt (...) Dus Descartes had het fout en Turing had het goed. Ik klink, dus ik besta', aldus de stemmen.

x

Om te kunnen beoordelen moet u ingelogd zijn:

Dit artikel delen:

Reacties

Interessant artikel; beslist de moeite waard om het geluidsfragment op de vermelde website nog even te beluisteren.

“Het klinkt wel lekker authentiek”
“Dus omdat je echt klinkt besta je”
“Inderdaad, zoiets zal het zijn”
“Dus Descartes had het fout en Turing had het goed. Ik klink, dus ik besta”

Doet me denken aan die leuke jaren 80 band Blue Murder met hun nummer Talk Talk Talk.
https://www.youtube.com/watch?v=zN5Li1wYpCc

En dan naar 1:12 om het diepte-interview met Adam Curry over te slaan.

Uiteraard had Turing het ook fout, maar het heeft geen enkele zin dat hier verder uit te werken.

Ik beweer iets en ik stel dat het geen enkele zin heeft om het hier verder uit te werken.
dus ik besta :-)

Die Jack, het begrip emotie is hem nog steeds vreemd.

Oudlid, de meest bondige omschrijving van emotie is gemoedsbeweging.

Waarbij gemoed dan weer staat voor: binnenste, gevoel, geweten, hart, innerlijk, ziel;
kijk maar: https://synoniemen.net/index.php?zoekterm=gemoed

Het eerste boek wat ik las van filosoof Gerard Visser was in 2009:
Gelatenheid. Gemoed en hart bij Meister Eckhart.

Een hele fraaie omschrijving van emotie vind ik:
“Tegenwoordig beschouwt men de emotie als een fundamentele wijze van antwoorden van de totale menselijke persoon op een situatie”.

Maar dat lees ik in een filosofisch en psychologisch woordenboek uit 1975.

Het woord 'emotie' is afgeleid van het Latijnse 'emovere', dat letterlijk 'naar buiten bewegen' betekent.
Een emotie is een innerlijke beleving of gemoedsbeweging zoals vreugde, angst, boosheid, verdriet en kan door een situatie of gebeurtenis worden opgeroepen.

Jij onderschat de invloed van taal op de regulering van emoties.

Jack,
Kun je aan iemands stem de gemoedstoestand horen? Wat betreft het fenomeen communicatie is er namelijk meer dan taal als het om emotieloos gaat. Want kun jij als Nederlander de emotie beoordelen van iemand die klinkt als een chatbot maar eigenlijk gewoon iemand uit India is die Engels spreekt zonder enige intonatie?

Indiaantje: "Hello sir, I am from Microsoft and I am calling you to ask your password."
Ik:"That's strange as I am using Linux so why do you need my password?"
Indiaantje: "Fuck you!"
Ik: "Yes, fuck you too and have a nice day."

Zoek wat betreft de Turing-test de emotie uit bovenstaande.

Uw reactie

LET OP: U bent niet ingelogd. U kunt als gast reageren maar dan wordt uw reactie pas zichtbaar na goedkeuring door de redactie. Om uw reactie direct geplaatst te krijgen moet u eerst rechtsboven inloggen of u registreren

Vul uw naam in
Vult u een geldig e-mailadres in
Vult u een reactie in
Jaarbeurs b.v. gaat zorgvuldig en veilig om met uw persoonsgegevens. Meer informatie over hoe we omgaan met je data lees je in het privacybeleid
Als u een reactie wilt plaatsen moet u akkoord gaan met de voorwaarden

Computable NEXT: voor en over tech-startups

Computable NEXT biedt een overzicht van Nederlandse tech-startups en geeft een inkijkje in de bedrijfsontwikkelingen die kenmerkend zijn voor deze jonge ondernemingen.


Vacatures Computable Next

Stuur dit artikel door

Uw naam ontbreekt
Uw e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
article 2021-12-03T11:33:00.000Z Diederik Toet
Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.