'Ik klink, dus ik besta', zegt het algoritme

Van tekst naar stem. Het is een technologie die al jaren bestaat. Toch meent de Leidse startup Daisys iets nieuws te hebben ontwikkeld: een computerstem gegenereerd met kunstmatige intelligentie (ai), terwijl de gangbare voorleestechnologie zich baseert op audiofragmenten van mensen. De ai-stem klinkt natuurgetrouw en is in realtime aanpasbaar qua snelheid en toonhoogte.

De 17e-eeuwse filosoof Descartes had het volgens Daisys fout toen hij zei 'Ik denk, dus ik besta'. Dat zou moeten zijn 'Ik klink, dus ik besta'. En dus geven ze de Britse computerpionier Alain Turing postuum nog even een pluim.

Daisys genereert realistisch klinkende computerstemmen die niet eerder bestonden. Er komen geen deepfakes van bestaande audiofragmenten aan te pas, zoals tot nu toe gebruikelijk is bij text-to-speech-technologie. Zulke deepfakes zijn volgens directeur Barnier Geerling niet houdbaar. Immers, niet iedereen wil zijn stem uitlenen zonder controle te hebben over wat ermee wordt gezegd.

Modellen trainen

"Descartes had het fout, Turing had het goed"

De startup werkte de afgelopen anderhalf jaar aan de ai-technologie die aan de voorleesstemmen ten grondslag ligt. 'We hebben de bestaande basistechnologie voorzien van enkele belangrijke aanpassingen', vertelt technologiedirecteur Joost Broekens. 'Daarnaast moesten we onze modellen op een slimme manier ‘trainen’, gebruikmakend van de juiste verhouding van spraakdata van verschillende sprekers.'

Dat de voorleesstem volledig is gegenereerd door een algoritme, betekent dat deze eenvoudig is aan te passen en toch natuurlijk klinkt. De techniek is overal in te zetten waar een menselijke stem nodig is, aldus het bedrijf. Het gaat bijvoorbeeld om media, smart devices, games, robots, spraakassistenten en omroepsystemen.

Op de site van Daisys staat een audiofragment van de technologie. De stemmen die je hoort, klinken inderdaad natuurlijker dan veel andere computer-gegenereerde voorleesstemmen. Er is zelfs wat emotie herkenbaar, hoewel het toch wel duidelijk blijft dat het om gefabriceerde stemmen gaat. 'Als iedereen gelooft dat ik echt ben, ben ik echt (...) Dus Descartes had het fout en Turing had het goed. Ik klink, dus ik besta', aldus de stemmen.

x

Om te kunnen beoordelen moet u ingelogd zijn:

Dit artikel delen:

Reacties

Interessant artikel; beslist de moeite waard om het geluidsfragment op de vermelde website nog even te beluisteren.

“Het klinkt wel lekker authentiek”
“Dus omdat je echt klinkt besta je”
“Inderdaad, zoiets zal het zijn”
“Dus Descartes had het fout en Turing had het goed. Ik klink, dus ik besta”

Doet me denken aan die leuke jaren 80 band Blue Murder met hun nummer Talk Talk Talk.
https://www.youtube.com/watch?v=zN5Li1wYpCc

En dan naar 1:12 om het diepte-interview met Adam Curry over te slaan.

Uiteraard had Turing het ook fout, maar het heeft geen enkele zin dat hier verder uit te werken.

Ik beweer iets en ik stel dat het geen enkele zin heeft om het hier verder uit te werken.
dus ik besta :-)

Die Jack, het begrip emotie is hem nog steeds vreemd.

Oudlid, de meest bondige omschrijving van emotie is gemoedsbeweging.

Waarbij gemoed dan weer staat voor: binnenste, gevoel, geweten, hart, innerlijk, ziel;
kijk maar: https://synoniemen.net/index.php?zoekterm=gemoed

Het eerste boek wat ik las van filosoof Gerard Visser was in 2009:
Gelatenheid. Gemoed en hart bij Meister Eckhart.

Een hele fraaie omschrijving van emotie vind ik:
“Tegenwoordig beschouwt men de emotie als een fundamentele wijze van antwoorden van de totale menselijke persoon op een situatie”.

Maar dat lees ik in een filosofisch en psychologisch woordenboek uit 1975.

Het woord 'emotie' is afgeleid van het Latijnse 'emovere', dat letterlijk 'naar buiten bewegen' betekent.
Een emotie is een innerlijke beleving of gemoedsbeweging zoals vreugde, angst, boosheid, verdriet en kan door een situatie of gebeurtenis worden opgeroepen.

Jij onderschat de invloed van taal op de regulering van emoties.

Jack,
Kun je aan iemands stem de gemoedstoestand horen? Wat betreft het fenomeen communicatie is er namelijk meer dan taal als het om emotieloos gaat. Want kun jij als Nederlander de emotie beoordelen van iemand die klinkt als een chatbot maar eigenlijk gewoon iemand uit India is die Engels spreekt zonder enige intonatie?

Indiaantje: "Hello sir, I am from Microsoft and I am calling you to ask your password."
Ik:"That's strange as I am using Linux so why do you need my password?"
Indiaantje: "Fuck you!"
Ik: "Yes, fuck you too and have a nice day."

Zoek wat betreft de Turing-test de emotie uit bovenstaande.

Oudlid, een scherpe observatie van je, die de omschrijving van emotie als: “een fundamentele wijze van antwoorden van de totale menselijke persoon op een situatie” wel even lijkt te ondergraven.

Wat betreft het onderdrukken van emoties heeft de Amerikaanse psycholoog Alexander Lowen veel gepubliceerd, zoals: Depressie en het lichaam. De lichamelijke grondslag van vertrouwen en werkelijkheid.
Maar hij was dan ook de grondlegger van de bio-energetica.

Op blz. 208 schrijft hij:
“Een individualiteit die niet geworteld is in een diepe gevoelswereld is slechts een façade, een egobeeld.”
“Voelen is het innerlijke leven, expressie is het uiterlijke leven. In deze eenvoudige termen gesteld kan men gemakkelijk zien dat een vol leven een rijk innerlijk leven vereist [rijk in gevoel] en een vrij uiterlijk leven [vrijheid van expressie]. De een kan zonder de ander geen volledige bevrediging schenken. Neem liefde bijvoorbeeld. Het gevoel van liefde is een rijk gevoel, maar de uiting van liefde in woord en daad is een vreugde. “

Interessant is hier ook het ontwikkelen van innerlijke versus uiterlijke waarden
(conform het onderscheid tussen intrinsieke en extrinsieke motivatie).


Jack,
Aangaande de non-verbale communicatie hebben we een equivalent aan onze schriftelijke uitdrukking toegevoegd met emoticons wat tot een geheel eigen communicatie leidt bij bepaalde generaties. En de lichameljk expressie in de beeldspraak van stoom uit je oren zal je mogelijk onbekend zijn omdat je geen lezer van Donald Duck bent maar het lezen van lichaamstaal is niet onbelangrijk in de menselijke communicatie waarin empathie vaak een rol speelt. En ja, zoals toon de muziek maakt zo zal intonatie meer levendigheid brengen in het vertellen van een verhaal. Lees maar eens een verhaaltje voor aan kinderen waarbij je meerdere stemmetjes gebruikt voor de verschillende personen in het verhaal zodat je expressie geeft aan blz. 208. Want aangaande de intrinsieke en extrinsieke motivaties hebben we het m.i. dan ook meer over de wil om iets te doen, bijvoorbeeld de interesse tonen in wat iemand te vertellen heeft. En misschien zou daarom het: Ik klink dus ik besta! omgedraaid moeten worden in: Ik vraag dus ik ben!

"To be or not to be, that is the question!"

Met het risico dat e-book Bertje begint over culturele verschillen in de communicatie is 'Keeping Up Appearances' natuurlijk wel iets om rekening mee te houden want de meesten verwachten geen eerlijk antwoord op het 'How are you?' als het om de schone schijn van een façade gaat. Dat is meer iets voor de hotelbar dan de werkvloer als we kijken naar de totale menselijke persoon IN een situatie als het om het filosoferen van het zijn gaat;-)

Oudlid, je opmerkingen over de schijn ophouden en de culturele verschillen hierin onderschrijf ik volledig. En dan hebben we het nog niet eens gehad over framing: het onbewust beïnvloeden door slim gekozen woorden; de makelaar die liever van volksbuurt spreekt dan van achterstandswijk.

Heel origineel is je idee van “ik vraag, dus ik ben”, aangezien ik al in 2006 uitkwam bij een filosoof die juist stelde: “ik antwoord, dus ik ben” (respondeo, ergo sum).

Nu denk jij dat ik hier weer met de eeuwige Heidegger kom aanzetten, maar het was juist een filosoof die zeer kritisch stond tegenover de existentiefilosofie, met name Heidegger. Met publicaties als “Existenzphilosophie, lebendig oder tot?“ uit 1951 en “Jenseits der Existenzphilosophie” uit 1957, in Nederlandse vertaling verschenen in 1963 met de titel “Filosofie op nieuwe wegen” (Aula 122).

In tegenstelling tot de verschillende ontologieën van het uiterlijke zijn, zoals ontwikkeld door de existentiefilosofen, komt hij in zijn boek uit 1957 tot een “metafysica van het antwoordende innerlijk”.

Op de Duitse wikipedia is de informatie over deze filosoof zeer beknopt:
https://de.wikipedia.org/wiki/Fritz_Heinemann_(Philosoph)

maar er is een linkje te vinden met een indrukwekkende, bondige beschrijving van deze filosoof:
http://www.johanneum-lueneburg.de/homepage/chronik/heineman/heineman.htm

Waarvan ik de kern in vertaling overneem:
Heinemann ontwikkelde een 'resonantiefilosofie' die overeenkomt met de diversiteit van de menselijke bestaansniveaus . De mens als natuurlijk, zinnelijk, reflecterend, vragend, ethisch, maar ook religieus wezen staat als geheel met alle niveaus van de werkelijkheid in een relatie (resonantie). De mens moet reageren op alle uitdagingen waarmee hij wordt geconfronteerd, dat wil zeggen: antwoorden. Daarom is verantwoordelijkheid (Responsabilität) het basisprincipe van Heinemanns antropologie: respondeo, ergo sum (Ik antwoord dus ik ben). Menselijke crises ontstaan wanneer de mens wordt gereduceerd tot deelgebieden en deelantwoorden, d.w.z. de totale resonantie wordt opgeofferd aan de deelresonantie.

Terzijde merk ik op dat resonantie(-ruimte) een centraal, steeds weer terugkerend thema is in het denken van filosoof Gerard Visser (1950). Al in zijn proefschrift uit 1987 (Nietzsche en Heidegger. Een confrontatie) wordt resonantie in één adem genoemd met response (=antwoord): “Deze ervaring van een resonantie, een respons, ligt, zij het verhuld, ook besloten in Nietzsches opvatting van de verhouding tussen ziel en wereld als een spiegelspel” (blz. 340).

Met de existentiefilosofen (Heidegger, Merleau-Ponty) ben ik toch van mening dat het zijn eerder komt dan het wel of niet authentiek (kunnen) antwoorden. Waarmee de metafysica van Heinemann in mijn optiek dus een logisch vervolg is op de voorbereidende ontologieën van de existentiefilosofie. Heel overzichtelijk is de volgorde dus: fenomenologie - existentiefilosofie – metafysica.

Hier volgt de (terechte!) kritiek van Heinemann op de existentiefilosofie:
“De existentiefilosofen hebben zeer nadrukkelijk onderscheid gemaakt tussen oneigenlijke en eigenlijke existentie en zich ingespannen om de eigenlijke existentie te beschrijven. Zij hebben echter vergeten onderscheid te maken tussen oneigenlijke en eigenlijke waarden, ofschoon toch het verschil in *zijn* klaarblijkelijk een verschil in waarde insluit en een existentie geen eigenlijke existentie kan zijn, wanneer zij slechts op uiterlijke waarden gericht is. Een existentie kan zich tot een eigenlijke existentie ontwikkelen, als zij op innerlijke waarden gericht is, en tot een oneigenlijke, als zij door uiterlijke waarden beheerst blijft. “
(F. Heinemann, Filosofie op nieuwe wegen. Aula 122, 1963, blz. 231).

Met je nadruk op de vraag in plaats van het antwoord kom je dus juist uit bij Heidegger!
Het stellen van vragen is een centraal thema in zijn filosofie. Zo luidt de eerste paragraaf van Zijn en Tijd (1927):

“De noodzaak van een nadrukkelijke herhaling van de vraag naar het zijn”.

En een belangrijke voordracht uit 1953 luidde: “Die Frage nach der Technik”; een tekst die zich met 37 bladzijden zeer goed leent voor herhaalde lezing. Deze voordracht begint met een vraag:

“In wat volgt vragen we naar de techniek. Het vragen bouwt aan een weg. Daarom is het raadzaam vooral op de weg te letten en niet te blijven hangen bij losse beweringen en titels. De weg is een weg van het denken. Alle wegen van het denken leiden, meer of minder verneembaar, op ongewone wijze door de taal. We vragen naar de techniek en willen daardoor een vrije houding tegenover haar voorbereiden. Vrij is de houding als ze ons bestaan openstelt voor het wezen van de techniek. Als we aan dit wezen beantwoorden, zijn we in staat het technische in zijn begrenzing te ervaren. “

En eindigt met het vragen:

“Hoe meer wij het gevaar naderen, des te helderder lichten de wegen naar het reddende voor ons op, en des te vragender worden wij. Want het vragen is de vroomheid van het denken. “

https://vantilt.nl/boeken/de-vraag-naar-de-techniek/
https://vantilt.nl/boeken/heideggers-vraag-naar-de-techniek/
https://studenttheses.universiteitleiden.nl/handle/1887/74907

Opvallend is dat je wel vragen stelt aan een ander om inter-esse te tonen (in onderscheid van geïnteresseerd zijn?), dus hardop door gebruik te maken van de stembanden, maar niet ingaat op de vragen die een mens zich innerlijk kan stellen (als een inner talk). Voor alle zintuigen, te weten: het horen, zien, ruiken, proeven en tasten (voelen) geldt dat we naast de uiterlijke, lichamelijk variant een innerlijke variant hebben. Heinemann spreekt hier van een innerlijk zien, horen, handelen, tasten, spreken, denken, waarderen, etc. als tegenhanger van de uiterlijke variant.

Jack,
Als ik de vroomheid van het denken door het vragen vervang dan komen we op nieuwsgierigheid wat dus het emotionele aspect van levende wezens omvat als het gaat om verkenning, onderzoek en leren. En als je met resonantie hierin de echo van een eerdere ervaring bedoeld dan zorgt je 'onderbuik' voor een negatieve connotatie aangaande volkswijken. Tenminste als je begrijpt wat ik bedoel over zijn en tijd als twee variabelen die in verhouding tot elkaar staan als het om de verheffing door ontwikkeling gaat. Aangaande de taxonomie van Bloom is het trainen van een model uiteindelijk namelijk zoiets als belletje van de hondjes van Pavlov als we kijken naar de empirische cyclus van verkenning en onderzoek wanneer het om de emotie gaat.

Aangaande de omschrijving van gemoedsbewegingen stel ik daarom dat reageren meerwaarde heeft want van het instemmende knikje tot het afkeurende schudden kennen we een heel vocabulair aan non-verbale communicatie waarin de techniek dus een grotere rol gaat spelen als het gaat om psychologische manipulatie. Het juiste woord voor volkswijk is dan ook kanswijk hoewel nieuwste ontwikkeling hierin het 'huisjesmelken' verhinderd;-)

Dacht aan een programmaatje uit het commodore 64 tijdperk die dat kon, tekst naar speech. Blikkerig, dit klinkt al een stuk beter al zijn timing en intonatie lastig als je het terugluistert maar het klinkt goed.

De computer is niet eenvoudig maar die filosofie is bij vlagen onnavolgbaar. Ben wel eens begonnen in Heidegger. Onleesbaar, dacht toen is dit nu een denker of een charlatan

Rij je dan ook nog een oude T-Ford Louis? Ik loop niet voorop in de ontwikkelingen maar ik vraag Siri om Whatsapp berichten voor te lezen en dicteer de antwoorden er op, nooit een moment gedacht dat het hier om een mens ging. Oja, het articuleren is wel belangrijk bij het dicteren wt btrft klnkrs;-)

@oudlid Ha ha, nou het scheelt weinig het is geen T-ford maar het is wel auto zonder computer erin. Een zegen. Ik zit met de deep fake in mijn hoofd dat het net echt moet lijken. Articuleren kon deze computerstem wel maar het is net als met die filmpjes is het net niet. Al klonk dit niet slecht. Die goede deep fake filmpjes heb je uiteraard niet door.

Oudlid-louis-jack, geen "eeuwige gouden band"

De toevoeging van Dino heeft (zoals vaak) weinig toegevoegde waarde, het is een reactie zonder medeklinkers en echo als het om de 'Blowin' in the wind' van de filosofische vragen in het leven gaat. Of zou het komen doordat Dino als antwoord op alle vragen over het leven het cijfer 42 geeft?

Nieuwsbrief

Wil je dagelijks op de hoogte gehouden worden van het laatste ict-nieuws, trends en ontwikkelingen? Abonneer je dan op onze gratis nieuwsbrief.

Vul een geldig e-mailadres in

Stuur dit artikel door

Uw naam ontbreekt
Uw e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×
article 2021-12-03T11:33:00.000Z Diederik Toet


Wilt u dagelijks op de hoogte worden gehouden van het laatste ict-nieuws, achtergronden en opinie?
Abonneer uzelf op onze gratis nieuwsbrief.