Weekly Nerd
Stop using JS Web Monetization GSAP Imperative and Declarative Hackers Everwhere Kassa's van Niels Leenheer IDEA11Y Outside The Box accesibiatyLaika is een AI-tiener die uitsluitend is opgevoed door sociale media. Dit heeft geleid tot veel negatieve effecten, zoals depressie en een kort concentratievermogen.
De opkomst van AI-aangedreven steminterfaces
Vroeger moest je via Google meerdere pagina’s doorzoeken om informatie te vinden. Nu hebben we ChatGPT, waarmee je alles kunt vragen in een natuurlijk gesprek. Een voorbeeld hiervan is Presiparrot, een project van Dave dat opnieuw tot leven is gebracht dankzij AI.
Geschiedenis van spraakherkenning
In de jaren 1950-1960 werd spraakherkenning ontdekt.
In de jaren 1960-1970 werd het verbeterd.
Rond 1990 werd het vaker gebruikt door consumenten.
In de jaren 2000 deed Google er onderzoek naar.
In de jaren 2010 kregen we Siri en Alexa.
In 2020 werd spraak naar tekst (voice-to-transcript) standaard in tools zoals Microsoft Teams.
Tegenwoordig kan spraak direct gekoppeld worden aan systemen zoals ChatGPT.
Speech API
API wordt gebruikt in moderne browsers.
Het systeem kan herkennen wat je zegt en verbetert naarmate je langer praat.
Op Daves laptop werkt dit momenteel al voor meerdere talen, maar je moet handmatig schakelen tussen talen.
Speech Synthesis
Dit is de ‘output voice’ – oftewel, de stem die de AI gebruikt om terug te praten. De kwaliteit van de stem is nog niet perfect en klinkt soms onnatuurlijk.
AI als gesprekspartner
AI kan nadenken over wat het terugzegt. Je kunt het een persoonlijkheid geven en context meegeven. Het kan ook "luisteren" en reageren zonder iets actiefs te doen – dus gewoon aanwezig zijn in een gesprek.
“When in doubt, more AI”
Er bestaan betere voicemodulators die natuurlijker klinken, maar ze hebben vaak een zware vertraging. Dit breekt de illusie van een natuurlijk gesprek. Er is een oplossing voor dit probleem: je kunt de stem alvast laten afspelen terwijl de informatie wordt opgehaald (volgens mij werkt dit zo).
Deze presentatie was heel interessant en ik heb veel geleerd over hoe AI kan worden gebruikt om spraakherkenning en spraaksynthese te verbeteren.