JS Speech Synthesis to Node.JS Readable Stream
La fonction de synthèse vocale intégrée de JavaScript est SpeechSynthesis.speak()
. J'utilise discord.js et je souhaite convertir la synthèse vocale en un flux lisible node.js afin de pouvoir le lire en tant que diffusion sur un canal vocal.
J'ai trouvé ce Github Repo , mais cela n'a pas fonctionné pour moi et j'ai eu du mal à le diffuser (De plus, bien que je ne sois pas sûr à 100%, je suppose qu'il enregistre le tts, ce qui n'est pas génial quand traitant de grandes chaînes de texte).
Voici les principales erreurs que j'ai eues lors de l'utilisation du code susmentionné :
The AudioContext was not allowed to start. It must be resumed (or created) after a user gesture on the page.
et
Uncaught TypeError: Cannot read property 'getUserMedia' of undefined
Mon objectif est d'éviter quelque chose comme l'API tts de Google et d'utiliser simplement du JavaScript natif. Est-il possible de convertir la synthèse vocale en un flux lisible que je peux utiliser dans discord.js ? Si c'est le cas, comment? Ou existe-t-il un moyen d'utiliser le référentiel précédent? S'il vous plaît aidez-moi, ce serait très apprécié.
(également, je suis conscient que discord a un bouton tts intégré pour lire les messages - c'est pour quelque chose de complètement différent)
Réponses
l'API Web Speech (SpeechSynthesis.speak()) utilise l'implémentation de synthèse sous-jacente du système d'exploitation ou du navigateur et ne passe pas par l'API Web Audio. Ce référentiel Github utilise en fait le microphone de votre système pour enregistrer la sortie vocale. Ce n'est pas une bonne idée, sauf comme un hack. Vous devrez utiliser autre chose pour générer le contenu - peut-être Say.js qui est multi-navigateur et fonctionne directement dans node.js ?