Questions marquées [speech-to-text]

0 votes
0 réponses
Diffusion audio en continu de Xamarin Forms à l'aide de Plugin.AudioRecorder et envoi à Google Cloud Speech V1
J'utilise Plugin AudioRecorder dans le projet Xamarin Forms et j'essaie de diffuser l'audio vers Google Cloud Speech V1. Si j'utilise l'approche...
-1 votes
0 réponses
Problème de reconnaissance vocale Non pris en charge par le périphérique MI A2 Android version 9
J'ai mis au point une application mobile hybride AI de reconnaissance vocale. Cette application prend en charge tous les appareils Android, à l'...
0 votes
1 réponses
Un moyen de convertir la parole en texte comme google do for searchbox for iphone?
Comment convertir un discours en texte sur un navigateur iphone chrome. J'ai fait en utilisant l'API de reconnaissance vocale pour les appareils...
-3 votes
0 réponses
le moyen le plus simple de convertir bit pour fichier wav pour la reconnaissance vocale en texte [fermé]
Nous avons des journaux pour le centre d’appel qui parle entre le client et l’exportation dans le fichier 0600350991111101035062, mais lorsque n...
1 votes
1 réponses
Discours en texte: transfert du flux du microphone vers Watson STT avec NodeJS
J'essaie actuellement d'envoyer un flux de microphone au service Watson STT mais, pour une raison quelconque, le service Watson ne reçoit pas le...
a demandé il y a 1 mois
0 votes
0 réponses
Comment résoudre le problème si AWS Transcribe ne montre pas la classification de l'audio dans des canaux distincts?
Je transcris un appel du centre d'appels de 56 secondes avec deux haut-parleurs (un représentant et un client) en activant l'identification du c...
a demandé il y a 1 mois
-4 votes
0 réponses
Comment puis-je améliorer mon audio pour l'utiliser dans la synthèse vocale?
J'utilisais l'API vocale en nuage et la configuration audio suivante est la suivante: ffmpeg-normalize xxxx.webm -nt ebu -t -16 -lrt 11 -tp -3...
a demandé il y a 1 mois
0 votes
1 réponses
Erreur de réception «Non autorisé» lors de l'accès au service de synthèse vocale IBM en suivant l'exemple de code dans IBM Tutorial
Je suis un exemple de code tiré de Tutoriel de mise en route IBM speech-to-text pour transcrire un fichier audio" flac "téléchargé à partir du...
a demandé il y a 1 mois
0 votes
0 réponses
Comment convertir un discours en fichier texte dans Matlab à l'aide d'un logiciel tiers
Je cherche depuis longtemps à convertir un discours en un fichier texte dans MATLAB en utilisant un APi tiers ..Il est possible dans Matlab en u...
a demandé il y a 1 mois
-1 votes
0 réponses
Horodatage de l'API speech-to-text de Google (pas en nuage) [fermé]
J'utilise Google Speech Recognition à partir de https://pypi.org/project/SpeechRecognition/. Je sais que l'API Google Cloud a une option pour l...
a demandé il y a 1 mois
0 votes
0 réponses
Quota de requêtes et utilisation actuelle de l'API google speech to text
Je suis en train de développer une application qui utilise l'API Google Speech to Text et je souhaite connaître à l'aide d'une API Google mon ut...
a demandé il y a 1 mois
1 votes
1 réponses
Erreur lors du passage du fichier audio dans watson websocket: [SSL: BAD_LENGTH] longueur incorrecte (_ssl.c: 2341)
J'essaie d'identifier les utilisations de "gestionnaire", "garantie" et "remplacement" dans un fichier audio à l'aide de la commande watson spee...
a demandé il y a 1 mois
0 votes
0 réponses
Comment arrêter le nœud js google speech-to-streaming
J'utilise une API google speech to text pour la transcription de la voix en texte. J'essaie de mettre fin à ce service lorsque nous atteignons i...
a demandé il y a 2 mois
0 votes
0 réponses
API Google Speech-to-Text pour Android détecter automatiquement la langue avec la version bêta de RPC
J'essaie d'implémenter une application pour Android qui utilisera l'API Google Cloud Speech To Text avec détection automatique du langage. Dans...
0 votes
0 réponses
Existe-t-il un moyen de travailler avec la bibliothèque fluent-ffmpeg pour l’encodage audio (webm en wav / mp3) dans Angular 2+?
J'utilise donc les objets multimédias du navigateur pour enregistrer de l'audio à l'aide d'un microphone pour la transcription de parole en text...
0 votes
1 réponses
Comment transcrire le texte audio intégral d'un fichier .wav?
Il ne s'agit pas de la transcription d'un fichier audio complet et le processus est passionnant avant de transcrire le fichier audio complet. Il...
a demandé il y a 2 mois
0 votes
0 réponses
Erreur Google Speech to Text: spécifiez le codage FLAC pour correspondre à l'en-tête du fichier.
J'essaie l'exemple Google Speech to Text pour PHP. arbre /maître /discours J'ai été en mesure de transcrire correctement le fichier brut:...
a demandé il y a 2 mois
1 votes
1 réponses
Comment mapper l'audio pour cibler la transcription du texte
Je suis novice en apprentissage en profondeur. Je réalise une reconnaissance vocale de base de bout en bout à l’aide de l’API de tensorflow, du...
0 votes
2 réponses
Comment réparer lorsqu'un service a été bloqué par la politique cors: aucun en-tête 'access-control-allow-origin' n'est présent sur la ressource demandée
J'essaie d'accéder au service de synthèse vocale fourni par IBM Watson dans mon application NodeJs, mais je constate une erreur de refus d'accès...
a demandé il y a 2 mois
0 votes
1 réponses
Erreur de délai d'attente lors de l'utilisation de long_running_recognize ()
J'essaie de transcrire un fichier audio à l'aide de l'API Google Speech et j'utilisais long_running_recognize. Cela a fonctionné une fois mais m...
0 votes
1 réponses
Comment authentifier SpeechClient V1 avec keyfile (PHP / Laravel)
J'essaie d'authentifier SpeechClient en utilisant les paramètres 'keyFilePath' et 'projectId' comme suit: $speech = new SpeechClient([...
2 votes
1 réponses
API ou SDK pour la reconnaissance vocale uniquement pour les nombres (entre 1 et 10 000)?
J'ai besoin d'une solution spécialisée optimisée pour détecter les nombres compris entre 1 et 1000 à utiliser sur un smartphone. La meilleure so...
a demandé il y a 2 mois
0 votes
0 réponses
Comment puis-je conserver le résultat de la conversion de la parole en texte? [dupliquer]
Dans mon application, je souhaite donner à l'utilisateur les moyens de sélectionner du texte dans une liste et de l'ajouter à un edittext. Toute...
a demandé il y a 2 mois
0 votes
1 réponses
J'ai un mot ou une phrase, existe-t-il un moyen / un logiciel libre pour trouver la probabilité que l'utilisateur ait prononcé ce mot?
J'ai un mot /une phrase, existe-t-il un moyen /un logiciel libre pour trouver la probabilité que l'utilisateur ait prononcé ce mot /cette phrase...
a demandé il y a 3 mois
1 votes
1 réponses
Comment passer le type de modèle dans boost beast websocket
Je travaille avec c ++ 11, la bibliothèque Beast et le service Web IBM de synthèse vocale. L'interface websocket (pour se connecter) a besoin...
a demandé il y a 2 mois