Étape 3: Le logiciel
Maintenant vous aurez besoin de quelques paquets de logiciels installés avant que nous puissions exécuter notre code. Copiez et collez la commande suivante dans votre terminal pour ce faire :
sudo apt-get update && sudo apt-get install git python-gst0.10 gstreamer0.10-pocketsphinx
Vous aurez également besoin du code réutilisable pour que tout fonctionne - nous avons fourni il ici. Après avoir navigué à l’endroit où vous souhaitez les fichiers, installez-le avec cette commande :
git clone <a href="https://github.com/smartin015/MultiRoomSTT.git" rel="nofollow"> https://github.com/smartin015/MultiRoomSTT.git</a>
Enfin, changez de répertoire pour MultiRoomSTT et exécutez le fichier principal :
python main.py
Le script répertorie tous les périphériques d’entrée audio, qu'il peut trouver. Appuyez sur entrée, et un tas de texte de l’installation se déroulera par. S’exprimant dans n’importe quel des microphones que vous avez mis en place permet d’afficher un tas de lignes de la forme suivante :
(<translation id>) <audio id>: <transcription>
Voici les résultats de transcription partielle - l’ID de la traduction reste le même jusqu'à la fin de la transcription, à quel point vous verrez apparaître une ligne commençant par "###" pour indiquer une transcription complète. L’audio ID indique quel périphérique audio est être transcrit, et la transcription indique ce que Sphinx pensé qu'il entendu parler dans le microphone.
Si vous avez fait cette extrême, félicitations ! Vous avez une configuration de speech-to-text de microphones multiples de travail. Mais nous sommes sûrs que vous voudriez que meilleure précision de la transcription et peut-être un coup d’oeil sous le capot le script python.
Lisez la suite pour en savoir plus sur les deux !