语音转文字离线电脑版

发布时间: 2023-04-16 01:32 阅读: 文章来源:转载

利用Python和API轻松实现:语音转文字,文字转语音。

语音转文字(支持实时麦克风输入和从音频文件读入):

百度 API科大讯飞 APISpeechRecognition (CMU PocketSphinx)

文字转语音:

pyttsx3

EnvironmentPython 3.6.7MacOS(以下环境配置方式均基于Mac系统,其他系统的配置方式可能会有一些不同)

Speech to Text百度

在 https://cloud.baidu.com/product/speech 申请API。

文档:http://ai.baidu.com/docs#/ASR-API

Configuration

安装:

pip install baidu-aip

在 speech_to_text_baidu() 中填入APPID、API_KEY、SECRET_KEY:

APP_ID = ""API_KEY = ""SECRET_KEY = ""

(也可以直接使用REST API:Demo

Usagefrom Speech_and_Text import speech_to_text_baidu# 从文件读入speech_to_text_baidu(audio_path = "path_of_audio", if_microphone = False)# 从麦克风读入speech_to_text_baidu(if_microphone = True)

科大讯飞

在 https://www.xfyun.cn/services/voicedictation 申请API。

文档:https://doc.xfyun.cn/rest_api/index.html

Configuration

在 speech_to_text_ifly() 填入 APPID、API_KEY:

URL = "http://api.xfyun.cn/v1/service/v1/iat"APPID = ""API_KEY = ""

要在讯飞管理面板中添加调用方api,否则会报错。

Usagefrom Speech_and_Text import speech_to_text_ifly# 从文件读入speech_to_text_ifly(audio_path = "path_of_audio", if_microphone = False)# 从麦克风读入speech_to_text_ifly(if_microphone = True)

SpeechRecognition

使用了Python的语音识别库 SpeechRecognition

源码:https://github.com/Uberi/speech_recognition

ConfigurationSpeechRecognition

安装:

pip install SpeechRecognitionPyAudio

使用麦克风进行输入

主页:http://people.csail.mit.edu/hubert/pyaudio/

# Mac上的安装方式xcode-select --install# 安装xcode, 已经装好的的话,执行的时候会提示# 先用homebrew安装portaudio(pyaudio需要的库),否则会提示:‘portaudio.h‘ file not foundbrew remove portaudio# 先用homebrew卸载brew install portaudio# 重新安装sudo pip install pyaudio# 安装pyaudio

Reference: https://stackoverflow.com/questions/33851379/pyaudio-installation-on-mac-python-3

PocketSphinx

CMU Sphinx 是卡内基梅隆大学开发的开源语音识别引擎,可以离线工作,支持多种语言(包括中文)。

源码:https://github.com/cmusphinx

PocketSphinx 是 CMU Sphinx 的 Python 封装接口。

源码:https://github.com/cmusphinx/pocketsphinx-python

安装:

pip install PocketSphinx

添加中文语言包:

查看 SpeechRecognition 包的安装路径(‘/path‘):

python -c "import speech_recognition as sr, os.path as p; print(p.dirname(sr.__file__))"

然后下载并解压 Mandarin Chinese 语言包,把 zh-CN 文件夹放入 ‘/path/pocketsphinx-data‘ 中

Usagefrom Speech_and_Text import speech_to_text_cmu# 从文件读入speech_to_text_cmu(audio_path = "path_of_audio", if_microphone = False)# 从麦克风读入speech_to_text_cmu(if_microphone = True)

Text to Speech

使用了Python的文字转语音库 pyttsx3

源码:https://github.com/nateshmbhat/pyttsx3

文档:https://pyttsx3.readthedocs.io

Configurationpip install pyttsx3pip install pyobjc # 依赖模块Usagefrom Speech_and_Text import text_to_speech# Exampletext_to_speech(sentence = "人类的本质是复读机")

源码下载地址:https://github.com/Renovamen/Speech-and-Text/archive/master.zip

•••展开全文
相关文章