教程：Python连接华为云接口，实现语音识别功能-猿码集

介绍

Python连接华为云接口，实现语音识别功能是一项常见的任务。本文将通过一个实例，来介绍如何使用Python连接华为云接口，实现语音识别功能。在这个实例中，我们将使用华为云的语音识别接口，来识别一段录音中的语音内容。

准备工作

1. 在华为云中创建语音识别服务

在使用华为云的语音识别功能前，我们需要在华为云中创建一个语音识别服务。具体创建步骤如下：

登录华为云控制台。

选择“语音服务” - “语音识别”。

点击“创建语音识别”按钮，输入相关配置信息，完成创建。

2. 安装Python SDK

在Python中使用华为云的语音识别功能，我们需要安装华为云Python SDK。具体安装方法如下：

pip install huaweicloud-sdk-python-vpc

实现语音识别功能

1. 通过华为云API获取token

在使用华为云的语音识别功能前，我们需要通过华为云API获取一个token。获取token的过程如下：

使用阿里云SDK中的AK、SK鉴权，获取token。

向华为云发起POST请求，获取临时token。

以下是获取token的Python代码：


import huaweicloud_sdk
auth = huaweicloud_sdk.Auth()
access_key = 'xxxxxxx'
secret_key = 'xxxxxxxxxxx'
auth.set_access_key(access_key)
auth.set_secret_key(secret_key)
region = 'cn-north-4'
project_id = 'xxxxxxxxxxxxxxxxx'
temporary_token = huaweicloud_sdk.get_temporary_token(auth, project_id, region)

以上代码中需要替换的是：

access_key和secret_key分别是你的华为云账号的access_key和secret_key；

region和project_id分别是你创建的语音识别服务的所在区域和项目ID。

2. 上传录音文件到OBS

在语音识别过程中，我们需要将待识别的录音文件上传到华为云OBS。以下是Python中上传文件到OBS的代码实现：


import huaweicloud_sdk
observatory = huaweicloud_sdk.Observatory()
obs_setting = {
    "ak": access_key,
    "sk": secret_key,
    "project_id": project_id,
    "region": region
}
observatory.set_setting(obs_setting)
bucket_name = 'test'
object_key = 'test.mp3'
file_path = '/Users/test.mp3'
observatory.upload_file(bucket_name, object_key, file_path)

以上代码中需要替换的是：

bucket_name是你在OBS中创建的存储桶名称；

object_key是你要上传的文件在存储桶内的对象名称；

file_path是本地要上传的文件路径。

3. 启动语音识别任务

在上传录音文件完成后，我们需要启动一个语音识别任务。以下是Python中启动语音识别任务的代码实现：


import huaweicloud_sdk
asr = huaweicloud_sdk.ASR()
asr_setting = {
    "Speech-Codec": "PCM",
    "Sample-Rate": "16000",
    "Tempo": "long",
    "Vad-Mode": "normal",
    "Number-of-Channels": "1",
    "Body-Language": "zh-CN",
    "Codec": "Amr",
    "Language": "zh-CN",
    "Enable-punctuation": "false",
    "Enable-words-free": "false",
    "Enable-words-free-dictation": "false",
    "Enable-mpu": "false",
    "Model": "general",
    "Enable-i-pinyin": "true",
    "Enable-suffix": "true",
    "Enable-composing": "true"
}
asr.set_setting(asr_setting)
url = 'https://cn-north-4.stt.hwcloudspeech.com/v1.0'
result = asr.asr_job_status(id, url, temporary_token['token'])

以上代码中需要替换的是：

id是语音识别任务ID，我们可以在ASR中启动任务后，获取到这个ID；

url是华为云语音识别服务的URL，对于每个服务节点URL是固定的。

4. 获取语音识别结果

在语音识别任务完成后，我们需要获取语音识别结果。以下是Python中获取语音识别结果的代码实现：


import huaweicloud_sdk
url = 'https://cn-north-4.stt.hwcloudspeech.com/v1.0'
result = asr.asr_job_result(id, url, temporary_token['token'])
text = result['result']['hypotheses'][0]['transcript']
print(text)

以上代码会输出我们语音识别的结果。

完整代码

以下是完整Python代码：


import huaweicloud_sdk
auth = huaweicloud_sdk.Auth()
access_key = 'xxxxxxx'
secret_key = 'xxxxxxxxxxx'
auth.set_access_key(access_key)
auth.set_secret_key(secret_key)
region = 'cn-north-4'
project_id = 'xxxxxxxxxxxxxxxxx'
temporary_token = huaweicloud_sdk.get_temporary_token(auth, project_id, region)
observatory = huaweicloud_sdk.Observatory()
obs_setting = {
    "ak": access_key,
    "sk": secret_key,
    "project_id": project_id,
    "region": region
}
observatory.set_setting(obs_setting)
bucket_name = 'test'
object_key = 'test.mp3'
file_path = '/Users/test.mp3'
observatory.upload_file(bucket_name, object_key, file_path)
asr = huaweicloud_sdk.ASR()
asr_setting = {
    "Speech-Codec": "PCM",
    "Sample-Rate": "16000",
    "Tempo": "long",
    "Vad-Mode": "normal",
    "Number-of-Channels": "1",
    "Body-Language": "zh-CN",
    "Codec": "Amr",
    "Language": "zh-CN",
    "Enable-punctuation": "false",
    "Enable-words-free": "false",
    "Enable-words-free-dictation": "false",
    "Enable-mpu": "false",
    "Model": "general",
    "Enable-i-pinyin": "true",
    "Enable-suffix": "true",
    "Enable-composing": "true"
}
asr.set_setting(asr_setting)
url = 'https://cn-north-4.stt.hwcloudspeech.com/v1.0'
result = asr.asr_job_status(id, url, temporary_token['token'])
result = asr.asr_job_result(id, url, temporary_token['token'])
text = result['result']['hypotheses'][0]['transcript']
print(text)

教程：Python连接华为云接口，实现语音识别功能

介绍

准备工作

1. 在华为云中创建语音识别服务

2. 安装Python SDK

实现语音识别功能

1. 通过华为云API获取token

2. 上传录音文件到OBS

3. 启动语音识别任务

4. 获取语音识别结果

完整代码

相关阅读

后端开发标签

Python热门

Python更新