广西民族大学高级人工智能课程—头歌实践教学实践平台—构建自动语音识别

   日期:2024-12-25    作者:caijiyuan 浏览:80    移动:http://w.yusign.com/mobile/quote/5403.html

 

import time, wave

from pyaudio import PyAudio,paInt16

channels = 1

framerate = 16000

num_samples = 2000

sampwidth = 2

# 录制音频

def my_record(rate = 16000):

pa = PyAudio()

stream = pa.open(format=paInt16, channels=channels, rate = framerate, input = True,

frames_per_buffer = num_samples)

my_buf = []

t = time.time()

print("Recording...")

while time.time() < t + 5:

string_audio_data = stream.read(num_samples)

my_buf.append(string_audio_data)

print("done")

save_file("https://blog.csdn.net/gxmzuai/article/details/myvoice.wav", my_buf)

stream.close()

# 保存音频文件

def save_file(filepath, data):

wf = wave.open(filepath, 'wb')

wf.setnchannels(channels)

wf.setsampwidth(sampwidth)

wf.setframerate(framerate)

wf.writeframes(b''.join(data))

wf.close()

# 读取文件

def get_file_content(filePath):

########## Begin ##########

with open(filePath, 'rb') as fp:

return fp.read()

########## End ##########


 

if __name__ == "__main__":

# 录制音频

# my_record()

# 读取音频

print(get_file_content("/data/workspace/myshixun/src/step1/myvoice.wav")[:20])

 
 
任务描述

本关任务:编写一个能调用百度API实现语音识别的小程序。

相关知识

为了完成本关任务,你需要掌握: 1.如何接入百度AI平台; 2.如何调用百度API实现语音识别。

接入百度AI平台
如何接入百度API

访问百度智能云-登录 登录百度智能云。

1.成为开发者 三步完成账号的基本注册与认证: STEP1:点击百度AI开放平台导航右侧的控制台,选择需要使用的AI服务项。若为未登录状态,将跳转至登录界面,请您使用百度账号登录。如还未持有百度账户,可以点击此处注册百度账户。 STEP2:首次使用,登录后将会进入开发者认证页面,请填写相关信息完成开发者认证。注:(如您之前已经是百度云用户或百度开发者中心用户,此步可略过。) STEP3:通过控制台左侧导航,选择产品服务-人工智能,进入具体AI服务项的控制面板(如文字识别、人脸识别,进行相关业务操作。

2.创建应用 账号登录成功,您需要创建应用才可正式调用AI能力。应用是您调用API服务的基本操作单元,您可以基于应用创建成功后获取的及,进行接口调用操作,及相关配置。 以人脸识别为例,您可按照下图所示的操作流程,完成创建操作。

填写相关信息

点击左侧的应用列表即可获得对应的、以及等信息。

如何调用百度API
 

其中调用参数说明如下

参数类型描述是否必须speechBuffer建立包含语音内容的Buffer对象, 语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写是formatString语音文件的格式,pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件是rateint采样率,16000,固定值是cuidString用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内否dev_pidInt不填写lan参数生效,都不填写,默认1537(普通话 输入法模型,dev_pid参数见本节开头的表格否lan(已废弃)String历史兼容参数,请使用dev_pid。如果dev_pid填写,该参数会被覆盖。语种选择,输入法模型,默认中文(zh)。 中文=zh、粤语=ct、英文=en,不区分大小写。否

dev_pid参数列表

dev_pid语言模型是否有标点备注1537普通话输入法模型有标点支持自定义词库1737英语无标点不支持自定义词库1637粤语有标点不支持自定义词库1837四川话有标点不支持自定义词库1936普通话远场远场模型有标点不支持

语音识别返回数据参数详情

参数类型是否一定输出描述err_noint是错误码err_msgint是错误码描述snint是语音数据唯一标识,系统内部产生,用于 debugresultint是识别结果数组,提供1-5 个候选结果,string 类型为识别的字符串, utf-8 编码

返回样例

 
编程要求

根据提示,在右侧编辑器Begin−End区间补充代码,将文件转化为文字。

测试说明

平台会对你编写的代码进行测试

测试输入: 预期输出

 

开始你的任务吧,祝你成功

 

任务描述

本关任务:编写一个能实现图灵对话的小程序。

相关知识

为了完成本关任务,你需要掌握: 1.如何接入图灵对话; 2.如何调用图灵对话API。

接入图灵对话
调用图灵API
 

参数说明

参数说明reqType输入类型:0-文本(默认)、1-图片、2-音频perception输入信息userInfo用户参数

返回参数

参数inputText文本信息inputImage图片信息inputMedia音频信息selfInfo客户端属性
编程要求

根据提示,在右侧编辑器Begin−End区间补充代码,调用图灵API实现对话。

测试说明

平台会对你编写的代码进行测试

测试输入; 预期输出

 

开始你的任务吧,祝你成功

 
 
 
任务描述

本关任务:编写一个能实现文字语音转换的小程序。

相关知识

为了完成本关任务,你需要掌握: 1.利用调用接口实现语音文字转化; 2.如何利用实现语音文字转化。

利用pyttsx3调用接口实现语音文字转化
 
利用win32com.client实现语音文字转化
 
编程要求

根据提示,在右侧编辑器 Begin−End 补充代码,计算。

测试说明

平台会对你编写的代码进行测试

测试输入; 预期输出

 

开始你的任务吧,祝你成功

 

任务描述

本关任务:编写一个ASR系统小程序。

相关知识

为了完成本关任务,你需要掌握

  1. ASR系统流程
  2. ASR代码实现步骤。
ASR系统流程

一个完备的ASR系统是要实现纯语音对话聊天,不要文字输入交流。ASR的实现流程如图1所示,大致分4个步骤: 1.我们说一句话,通过录音保存为语音文件; 2.调用百度API实现语音转文本; 3.调用图灵机器人API将文本输入得到图灵机器人的回复; 4.将回复的文本转成语音输出。

ASR代码实现步骤
 
编程要求

根据提示,在右侧编辑器 Begin−End 区间补充代码,编写一个 ASR 系统小程序。

测试说明

平台会对你编写的代码进行测试

测试输入; 预期输出

 

开始你的任务吧,祝你成功

本文地址:http://w.yusign.com/quote/5403.html    述古往 http://w.yusign.com/static/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关行情
推荐行情
点击排行
{
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号