办公资讯网

基于人工智能的语音转波形及波形对比研究

  • 时间:
  • 浏览:2
  • 来源:办公资讯网

1、根据音频转波形技术的实现

部分核心代码

import numpy as np

import wave

import pylab as pl


# download open-souce audio in


defplot_audio(audio_file='OSR_us_000_0010_8k.wav'):

# load audio

audio = wave.open(audio_file, 'rb')


# read format information

params = audio.getparams()

n_channels, _, sample_rate, n_frames = params[:4]


# read waveform data

str_wave_data audio.readframes(n_frames)

audio.close()


# tranform waveform to array, then plot

time = np.arange(0, n_frames) * (1.0 / sample_rate)

wave_data = np.frombuffer(str_wave_data, dtype=np.short)

if n_channels == 1:

wave_data = np.reshape(wave_data, [-1, 1]).T


pl.subplot(1, 1, 1)

pl.plot(time, wave_data[0])

pl.xlabel('time (seconds)')

pl.ylabel('amplitude')

pl.show()


elif n_channels == 2:

wave_data = np.reshape(wave_data, [-1, 2]).T


pl.subplot(2, 1, 1)

pl.plot(time, wave_data[0])

pl.plot(2, 1, 2)

pl.plot(time, wave_data[1], c='r')


pl.xlabel('time (seconds)')

pl.ylabel('amplitude')

pl.show()

else:

raise ValueError('Only 1 or 2 channels su

2、产品技术

通过安卓开发技术设计出一款原生式app(之所以是原生式而不是混合式是因为考虑到用户使用问题,原生式app不容易卡顿,响应时间更短,给予用户更好的体验)让用户能够随时随地矫正自己读法。

3、android

Android主要是用来制作app,并且效果非常好。Android主要是用来制作app,可使用Adapter来提高效率Adapter是连接前端显示和后端数据库的适配器接口是数据和 UI之间的重要桥梁


4、 vue

App虽然主要是android开发,但是由于android原生式较为麻烦,为了减少代码量,一些不太重要的地方我们可以用vue来开发。

5、 APi框架

我们这里的主要用到的api框架是科大讯飞的语音识别技术的sdk,能够将语音转化为文本,有效识别语音内容。

6、python

基于 Python 的深度学习语音识别技术有能力完全满足对于语音纠错和强化语音系统特征识别功能

7、 Springboot

这项技术在前后端分离时代显得尤为重要,鄙弃了Spring繁琐的一些问题,更好的为前端开发人员提供接口。

评论 0

你需要登录后才能评论 登录/注册