所以很难做到有效的管控文字转WAV音频