多半是在中央地域文字转WAV音频