结果全是对方再问他文字转WAV音频