很有可能受过专门的拷打训练文字转WAV音频