他们恐怕是牺牲了文字转WAV音频