我正在运行一个函数,该函数将读取音频文件并将其转换为 numpy.darray 但在批量处理时,它将 numpy 数组转换为列表。
def speech_file_to_array_fn(batch):
speech_array, sampling_rate = torchaudio.load(batch["key"])
batch["speech"] = speech_array[0].numpy()
return batch
data = data.map(speech_file_to_array_fn, remove_columns=data.column_names)
type(data[0]["speech"]) # should give numpy.darray but is giving me a list.
在这方面需要帮助。