как передавать отредактированный wav между функциями без сохранения wav между ними?
Aug 18 2020
У меня wav-разговор с двумя людьми (клиент и техническая поддержка). У меня есть 3 отдельные функции, которые извлекают 1 голос, сокращают 10 секунд и преобразуют его во встраивание.
def get_customer_voice(file):
print('getting customer voice only')
wav = wf.read(file)
ch = wav[1].shape[1]#customer voice always in 1st track
sr = wav[0]
c1 = wav[1][:,1]
#print('c0 %i'%c0.size)
if ch==1:
exit()
vad = VoiceActivityDetection()
vad.process(c1)
voice_samples = vad.get_voice_samples()
#this is trouble - how to pass it without saving anywhere as wav?
wf.write('%s_customer.wav'%file,sr,voice_samples)
функция ниже вырезает 10 секунд файла wav из функции выше.
import sys
from pydub import AudioSegment
def get_customer_voice_10_seconds(file):
voice = AudioSegment.from_wav(file)
new_voice = voice[0:10000]
file = str(file) + '_10seconds.wav'
new_voice.export(file, format='wav')
if __name__ == '__main__':
if len(sys.argv) < 2:
print('give wav file to process!')
else:
print(sys.argv)
get_customer_voice_10_seconds(sys.argv[1])
как передать его как wav или другой формат без сохранения в какой-то каталог? Он должен использоваться в rest api, я не знаю, где он сохранит этот wav, поэтому предпочтительно его как-то передать.
Ответы
1 ERJAN Aug 20 2020 at 04:02
Я понял - приведенная ниже функция просто работает без сохранения, буферизации и т. Д. Она получает файл wav, редактирует его и просто отправляет прямо в функцию встраивания get math:
def get_customer_voice_and_cutting_10_seconds_embedding(file):
print('getting customer voice only')
wav = read(file)
ch = wav[1].shape[1]
sr = wav[0]
c1 = wav[1][:,1]
vad = VoiceActivityDetection()
vad.process(c1)
voice_samples = vad.get_voice_samples()
audio_segment = AudioSegment(voice_samples.tobytes(), frame_rate=sr,sample_width=voice_samples.dtype.itemsize, channels=1)
audio_segment = audio_segment[0:10000]
file = str(file) + '_10seconds.wav'
return get_embedding(file)
ключ - tobytes () в аудиосегменте, он просто снова собирает все вместе в 1 дорожку