Jak poprawnie przekonwertować 16-bitową tablicę bajtów na dane klipu audio?

Nov 26 2020

Pracuję z Media Foundataion i to, co muszę zrobić, to przekonwertować klatkę próbki dźwięku z bajtu na dane float audio. Aby to zrobić używam takiej metody (którą znalazłem gdzieś w google):

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source, int headerOffset, int dataSize)
    {
        int wavSize = BitConverter.ToInt32(source, headerOffset);
        headerOffset += sizeof(int);
        Debug.AssertFormat(wavSize > 0 && wavSize == dataSize, "Failed to get valid 16-bit wav size: {0} from data bytes: {1} at offset: {2}", wavSize, dataSize, headerOffset);

        int x = sizeof(Int16); // block size = 2
        int convertedSize = wavSize / x;

        float[] data = new float[convertedSize];

        Int16 maxValue = Int16.MaxValue;
        int i = 0;

        while (i < convertedSize)
        {
            int offset = i * x + headerOffset;
            data[i] = (float)BitConverter.ToInt16(source, offset) / maxValue;
            ++i;
        }

        Debug.AssertFormat(data.Length == convertedSize, "AudioClip .wav data is wrong size: {0} == {1}", data.Length, convertedSize);

        return data;
    }

Używam tego w ten sposób:

...
byte[] source = ...; // lenght 43776

... = Convert16BitByteArrayToAudioClipData(source , 0, 0);
...

Wygląda na to, że ta metoda działa nieprawidłowo, ponieważ jeśli przekażę tablicę o rozmiarze 43776, w wyniku whilepętli przy i = 21886wartości przesunięcia indeksu offset = 43776doprowadzi to do wyjątku przy tej następnej metodzie

data[i] = (float)BitConverter.ToInt16(source /*43776*/, offset /*43776*/) / maxValue;

ponieważ te wartości nie mogą być takie same.

Pytanie brzmi - jak naprawić tę metodę? A może ktoś doradzi, czego zamiast tego użyć?

EDYTOWAĆ

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        float[] data = new float[source.Length];

        for (int i = 0; i < source.Length; i++)
        {
            data[i] = (float) source[i];
        }

        return data;
    }

Odpowiedzi

1 RomanR. Nov 26 2020 at 13:58

Liczby całkowite muszą stać się -1 .. + 1 wartościami zmiennoprzecinkowymi

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        float[] data = new float[source.Length];

        for (int i = 0; i < source.Length; i++)
        {
            data[i] = ((float) source[i] / Int16.MaxValue); // <<---
        }

        return data;
    }
AlekseyTimoshchenko Dec 01 2020 at 13:54

Ostatecznie zrobiłem to w ten sposób:

    public static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        int x = sizeof(Int16); 
        int convertedSize = source.Length / x;
        float[] data = new float[convertedSize];
        Int16 maxValue = Int16.MaxValue;

        for (int i = 0; i < convertedSize; i++)
        {
            int offset = i * x;
            data[i] = (float)BitConverter.ToInt16(source, offset) / maxValue;
            ++i;
        }

        return data;
    }