¿Cómo convertir correctamente una matriz de bytes de 16 bits en datos de clip de audio?

Nov 26 2020

Trabajo con Media Foundataion y lo que tengo que hacer es convertir el marco de muestra de sonido de byte a datos flotantes de audio. Para hacerlo, utilizo dicho método (que encontré en algún lugar de google):

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source, int headerOffset, int dataSize)
    {
        int wavSize = BitConverter.ToInt32(source, headerOffset);
        headerOffset += sizeof(int);
        Debug.AssertFormat(wavSize > 0 && wavSize == dataSize, "Failed to get valid 16-bit wav size: {0} from data bytes: {1} at offset: {2}", wavSize, dataSize, headerOffset);

        int x = sizeof(Int16); // block size = 2
        int convertedSize = wavSize / x;

        float[] data = new float[convertedSize];

        Int16 maxValue = Int16.MaxValue;
        int i = 0;

        while (i < convertedSize)
        {
            int offset = i * x + headerOffset;
            data[i] = (float)BitConverter.ToInt16(source, offset) / maxValue;
            ++i;
        }

        Debug.AssertFormat(data.Length == convertedSize, "AudioClip .wav data is wrong size: {0} == {1}", data.Length, convertedSize);

        return data;
    }

Lo uso así:

...
byte[] source = ...; // lenght 43776

... = Convert16BitByteArrayToAudioClipData(source , 0, 0);
...

Parece que este método funciona mal, porque si paso una matriz con el tamaño 43776 como resultado en el whilebucle en el i = 21886valor de desplazamiento del índice , offset = 43776se producirá una excepción en el siguiente método

data[i] = (float)BitConverter.ToInt16(source /*43776*/, offset /*43776*/) / maxValue;

porque estos valores no pueden ser los mismos.

La pregunta es: ¿cómo solucionar este método? ¿O tal vez alguien pueda aconsejar qué usar en su lugar?

EDITAR

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        float[] data = new float[source.Length];

        for (int i = 0; i < source.Length; i++)
        {
            data[i] = (float) source[i];
        }

        return data;
    }

Respuestas

1 RomanR. Nov 26 2020 at 13:58

Los enteros deben convertirse en -1 .. + 1 valores de punto flotante

    private static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        float[] data = new float[source.Length];

        for (int i = 0; i < source.Length; i++)
        {
            data[i] = ((float) source[i] / Int16.MaxValue); // <<---
        }

        return data;
    }
AlekseyTimoshchenko Dec 01 2020 at 13:54

Finalmente lo hice de esta manera:

    public static float[] Convert16BitByteArrayToAudioClipData(byte[] source)
    {
        int x = sizeof(Int16); 
        int convertedSize = source.Length / x;
        float[] data = new float[convertedSize];
        Int16 maxValue = Int16.MaxValue;

        for (int i = 0; i < convertedSize; i++)
        {
            int offset = i * x;
            data[i] = (float)BitConverter.ToInt16(source, offset) / maxValue;
            ++i;
        }

        return data;
    }