xarray вычисляет среднемесячное значение за несколько лет netcdf

Dec 18 2020

У меня есть 2-метровый файл netcdf температуры от ERA5, который идет с 2000 по 2019 год с 04 по 10 месяцев, что дает в общей сложности 13680 временных шагов и измерение широты и долготы 61x161. Я хочу сделать ежемесячное среднее всех ежедневных временных шагов для каждого года отдельно. Например, у нас будет среднемесячное значение данных в апреле 2000 г., в мае 2000 г. и так далее. Я пробовал следующий код с xarray resample, но возникли две проблемы.

Почему-то кажется, что среднее все годы остается средним.
Функция resample создает месяцы 01, 02, 03, 11 и 12, несмотря на то, что для него нет данных!

Вот о чем я говорю:

import xarray as xr
ds = xr.open_dataset(netcdf)
monthly_data=ds.resample(time='1M').mean()

Мы можем посмотреть на временную метку, которая показывает месячный временной шаг, включая не связанные месяцы.

print(np.array(monthly_data.time))
array(['2000-04-30T00:00:00.000000000', '2000-05-31T00:00:00.000000000',
       '2000-06-30T00:00:00.000000000', '2000-07-31T00:00:00.000000000',
       '2000-08-31T00:00:00.000000000', '2000-09-30T00:00:00.000000000',
       '2000-10-31T00:00:00.000000000', '2000-11-30T00:00:00.000000000',
       '2000-12-31T00:00:00.000000000', '2001-01-31T00:00:00.000000000',

Чтобы проверить содержание температуры, я преобразовал данные в фрейм данных.

temp_ar = np.array(monthly_data.t2m)    
print(pd.DataFrame(temp_ar[0,:,:]).head())
          0           1           2    ...         158         159         160
0  270.940613  270.911652  270.926727  ...         NaN         NaN         NaN
1  271.294952  271.256744  271.250946  ...  272.948608  272.974731  272.998535
2  271.416779  271.457214  271.483459  ...  273.123169  273.079285  273.058563
3  271.848755  271.791382  271.784058  ...         NaN  273.264038         NaN
4  272.226837  272.144928  272.123016  ...         NaN         NaN         NaN

print(pd.DataFrame(temp_ar[1,:,:]).head())
   0    1    2    3    4    5    6    ...  154  155  156  157  158  159  160
0  NaN  NaN  NaN  NaN  NaN  NaN  NaN  ...  NaN  NaN  NaN  NaN  NaN  NaN  NaN
1  NaN  NaN  NaN  NaN  NaN  NaN  NaN  ...  NaN  NaN  NaN  NaN  NaN  NaN  NaN
2  NaN  NaN  NaN  NaN  NaN  NaN  NaN  ...  NaN  NaN  NaN  NaN  NaN  NaN  NaN
3  NaN  NaN  NaN  NaN  NaN  NaN  NaN  ...  NaN  NaN  NaN  NaN  NaN  NaN  NaN
4  NaN  NaN  NaN  NaN  NaN  NaN  NaN  ...  NaN  NaN  NaN  NaN  NaN  NaN  NaN

Второй массив (который соответствует 05 месяцу 2000 года) не должен иметь nans, но он есть, и это так для всех других временных шагов (кроме последнего по какой-то причине). Кто-нибудь знает, почему это происходит?

xarray вычисляет среднемесячное значение за несколько лет netcdf

Ответы