python - как выполнить указанную ниже операцию в фрейме данных python

Nov 08 2020

ниже мой df

df = pd.DataFrame({
                   'Sr. No': [1, 2, 3, 4, 5, 6],
                    'val1' : [2,3,2,4,1,2],

})

Я хочу, чтобы вывести значение val2, как показано на рисунках ниже. row1 совпадает с row1 val1, но row2 и ниже вычисляется с использованием формулы, как показано

Ответы

1 mlang Nov 08 2020 at 12:34

Таким образом, все строки зависят от предыдущего, так как, например, C4 зависит от вычисления C3. Итак, что мы можем сделать, так это напрямую работать с массивами numpy.

sr_no_vals = df['Sr. No'].values
val1_vals = df['val1'].values
val2_vals = [val1_vals[0]]

for i in range(1, len(sr_no_vals)):
    calculated_value = (((1 + val2_vals[i - 1]) ** sr_no_vals[i - 1]) * (1 + val1_vals[i])) ** (1 / sr_no_vals[i]) 
    val2_vals.append(calculated_value)

df['val2'] = val2_vals

При работе с массивами numpy мы также можем использовать своевременный компилятор, такой как numba, чтобы значительно ускорить операцию для больших данных.

@numba.jit(nopython=True)
def calc_val2(val1_vals, sr_no_vals):
    val2_vals = [val1_vals[0]]
    for i in range(1, len(sr_no_vals)):
        calculated_value = (((1 + val2_vals[i - 1]) ** sr_no_vals[i - 1]) * (1 + val1_vals[i])) ** (1 / sr_no_vals[i]) 
        val2_vals.append(calculated_value)
    return val2_vals

df['val2'] = calc_val2(val1_vals, sr_no_vals)