Dlaczego funkcja „Suma” działa bardzo wolno przy określonym rozmiarze macierzy? Jak tego uniknąć? [duplikować]

Dec 03 2020

Do wykonania tej samej pracy zastosowano trzy metody („Suma”, „Suma @ Tabela” i „Wykonaj”). Funkcje „Sum” i „Total @ Table” działają bardzo wolno przy num = 250 (liczba ta może zależeć od stanu komputera. Mój laptop to MacBook Pro 2013 późny z 8G DRAM). Mam nadzieję, że aby zrozumieć przyczynę i jak UNIKNĄĆ go

timelist = ConstantArray[0, {3, 20}];
Do[
 num = nn*1 + 239;
 mat = RandomReal[{0, 1}, {num, num, 2, 2, 2}];
 timelist[[1, nn]] = 
  Timing[r1 = Sum[mat[[l, 1]] l, {l, 1, num}];][[1]];
 timelist[[2, nn]] = 
  Timing[r2 = Total@Table[mat[[l, 1]] l, {l, 1, num}];][[1]];
 timelist[[3, nn]] = Timing[r3 = ConstantArray[0, Dimensions[r2]];
    Do[r3 = r3 + mat[[l, 1]] l, {l, 1, num}];][[1]];
 (*SameQ[r1,r2,r3]*)
 , {nn, 1, 20}]
ListLinePlot[timelist, DataRange -> {240, 260}, 
 PlotLegends -> {"Sum", "Total@Table", "Do"}, 
 AxesLabel -> {"num", "Seconds"}, ScalingFunctions -> "Log"]

Odpowiedzi

5 MichaelE2 Dec 03 2020 at 16:29

FYI, zbyt długie na komentarz, dotyczące czwartego podejścia wykorzystującego wektoryzację w MKL. (Odpowiedź na główne pytanie, które wiąże się z Compileprogami systemu , można znaleźć w Nagłym wzroście taktowania przy sumowaniu ponad 250 wpisów , na co zwrócił uwagę @kglr.)

timelist = ConstantArray[0, {4, 20}];
Do[num = nn*1 + 239;
 mat = RandomReal[{0, 1}, {num, num, 2, 2, 2}];
 timelist[[1, nn]] = 
  AbsoluteTiming[r1 = Sum[mat[[l, 1]] l, {l, 1, num}];][[1]];
 timelist[[2, nn]] = 
  AbsoluteTiming[r2 = Total@Table[mat[[l, 1]] l, {l, 1, num}];][[1]];
 timelist[[3, nn]] = 
  AbsoluteTiming[r3 = ConstantArray[0, Dimensions[r2]];
    Do[r3 = r3 + mat[[l, 1]] l, {l, 1, num}];][[1]];
 timelist[[4, nn]] = 
  AbsoluteTiming[r4 =  Total[mat[[All, 1]] Range[num]]; ][[1]],
 {nn, 1, 20}]
ListLinePlot[timelist, DataRange -> {240, 260}, 
 PlotLegends -> {"Sum", "Total@Table", "Do", "Total@vectorized"}, 
 AxesLabel -> {"num", "Seconds"}, ScalingFunctions -> "Log"]

r1 == r2 == r3 == r4
(*  True  *)

Jeśli chodzi o moje preferencje AbsoluteTiming: różnica między AbsoluteTiming a Timing