Średnia ruchoma Ten przykład pokazuje, w jaki sposób obliczyć średnią ruchomą szeregu czasowego w Excelu. Średnia ruchoma służy do łagodzenia nieprawidłowości (szczytów i dolin) w celu łatwego rozpoznawania trendów. 1. Najpierw przyjrzyjmy się naszej serii czasowej. 2. Na karcie Dane kliknij Analiza danych. Uwaga: nie można znaleźć przycisku Analiza danych Kliknij tutaj, aby załadować dodatek Analysis ToolPak. 3. Wybierz średnią ruchomą i kliknij OK. 4. Kliknij pole Input Range i wybierz zakres B2: M2. 5. Kliknij w polu Interwał i wpisz 6. 6. Kliknij pole Zakres wyjściowy i wybierz komórkę B3. 8. Narysuj wykres tych wartości. Objaśnienie: ponieważ ustawiliśmy przedział na 6, średnia ruchoma jest średnią z poprzednich 5 punktów danych i bieżącego punktu danych. W rezultacie szczyty i doliny są wygładzone. Wykres pokazuje rosnący trend. Program Excel nie może obliczyć średniej ruchomej dla pierwszych 5 punktów danych, ponieważ nie ma wystarczającej liczby poprzednich punktów danych. 9. Powtórz kroki od 2 do 8 dla przedziału 2 i odstępu 4. Wniosek: Im większy przedział, tym bardziej wygładzone są szczyty i doliny. Im mniejszy przedział, tym bardziej zbliżone są średnie ruchome do rzeczywistych punktów danych. Dawid, Tak, MapReduce jest przeznaczony do działania na dużej ilości danych. Chodzi o to, że ogólnie rzecz biorąc, funkcje mapowania i zmniejszania nie powinny dbać o to, ilu maperów lub ilu reduktorów istnieje, to tylko optymalizacja. Jeśli uważnie zastanowisz się nad opublikowanym algorytmem, zobaczysz, że nie ma znaczenia, który program odwzorowujący dostanie, jakie części danych. Każdy rekord wejściowy będzie dostępny dla każdej zredukowanej operacji, która tego potrzebuje. ndash Joe K Sep 18 12 o 22:30 W moim najlepszym zrozumieniu średnia krocząca nie ładnie odwzorowuje paradygmat MapReduce, ponieważ jego obliczenia są w zasadzie przesuwającymi się oknami nad posortowanymi danymi, podczas gdy MR jest przetwarzaniem nieprzecinanych zakresów posortowanych danych. Rozwiązanie, które widzę, jest następujące: a) Aby zaimplementować niestandardowy program partycjonujący, aby móc utworzyć dwie różne partycje w dwóch seriach. W każdym przebiegu twoje reduktory otrzymają różne zakresy danych i obliczyć średnią ruchomą, o ile ja postaram się zilustrować: W pierwszym przebiegu danych dla reduktorów powinny być: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . tutaj cacluate średnią ruchomą dla niektórych Qs. W następnym przebiegu twoje reduktory powinny uzyskać dane takie jak: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 I kacuj pozostałe średnie ruchome. Następnie musisz zebrać wyniki. Idea niestandardowego partycjonera, który będzie miał dwa tryby działania - za każdym razem dzieląc się na równe zasięgi, ale z pewną zmianą. W pseudokodowym będzie wyglądać tak. partition (keySHIFT) (MAXKEYnumOfPartitions) gdzie: SHIFT zostanie pobrany z konfiguracji. MAXKEY maksymalna wartość klucza. Zakładam dla uproszczenia, że zaczynają się od zera. RecordReader, IMHO nie jest rozwiązaniem, ponieważ ogranicza się do specyficznego podziału i nie może przesuwać granicy ponad podziałami. Innym rozwiązaniem byłoby zaimplementowanie niestandardowej logiki dzielenia danych wejściowych (jest to część InputFormat). Można zrobić 2 różne slajdy, podobne do partycjonowania. Podczas obliczania ruchomej średniej ruchomej, ustawienie średniej w okresie środkowym ma sens W poprzednim przykładzie obliczyliśmy średnią z pierwszych 3 okresów i umieściliśmy obok okres 3. Mogliśmy umieścić średnią w środku przedziału czasowego trzech okresów, to znaczy obok okresu 2. Działa to dobrze w okresach nieparzystych, ale nie jest tak dobre nawet w przypadku okresów czasu. Więc gdzie ustawilibyśmy pierwszą średnią ruchomą, gdy M 4 Technicznie, średnia ruchoma spadłaby o t 2,5, 3,5. Aby uniknąć tego problemu, wygładzamy MA za pomocą M 2. W ten sposób wygładzamy wygładzone wartości. Jeśli uśredniamy parzystą liczbę terminów, musimy wygładzić wygładzone wartości. Poniższa tabela pokazuje wyniki przy użyciu M 4.
No comments:
Post a Comment