Indeks średnio sezonowy


Wdrażanie arkusza korygowania sezonowego i wygładzania wykładniczego Jest proste w obsłudze korekt sezonowych i dopasowuje modele wygładzania wykładniczego za pomocą programu Excel. Poniższe wykresy i wykresy są pobierane z arkusza kalkulacyjnego, który został przedstawiony w celu zilustrowania multiplikatywnej korekty sezonowej i wyrównywania wykładniczości liniowej na następujących kwartalnych danych o sprzedaży firmy Outboard Marine: Aby uzyskać kopię pliku arkusza kalkulacyjnego, kliknij tutaj. Wersja liniowego wyrównywania wykładniczego, który będzie używany tutaj do celów demonstracyjnych to wersja Brown8217s, tylko dlatego, że może być zaimplementowana w pojedynczej kolumnie o wzorach i tylko jedna stała wygładzania jest optymalizowana. Zazwyczaj lepiej jest używać wersji Holt8217s, która ma oddzielne stałe wygładzania dla poziomu i tendencji. Proces prognozowania przebiega następująco: (i) po pierwsze dane są korygowane sezonowo (ii), a następnie wygenerowane są prognozy dla danych skorygowanych sezonowo przez liniowe wyrównanie wykładnicze i (iii) wreszcie skorygowane sezonowo prognozy są uzasadnione w celu uzyskania prognoz dla pierwotnej serii . Proces dostosowania sezonowego odbywa się w kolumnach od D do G. Pierwszym krokiem w korekcie sezonowej jest wyliczenie średniej ruchomej średniej (przeprowadzonej tutaj w kolumnie D). Można to zrobić biorąc średnio dwa średnie roczne, które są przesunięte o jeden okres względem siebie. (Połączenie dwóch średnic offsetowych zamiast jednej średniej jest potrzebne do celów centrowania, gdy liczba sezony jest równa.) Następnym krokiem jest obliczenie stosunku do średniej ruchomej --i. e. oryginalne dane podzielone przez średnią ruchoma w każdym okresie - wykonywane tutaj w kolumnie E. (Jest to również nazywany sekwencją cyklicznie-cykliczną wzorca, o ile trend i skutki cyklu koniunkturalnego mogą być uznane za wszystkie utrzymuje się po uśrednieniu w ciągu całego roku wartości danych. Oczywiście zmiany w skali miesięcznej, które nie wynikają z sezonowości, mogą być określone przez wiele innych czynników, ale średnia w ciągu 12 miesięcy przewyższa ich w znacznej mierze.) szacowany sezonowy indeks dla każdego sezonu obliczany jest poprzez uśrednienie wszystkich wskaźników dla danego sezonu, które wykonywane jest w komórkach G3-G6 przy użyciu formuły AVERAGEIF. Średnie wskaźniki są następnie przeskalywane tak, że sumują dokładnie 100 razy liczbę okresów w danym sezonie lub 400 w tym przypadku, które wykonywane są w komórkach H3-H6. Poniżej kolumny F, formuły VLOOKUP służą do wstawienia odpowiedniej wartości indeksu sezonowego w każdym wierszu tabeli danych, zgodnie z kwartałem, który reprezentuje. Wyśrodkowana średnia ruchoma i dostosowane sezonowo dane wyglądają tak: Należy pamiętać, że średnia ruchoma zazwyczaj wygląda jak gładsza wersja sezonowo dostosowanych serii i krótsze w obu końcach. Inny arkusz roboczy w tym samym pliku Excel pokazuje zastosowanie liniowego modelu wygładzania wykładniczego do danych skorygowanych sezonowo, zaczynając od kolumny G. Wartość powyżej stołu wygładzania (alpha) jest wpisywana powyżej kolumny prognozy (tutaj, w komórce H9) i dla wygody przypisana jest nazwa zakresuAlpha. quot (Nazwa została przypisana przy użyciu polecenia quotInsertNameCreatequot.) Model LES jest inicjowany przez ustawienie pierwszych dwóch prognoz równych pierwszej rzeczywistej wartości sezonowych skorygowanych serii. Zastosowana tutaj formuła dla prognozy LES to rekursywna forma modelu pojedynczego równania modelu Brown8217: Ta formuła jest wprowadzana do komórki odpowiadającej trzeciej (tu komórce H15) i skopiowana stamtąd. Zauważ, że prognoza LES dla bieżącego okresu odnosi się do dwóch poprzednich obserwacji i dwóch poprzednich błędów prognozy, a także do wartości alfa. Tak więc formuła prognozowania w wierszu 15 odnosi się tylko do danych, które były dostępne w rzędzie 14 i starszych. (Oczywiście gdybyśmy chcieli używać prostych zamiast linearnego wyrównywania wykładników, moglibyśmy zastąpić formułę SES zamiast tego, zamiast tego moglibyśmy użyć modelu LES firmy Holt8217 zamiast Brown8217s, co wymagałoby jeszcze dwóch kolumn o formułach obliczania poziomu i tendencji które są używane w prognozie). Błędy są obliczane w następnej kolumnie (tutaj, kolumnie J), ​​odejmując prognozy od rzeczywistych wartości. Podstawowy kwadratowy błąd jest obliczany jako pierwiastek kwadratowy wariancji błędów plus kwadrat średniej. (Wynika to z identyczności matematycznej: wariantu MSE (błędy) (średnia (błędy)) 2.) Przy obliczaniu średniej i odchylenia błędów w tej formule pierwsze dwa okresy są wykluczone, ponieważ model nie zaczyna prognozować aż do trzeci okres (wiersz 15 w arkuszu kalkulacyjnym). Optymalną wartość alfa można znaleźć albo ręcznie zmieniając alfa, aż zostanie znaleziony minimalny RMSE, albo możesz użyć kwotowego kwerendy, aby wykonać dokładną minimalizację. Wartość alfa, którą znalazł Solver jest tutaj pokazany (alpha0.471). Zwykle dobrym pomysłem jest wykreślenie błędów modelu (w transformowanych jednostkach), a także obliczenie i sporządzenie ich autokorelacji z opóźnieniami do jednego sezonu. Oto szereg szeregów czasowych błędów (skorygowanych sezonowo): autokorelacje błędów są obliczane za pomocą funkcji CORREL () w celu obliczenia korelacji błędów z opóźnieniem przez jeden lub więcej okresów - szczegóły są przedstawione w modelu arkusza kalkulacyjnego . Oto spisek autokorelacji błędów w pierwszych pięciu opóźnieniach: Autokorelacje z opóźnieniami od 1 do 3 są bardzo zbliżone do zera, ale skok o opóźnieniu 4 (którego wartość wynosi 0,35) jest nieco kłopotliwy - sugeruje, że sezonowy proces dostosowania nie zakończył się w pełni. Jest to jednak tylko marginalnie istotne. 95 pasm istotności w celu sprawdzenia, czy autokorelacje różnią się znacząco od zera, to w przybliżeniu plusa lub minus 2SQRT (n-k), gdzie n jest wielkością próbki, a k jest opóźnieniem. Tutaj n wynosi 38 i k zmienia się od 1 do 5, a więc pierwiastek-korzeń-n-minus-k wynosi około 6 dla wszystkich, a zatem granice testowania statystycznego znaczenia odchyleń od zera są przybliżone plus - lub-minus 26 lub 0.33. Jeśli zmienisz wartość alfa ręcznie w tym modelu programu Excel, możesz zaobserwować wpływ na szeregy czasowe i wykresy autokorelacji błędów, a także na błąd średniej kwadratowej, który zostanie zilustrowany poniżej. W dolnej części arkusza kalkulacyjnego formuła prognozowana jest wciągana w przyszłość, zastępując prognozy rzeczywistymi wartościami w momencie, kiedy faktycznie skończą się dane - tzn. gdzie zaczyna się cytat. (Innymi słowy, w każdej komórce, w której przyszła wartość danych, wystąpi odwołanie do komórki, co wskazuje na przewidywaną prognozę dla tego okresu). Wszystkie inne formuły są po prostu skopiowane z góry: Zauważ, że błędy prognoz przyszłość jest obliczana jako zero. Nie oznacza to, że rzeczywiste błędy będą zerowe, ale raczej odzwierciedla jedynie fakt, że w celu przewidywania zakładamy, że przyszłe dane będą równe prognozom średnim. Wynikające z tego prognozy LES dla danych skorygowanych sezonowo wyglądają następująco: przy tej szczególnej wartości alfa, która jest optymalna dla prognoz jednomodowych, przewidywana tendencja jest nieznacznie wyższa, odzwierciedlając lokalny trend obserwowany w ciągu ostatnich 2 lat albo tak. Dla innych wartości alfa, można uzyskać bardzo inny trend. Zwykle dobrym pomysłem jest sprawdzenie, co się dzieje w przypadku długoterminowej prognozy trendu, gdy alfa jest zróżnicowana, ponieważ wartość, która najlepiej sprawdza się w krótkoterminowej prognozie, niekoniecznie musi być najlepszą wartością przewidującą dalszą przyszłość. Na przykład wynik jest uzyskany, jeśli wartość alfa jest ustawiana ręcznie na 0,25: przewidywana długookresowa tendencja jest teraz ujemna, a nie pozytywna. Przy mniejszej wartości alfa, model przywiązuje większą wagę do starszych danych w jego prognozowanie obecnego poziomu i tendencji, a długoterminowe prognozy odzwierciedlają tendencję spadkową obserwowaną w ciągu ostatnich 5 lat, a nie ostatni trend wzrostowy. Ten wykres wyraźnie ilustruje również, jak model z małą wartością alfa jest wolniejszy, aby odpowiadać na punkty quotering w danych, a zatem często przez wiele lat z rzędu popełnia błąd tego samego znaku. Błędy prognozowane na jeden krok naprzód są średnio większe niż te uzyskane wcześniej (RMSE 34,4, a nie 27,4) i silnie pozytywnie autocorrelated. Autokorelacja lag-1 wynosząca 0,56 znacznie przekracza wartość 0,33 obliczoną powyżej w przypadku statystycznie istotnego odchylenia od zera. Alternatywą dla zmniejszenia wartości alfa w celu wprowadzenia bardziej konserwatywności do długoterminowych prognoz, do modelu jest czasami dodawany współczynnik tłumienia w wycięciu, aby przewidywana tendencja spłaszczała się po kilku okresach. Ostatnim krokiem w budowaniu modelu prognozowania jest uzasadnienie wnioskowania o prognozach LES przez pomnożenie ich przez odpowiednie wskaźniki sezonowe. Tak więc prognozy reasekurowane w kolumnie I są po prostu iloczynem wskaźników sezonowych w kolumnie F i sezonowo dostosowanych prognoz LES w kolumnie H. Stosunkowo łatwe jest obliczenie przedziałów ufności dla prognoz jednoetapowych przewidzianych w tym modelu: pierwszy obliczyć błąd RMSE (średnio kwadratowy, który jest tylko pierwiastkiem kwadratowym MSE), a następnie obliczyć przedział ufności dla sezonowo dostosowanej prognozy przez dodanie i odjęcie dwóch razy RMSE. (Ogólnie 95 przedział ufności dla prognozy na jeden okres jest mniej więcej równe prognozom punktowym plus lub minus dwa razy szacunkowe odchylenie standardowe prognozowanych błędów, zakładając, że dystrybucja błędów jest w przybliżeniu norma i rozmiar próbki jest wystarczająco duża, powiedzmy, 20 lub więcej. Tutaj RMSE, a nie standardowe odchylenie próbek błędów, jest najlepszym oszacowaniem standardowego odchylenia przyszłych błędów prognozowanych, ponieważ uwzględnia się zarówno różnice losowe, jak i losowe.) dla sezonowo skorygowanej prognozy są następnie ponownie uzasadnione. wraz z prognozą, pomnożąc je przez odpowiednie wskaźniki sezonowe. W tym przypadku wartość RMSE wynosi 27,4, a prognoza sezonowa dla pierwszego przyszłego okresu (grudzień 93) wynosi 273,2. więc sezonowo dostosowany 95 przedział ufności wynosi od 273.2-227.4 218.4 do 273.2227.4 328.0. Mnożąc te limity według Decembers indeksu sezonowego 68,61. otrzymujemy dolne i górne granice ufności 149.8 i 225.0 wokół prognozy na grudzień-93 na 187.4. Limity zaufania dla prognoz więcej niż jednego okresu naprzód będą ogólnie wzrastać wraz ze wzrostem horyzontu prognozy, ze względu na niepewność co do poziomu i tendencji oraz czynników sezonowych, ale trudno im wyliczyć je ogólnie metodami analitycznymi. (Odpowiednim sposobem obliczania wartości granicznych ufności w prognozie LES jest zastosowanie teorii ARIMA, ale niepewność w wskaźnikach sezonowych to inna sprawa). Jeśli chcesz przewidzieć realny przedział ufności dla prognozy więcej niż jednego okresu, biorąc wszystkie źródła Jeśli chodzi o błąd, najlepszym rozwiązaniem jest użycie metod empirycznych: na przykład w celu uzyskania przedziału ufności dla prognozy dwuetapowej przedziału, możesz utworzyć inną kolumnę w arkuszu kalkulacyjnym, aby obliczyć prognozę na 2 kroki przed każdym okresem ( przez uruchomienie wstępnej prognozy jednostopniowej). Następnie oblicz RMSE błędów prognozy dwuetapowej i skorzystaj z niej jako podstawy przedziału ufności dla dwóch etapów. Obliczanie indeksu sezonowego Ta instrukcja powinna być używana razem ze plikiem MS Excel z plikiem sezonowym indexexx. xls znajdującym się na strona domowa klasy Econ437. 1. Lista cen miesięcznych w porządku chronologicznym w kolumnie D arkusza kalkulacyjnego. Przykład. Dostarczony zestaw danych to od stycznia 1975 r. Do grudnia 1996 r., Łącznie 264 obserwacji. 2. Obliczyć wycentrowaną 12-miesięczną ruchomą sumę, dodając ceny od stycznia do grudnia. Musisz zacząć od 6. obserwacji. Przykład. za czerwiec 1975 (obserwacja 6) 3.012.822.632.652.672.652.702.942.762.542.302.30 31.97 3. Powtórz krok 2 dla pozostałej części zbioru danych. Uwaga. Na początku zbioru danych w kolumnie E i na początku sześciokąta E. Na końcu kolumny E. zostanie 5 pustych komórek na początku zestawu danych. 4. Oblicz całkowitą liczbę kolumn na 2 miesiące w kolumnie E i wprowadź ją w kolumnie F, począwszy od 7. obserwacji. Na początku i końcu kolumny F. na początku i na końcu kolumny F. zostanie na przykład 6 pustych komórek. Do obserwacji 7, 31.9731.3363.30. 5. Podziel kolumnę F na 24 i wprowadź ją w kolumnie G, zaczynając od obserwacji 7. Jest to wyśrodkowana 12-miesięczna średnia podwójna średnia (MA). 6. Podziel oryginalne ceny w kolumnie D za środkową średnią 12 miesięcy w kolumnie G i wprowadź te indywidualne wartości miesięczne w kolumnie H począwszy od lipca 1975 r., Obserwacja 7. Nie będzie wartości dla pierwszych 6 miesięcy 1975 r. w ciągu ostatnich sześciu miesięcy 1996 r. 7. Dodać wszystkie miesięczne indeksy każdego miesiąca i przeanalizować je w celu uzyskania wartości indeksu surowego. Patrz tabela poniżej. Znajdź średnią surowych wskaźników. Podziel każdego miesiąca indeksu surowego według średnich indeksów surowych, aby uzyskać indeks skorygowany. Miesięczne średnie i centrowane średnie kroczące Kilka punktów o sezonowości w serii czasów powtarza się, nawet jeśli wydają się one oczywiste. Jednym z nich jest to, że termin 8220season8221 niekoniecznie odnosi się do czterech pór roku, wynikających z nachylenia osi Earth8217s. W analizie predykcyjnej 8220season8221 często oznacza dokładnie, że ponieważ wiele zjawisk, z którymi się uczymy, zmienia się wraz z postępem wiosny do zimy: sprzedaż narzędzi zimowych lub letnich, częstość występowania pewnych powszechnych chorób, zdarzenia pogodowe spowodowane lokalizacją strumień strumienia i zmiany temperatury wody we wschodnim Oceanie Spokojnym i tak dalej. Również zdarzenia, które zdarzają się regularnie, mogą działać jak sezony meteorologiczne, chociaż mają tylko niewielkie połączenie z przesileniami i równonocami. Osiem godzinnych zmian w szpitalach i fabrykach często wyraża się w częstości występowania spożycia i wydatków na energię tam, sezon trwa osiem godzin i cykle cyklu codziennie, nie każdego roku. Długoterminowe terminy podatków sygnalizują początek zalania dolarami do skarbów komunalnych, stanowych i federalnych, sezon może wynosić jeden rok (podatki od osób fizycznych), sześć miesięcy (podatki od nieruchomości w wielu stanach), kwartalnie (wiele podatków od osób prawnych ), i tak dalej. To trochę dziwne, że słowo 8220season8221 odnosi się ogólnie do regularnie powtarzającego się okresu, ale nie ma ogólnego terminu dla okresu, w którym następuje jeden pełny sezon. 8220Cycle8221 jest możliwe, ale w analityce i prognozowaniu tego terminu zwykle rozumie się okres o nieokreślonej długości, na przykład cykl koniunkturalny. Wobec braku lepszego terminu, I8217ve wykorzystywał 8220 okres obejmujący 8221 w tym i kolejnych rozdziałach. To isn8217t słuszne pojęcie terminologiczne. Sposoby identyfikacji sezonów i okres czasu, w którym pory roku mają rzeczywisty, a często niewielki wpływ na sposób mierzenia ich skutków. Poniższe sekcje omawiają, jak niektórzy analitycy różnią się sposobem obliczania średnich kroczących w zależności od tego, czy liczba sezonów jest nieparzysta czy parzysta. Używanie średnich ruchów zamiast prostych średnich Załóżmy, że duże miasto zastanawia się nad ponownym przydzieleniem policji drogowej, aby lepiej zająć się przypadkami jazdy w czasie, gdy miasto jest zdegradowane. Cztery tygodnie temu pojawiły się nowe ustawy, legalizujące posiadanie i rekreacyjne użycie marihuany. Od tamtej pory dziennie liczba aresztowań ruchu na DWI wydaje się być tendencyjna. Skomplikowanymi sprawami jest fakt, że liczba pieczołowicie wzrasta w piątki i soboty. Aby pomóc zaplanować zapotrzebowanie na siłę roboczą w przyszłości, planujesz przewidzieć, jaka jest tendencja, która powstała. You8217d również chciałbyś poświęcić czas na rozmieszczenie zasobów, aby uwzględnić sezonowość związaną z weekendem, która ma się odbyć. Rysunek 5.9 zawiera odpowiednie dane, z którymi musisz pracować. Rysunek 5.9 Z każdym zestawem danych każdy dzień tygodnia stanowi okres. Nawet po prostu wzrokiem wykres na rysunku 5.9. można stwierdzić, że wzrasta liczba aresztowań. You8217 będą musieli planować rozszerzenie liczby funkcjonariuszy ruchu i mieć nadzieję, że wkrótce nastąpi szybki trend. Ponadto dane zawierają informacje o tym, że w piątki i soboty regularnie odbywa się więcej aresztowań, dzięki czemu alokacja zasobów musi dotyczyć tych trudności. Musisz jednak określić ilościową tendencję, aby ustalić, ile dodatkowych policji będziesz musiał przynieść. Musisz także oszacować spodziewany rozmiar kolizji weekendowych, aby ustalić, ile dodatkowych policji, których potrzebujesz, będzie oglądało dla tych kierowców niekorzystne zmiany. Problem polega na tym, że od dawna don8217t wie, ile dziennego wzrostu jest wynikiem trendu i ile jest spowodowane tym efektem weekendowym. Możesz zacząć od detrending szeregów czasowych. Wcześniej w tym rozdziale, w 8220Simple Seasonal Averages, 8221 widziałeś przykład, jak odstraszać szereg czasowy, aby wyizolować efekty sezonowe za pomocą prostej metody średniej. W tej sekcji you8217 zobaczy, jak to zrobić, używając średnich ruchów8212więcej prawdopodobieństwa, podejście średniej ruchomości jest używane częściej w analityce predyktywnej, niż podejście proste średnie. Istnieją różne powody, aby zwiększyć popularność średnich kroczących, między innymi, że podejście "ruchomych średnich" nie wymaga zwielokrotniania danych w procesie ilościowego określania tendencji. Przypomnijmy, że wcześniejszy przykład spowodował, że konieczne było zwalnianie średnich kwartalnych do średnich rocznych, obliczanie rocznej tendencji, a następnie rozdawanie jednej czwartej rocznej tendencji w każdym kwartale roku. Ten krok był potrzebny, aby usunąć trend ze skutków sezonowych. W przeciwieństwie do tego, podejście "ruchomo średnie" pozwala pozbyć się szeregów czasowych bez uciekania się do tego rodzaju obróbki. Rysunek 5.10 pokazuje, jak działa podejście średniej ruchomej w niniejszym przykładzie. Rysunek 5.10 Średnia ruchoma w drugim wykresie wyjaśnia trenujący trend. Rysunek 5.10 dodaje średnią ruchomą kolumnę oraz kolumnę dla poszczególnych sezonów. do zbioru danych z rysunku 5.9. Oba dodatki wymagają dyskusji. Spike w aresztowaniach, które mają miejsce w weekendy daje powód, aby sądzić, że pracujesz z sezonów, które powtarzają się raz w tygodniu. Dlatego zacznij od uzyskania średniej przez cały okres 8212, czyli pierwszych siedmiu sezonów, od poniedziałku do niedzieli. Wzór średniej w komórce D5, pierwszej dostępnej średniej ruchomej, jest następujący: ta formuła jest kopiowana i wklejana przez komórkę D29, dzięki czemu masz 25 średnich ruchomej na podstawie 25 przebiegów siedmiu kolejnych dni. Zauważ, że w celu pokazania zarówno pierwszych, jak i ostatnich obserwacji w serii czasów, ukrywam rzędy od 10 do 17. W tym podręczniku rozdział 821 można je ukryć, dostępne z witryny wydawcy 821s. Wykonaj wiele zaznaczonych wierszy 9 i 18, kliknij prawym przyciskiem myszy jeden z nagłówków wierszy i wybierz polecenie Unhide z menu skrótów. Kiedy ukryjesz wiersze arkusza roboczego 8217, jak zrobiłem to na rysunku 5.10. wszystkie wykresy danych w ukrytych wierszach są również ukryte na wykresie. Etykiety osi x określają tylko punkty danych wyświetlane na wykresie. Ponieważ każda średnia ruchoma na rysunku 5.10 obejmuje siedem dni, żadna średnia ruchoma nie jest powiązana z trzema pierwszymi lub ostatnimi trzema obserwacjami. Kopiowanie i wklejenie formuły w komórce D5 w górę o jeden dzień do komórki D4 wyprowadza Cię z obserwacji8212Nie obserwuje się notowania zarejestrowanego w komórce C1. Podobnie nie ma średniej ruchomości zapisanej poniżej komórki D29. Kopiowanie i wklejanie formuły w D29 do D30 wymagałoby obserwacji w komórce C33, a obserwacja nie jest dostępna w dniu, w którym komórka reprezentowałaby. Byłoby oczywiście oczywiście możliwe skrócenie długości średniej ruchomej na pięć zamiast siedmiu. Oznacza to, że średnie ruchome wzory z rysunku 5.10 mogą się rozpocząć w komórce D4 zamiast D5. Jednak w tego typu analizie chcesz, aby średnia długość ruchu była równa liczbie pór roku: siedem dni w tygodniu w przypadku wydarzeń, które powtarzają się co tydzień, oznacza średnią ruchomą o długości siedmiu i cztery czwarte w roku dla wydarzeń, które powtarzalne rocznie oznacza średnią ruchomą o długości czterech. W podobny sposób ogólnie określamy efekty sezonowe w taki sposób, aby w całym okresie czasu wynosić zero. Jak widać w pierwszej części rozdziału 8217 w odniesieniu do prostych średnich, to dokonuje się obliczając średnią z czterech kwartałów w ciągu roku, a następnie odejmując średnią dla roku z każdej kwartalnej liczby. W ten sposób zapewnia się, że całkowity efekt sezonowy wynosi zero. Z kolei te8217 przydatne, ponieważ stawia efekty sezonowe na wspólnym letnim efekcie footing8212a wynoszącym 11, jest dalekie od średniej jako efektu zimowego 821111. Jeśli chcesz przeciętnie pięć sezonów, a nie siedem, aby uzyskać średnią ruchomej, to lepiej. odnajdując zjawisko powtarzające się co pięć pór roku, a nie co siedem. Jednak biorąc pod uwagę średnie efekty sezonowe w dalszej części procesu, średnia ta nie powinna być suma do zera. W tym miejscu konieczne jest przeprowadzenie ponownej kalibracji lub normalizacji. średnie, tak aby ich suma była równa zero. Gdy to zrobione, średnie średnie sezonowe wywierają wpływ na okres czasu należącego do danego sezonu. Po znormalizowaniu średnie sezonowe są określane jako wskaźniki sezonowe, o których wspomniany już rozdział kilkakrotnie wspomniano. You8217 zobaczymy, jak to działa później w tym rozdziale, w 8220Rozwalanie serii z ruchomymi średnimi.8221 Zrozumienie specyficznych sezonów Rysunek 5.10 pokazuje również, co nazywa się sezonami specyficznymi w kolumnie E. Są to, co pozostało po odejściu średniej ruchomej od rzeczywistej obserwacji. Aby zrozumieć, jakie konkretne okresy są reprezentowane, rozważyć średnią ruchu w komórce D5. Jest to średnia obserwacji w C2: C8. Odchylenia każdej obserwacji od średniej ruchomej (na przykład C2 8211 D5) są gwarantowane jako suma równa zero8212that8217s charakterystyczna dla średniej. Dlatego każde odchylenie wyraża efekt związany z tym szczególnym dniem w tym konkretnym tygodniu. Jest to specyficzne sezonowe, a następnie 822weznaczne, ponieważ odchylenie odnosi się do tego konkretnego poniedziałku lub wtorku i tak dalej, i sezonowych, ponieważ w tym przykładzie traktujemy każdego dnia tak, jakby był to okres w całym okresie tygodnia. Ponieważ każda konkretna wielkość sezonowa wpływa na to, że w tym sezonie przekracza średnią ruchomej dla tej grupy siedmiu pór roku, możesz później przeciętnie określić konkretne sezony w danym sezonie (na przykład wszystkie piątki w Twoim seria czasu), aby ocenić, że sezon 8217 generuje raczej ogólne, a nie konkretne efekty. Ta średnia nie jest zakwestionowana przez trend w szeregu czasowym, ponieważ każda konkretna sezonowość wyraża odchylenie od własnej średniej ruchomej. Wyrównywanie średnich kroczących There8217s również kwestia wyrównywania średnich kroczących z oryginalnym zbiorem danych. Na rysunku 5.10. Wyznaczyłem każdą średnią ruchową w środku zakresu obserwowanych przez niego obserwacji. Tak więc na przykład wzór w komórce D5 przewyższa obserwacje w C2: C8, a ja wyrównuję ją z czwartą obserwacją, środkiem uśrednionego zakresu, umieszczając ją w rzędzie 5. Układ ten nazywa się środkową średnią ruchomą . a wielu analityków preferuje wyrównanie każdej średniej ruchomej z punktem środkowym obserwacji, że jest to średnia. Pamiętaj, że w tym kontekście 8220midpoint8221 odnosi się do środka przedziału czasowego: czwartek jest środkiem od poniedziałku do niedzieli. Nie odnosi się do mediany zaobserwowanych wartości, chociaż oczywiście w praktyce może to działać. Innym podejściem jest końcowa średnia ruchoma. W tym przypadku każda średnia ruchoma jest wyrównana z końcową obserwacją, że średnia8212 i dlatego śledzi swoje argumenty. Często jest to preferowany układ, jeśli chcesz użyć średniej ruchomej jako prognozy, jak to ma miejsce w przypadku wygładzania wykładniczego, ponieważ Twoja ostateczna średnia ruchoma jest zgodna z końcową obserwacją. Średnie kroczące średnie kroki przy parzystych liczbach pór roku Zwykle przyjmujemy specjalną procedurę, gdy liczba pór roku jest nawet bardziej niż dziwna. To typowy stan rzeczy: w okresach obejmujących typowe okresy, takie jak miesiące, kwartale i okresy czterornikowe (w wyborach) wydają się być liczbami równymi. Trudność z parzystą liczbą pór roku jest taka, że ​​nie ma punktu środkowego. Dwa nie jest środkiem zakresu rozpoczynającego się od 1, a kończącym się na 4, a nie jest 3, jeśli można powiedzieć, że ma jeden, jego punkt środkowy wynosi 2,5. Sześć nie jest punktem średnim od 1 do 12, a nie ma 7 jego czysto teoretycznego punktu środkowego wynosi 6,5. Aby działać tak, jakby istnieje punkt pośredni, musisz dodać warstwę średnią na szczycie średnich kroczących. Patrz rysunek 5.11. Rysunek 5.11 Excel oferuje kilka sposobów obliczania średniej ruchomej. Ideą tego podejścia do uzyskania średniej ruchomej, która w latach osiemdziesiątych skoncentrowała się na istniejącym punkcie środkowym, gdy liczba dni równa jest kilku pułapom, to przeciągnąć półpiętro o pół pory. Obliczasz średnią ruchomą, która byłaby wyśrodkowana, powiedzmy, trzeci punkt w czasie, jeśli pięć pór roku zamiast cztery stanowiły jedną pełną zmianę kalendarza. To, że wykonano dwa kolejne średnie kroczące i uśredniając ich. Tak na rysunku 5.11. there8217s średnia ruchoma w komórce E6, która średnia wartości w D3: D9. Ponieważ w D3: D9 są cztery wartości sezonowe, średnia ruchoma w E6 jest uważana za wyśrodkowaną w wyimaginowanym sezonie 2,5, o połowę niższym od pierwszego dostępnego sezonu kandydata, 3. (sezony 1 i 2 są niedostępne jako punkty pośrednie dla brak danych do średniej przed sezonem 1.) Należy jednak pamiętać, że średnia ruchoma w komórce E8 przewyższa wartości w D5: D11, druga do piątej w serii czasowej. Ta średnia jest wyśrodkowana (wyimaginowany) punkt 3.5, pełny okres przed średnią wyśrodkowaną na 2,5. Uśredniając dwa średnie ruchome, więc myślenie idzie, można przeciągnąć punkt środkowy pierwszej średniej ruchomej o pół punktu o 2,5 punktu na 3. To, co oznaczają wartości średnie w kolumnie F na rysunku 5.11. Komórka F7 dostarcza średnią ruchomej średniej w E6 i E8. I średnia w F7 jest wyrównana z trzecim punktem danych w pierwotnej serii czasowej, w komórce D7, aby podkreślić, że średnia jest skoncentrowana na tym sezonie. Jeśli rozwiniesz formułę w komórce F7, a także średnie ruchome w komórkach E6 i E8, you8217 zobaczy, że okazuje się średnią ważoną spośród pierwszych pięciu wartości w serii czasowej, przy czym pierwsza i piąta wartość podano wagę z 1, a druga do czwartej wartości, biorąc pod uwagę wagę 2. Prowadzi to do szybszego i prostszego sposobu obliczania średniej ruchomej z równą liczbą pór roku. Na rysunku 5.11. wagi są przechowywane w zakresie H3: H11. Ta formuła zwraca pierwszą centrowaną średnią ruchową, w komórce I7: ta formuła zwraca 13,75. co jest identyczne z wartością obliczoną przez podwójnie przeciętną formułę w komórce F7. Dokonywanie odniesienia do ciężaru bezwzględnie za pomocą znaków dolara w H3: H11. możesz skopiować formułę i wkleić ją tak daleko, jak to konieczne, aby resztę środkowych średnic ruchu. Determinacja serii z średnimi kroczącymi Jeśli średnie ruchome zostały odejmowane z pierwotnych obserwacji, aby uzyskać określone sezony, usunięto trendu z serii. Co pozostało w konkretnych sezonach, to zwykle stacjonarna, pozioma seria z dwoma efektami, które powodują, że konkretne sezony odbiegają od linii prostej: efektów sezonowych i przypadkowych błędów w pierwotnych obserwacjach. Rysunek 5.12 przedstawia wyniki dla tego przykładu. Rysunek 5.12 Szczególne efekty sezonowe w piątek i sobotę pozostają jasne w serii detrended. Górny schemat na rysunku 5.12 przedstawia oryginalne codzienne obserwacje. Zarówno ogólna tendencja wzrostowa jak i weekendowe skoki sezonowe są jasne. Na dolnym wykresie pokazano konkretne sezony: wynik odstraszenia oryginalnych serii przy użyciu filtru o średniej ruchomości, jak opisano wcześniej w 8220Podstawy specyficzne dla sezonu.8221 Można zauważyć, że zespoły z detrendą są obecnie w zasadzie poziome (liniowa linia poszczególnych sezonów ma lekki spadek w dół), ale sezonowe piątkowe i sobotnie kolce nadal są na swoim miejscu. Następnym krokiem jest wyjście poza konkretne sezony do indeksów sezonowych. Patrz rysunek 5.13. Rysunek 5.13 Określone efekty sezonowe są uśrednione, a następnie normalizowane tak, aby osiągnąć sezonowe indeksy. Na rysunku 5.13. konkretne sezony w kolumnie E są rozmieszczone w formie tabelarycznej pokazanej w zakresie H4: N7. Celem jest po prostu ułatwienie obliczania średnich sezonowych. Te średnie są pokazane w H11: N11. Wartości w H11: N11 są średnimi, a nie odchyleniami od średniej, a zatem możemy oczekiwać od nich sumy zerowej. Nadal musimy dostosować je tak, aby wyrażały odchylenia od wielkiej średniej. Ta wielka średnia pojawia się w komórce N13 i jest średnią średnich sezonowych. Można osiągnąć sezonowe indeksy, odejmując średnią z N13 z każdego z średnich sezonowych. Wynik jest w zakresie H17: N17. Te indeksy sezonowe nie są już konkretne dla danej średniej ruchomej, jak ma to miejsce w konkretnych sezonach w kolumnie E. Ponieważ liczba ta wynosiła średnio w każdym przypadku danego sezonu, wyrażają one średni wpływ danego sezonu na cztery tygodnie w serii czasowej. Co więcej, są to środki sezonu 8217s8212nastego, a dzień8217s8212efektywny w przypadku zatrzymania ruchu w porównaniu do średniej w ciągu siedmiu dni. Możemy teraz używać tych sezonowych indeksów, by zepsuć serie. We8217 wykorzystują serie zdemizowane, aby uzyskać prognozy metodą regresji liniowej lub metodą Holt8217s w celu wygładzania trenowanych serii (omówionych w Rozdziale 4). Następnie dodajemy wskaźniki sezonowe z powrotem do prognoz, aby je zrestartować. Wszystko to jest pokazane na rysunku 5.14. Rysunek 5.14 Po zastosowaniu indeksów sezonowych, wykończenia stosowane w tym miejscu są takie same, jak w przypadku zwykłych średnich. Etapy przedstawione na rysunku 5.14 są w dużej mierze takie same jak na rysunkach 5.6 i 5.7. omówione w kolejnych sekcjach. Przygotowanie obserwacji Odejmuj indeksy sezonowe z pierwotnych obserwacji, aby zminimalizować dane. Można to zrobić, jak pokazano na rysunku 5.14. w których oryginalne obserwacje i indeksy sezonowe są rozmieszczone jako dwie listy rozpoczynające się w tym samym wierszu, kolumny C i F. To rozwiązanie ułatwia obliczanie. Można także odejmować, jak pokazano na rysunku 5.6. w których oryginalne kwartalne obserwacje (C12: F16), kwartalne indeksy (C8: F8) oraz zemstaologiczne wyniki (C20: F24) są wyświetlane w formie tabelarycznej. Taki układ ułatwia skupienie się na indeksach sezonowych i na okresach kwartalnych. Prognoza z obserwacji zdyscyplinowanych Na rysunku 5.14. spostrzeżenia te są zawarte w kolumnie H, a na rysunku 5.7 znajdują się w kolumnie C. Niezależnie od tego, czy chce się zastosować podejście regresji czy podejście do wygładzania prognozy, najlepiej jest zorganizować sporządzenie spisu zdań w jednej kolumnie. Na rysunku 5.14. prognozy znajdują się w kolumnie J. Następująca formuła tablicy jest wpisana w zakresie J2: J32. Wcześniej w tym rozdziale wskazałem, że jeśli pominiesz argument x wartości z argumentów funkcji 8217s TREND (), Excel dostarczy wartości domyślne 1. 2. n. gdzie n jest liczbą wartości y. We wspomnianej właśnie formule H2: H32 zawiera 31 y-wartości. Ponieważ brakuje argumentu zawierającego wartości x, Excel dostarcza wartości domyślne 1. 2. 31. Są to wartości, które chcielibyśmy użyć mimo to w kolumnie B, więc podana formuła odpowiada TREND (H2: H32, B2: B32). I to jest struktura stosowana w modelach D5: D24 z rysunku 5.7: Dokonanie prognozy jednostopniowej Do tej pory przewidziano prognozy dotyczące deseasonalizowanych serii czasowych od t1 do t31 na rysunku 5.14. i od t 1 do t 20 na rysunku 5.7. Prognozy te stanowią przydatne informacje dla różnych celów, w tym ocenę dokładności prognoz za pomocą analizy RMSE. Ale twój główny cel prognozuje co najmniej następny, jak dotąd nie zaobserwowany okres. Aby to uzyskać, można było najpierw przewidzieć z funkcji TREND () lub LINEST (), jeśli używasz regresji lub z wyrafinowanej formuły wygładzania, jeśli używasz metody Holt8217s. Następnie można dodać indeks sezonowy do regresji lub wygładzić prognozę, aby uzyskać prognozę, która obejmuje zarówno tendencję, jak i efekt sezonowy. Na rysunku 5.14. otrzymasz prognozę regresji w komórce J33 za pomocą tej wzoru: w tej formule wartości y w H2: H32 są takie same jak w innych TREND () w kolumnie J. Takie są wartości domyślne x-1 do 32. Teraz jednak podajemy nową wartość x jako trzeci argument function8217s, który mówisz TREND (), aby szukać w komórce B33. It8217s 32. następna wartość t. I Excel zwraca wartość 156,3 w komórce J33. Funkcja TREND () w komórce J33 informuje program Excel, w efekcie, 8220Calculation regresji regresji dla wartości w H2: H32 regresji na wartości t od 1 do 31. Zastosuj równanie regresji do nowej wartości x wynoszącej 32 i zwróć wynik.8221 You8217 znajdą takie samo podejście w komórce D25 z rysunku 5.7. gdzie formuła uzyskania prognozy jednoetapowej jest następująca: Dodawanie indeksów sezonowych Wstecz W Ostatnim krokiem jest ponowne obliczenie prognoz poprzez dodanie indeksów sezonowych do prognoz trendów, odwracając to, co zrobiłeś cztery kroki w tył, gdy odejmujesz indeksy z pierwotnych obserwacji. Odbywa się to w kolumnie F na rysunku 5.7 i kolumnie K na rysunku 5.14. Don8217t zapomnij dodać odpowiedni indeks sezonowy dla prognozy jednoetapowej wyprzedzalności, a wyniki pokazane w komórce F25 na rysunku 5.7 oraz w komórce K33 na rysunku 5.14. (I8217wyświetlono komórki jednoetapowe na obu rysunkach 5.7 i Rysunek 5.14, aby podświetlić prognozy). Można znaleźć wykresy trzech reprezentacji danych o zatrzymaniu ruchu na Rysunku 5.15. serie zdemoralizowane, prognoza liniowa z danych zdemaskalizowanych, a także prognozy rezygnacji. Zauważ, że prognozy uwzględniają zarówno ogólny trend pierwotnych danych, jak i jego kolczugi FridaySaturday. Rysunek 5.15 Wykresy prognoz.6.2 Średnie ruchome ma 40 elektrów, kolejność 5 41 W drugiej kolumnie tej tabeli wyświetlana jest średnia ruchoma rzędu 5, przedstawiająca szacunek cyklu trendu. Pierwszą wartością w tej kolumnie jest średnia z pierwszych pięciu obserwacji (1989-1993), druga wartość w kolumnie 5-MA jest średnią z wartości 1990-1994 i tak dalej. Każda wartość w kolumnie 5-MA jest średnią obserwacji w okresie pięcioletnim, wyśrodkowanym w danym roku. Nie ma wartości dla pierwszych dwóch lat lub ostatnich dwóch lat, ponieważ nie mamy dwóch obserwacji po obu stronach. W powyższej formule kolumna 5-MA zawiera wartości kapelusza z k2. Aby zobaczyć, jak wygląda trend cyklu, spisujemy go wraz z pierwotnymi danymi na rysunku 6.7. działka 40 elecsales, główna cena sprzedaży energii elektrycznej w Pradze, ylab GWhquot. xlab quotYearquot 41 lines 40 ma 40 elecsales, 5 41. colreditedquot 41 Zwróć uwagę na to, że trendu (w kolorze czerwonym) jest gładsza niż oryginalne dane i przechwytuje główny ruch serii czasowej bez wszystkich niewielkich wahań. Metoda średniej ruchomości nie pozwala na oszacowanie T, gdzie t jest bliskie końcom serii, dlatego czerwona linia nie rozciąga się na brzegi wykresu po obu stronach. Później będziemy używać bardziej wyrafinowanych metod szacowania cyklu trendu, które pozwolą oszacowania w pobliżu punktów końcowych. Kolejność średniej ruchomej określa płynność oszacowania cyklu trendu. Generalnie większy porządek oznacza gładszą krzywą. Poniższy wykres przedstawia wpływ zmiany kolejności średniej ruchomej dla danych dotyczących sprzedaży energii elektrycznej w budynkach mieszkalnych. Proste średnie ruchome, takie jak zwykle, są nieparzyste (np. 3, 5, 7, itd.). Są więc symetryczne: w średniej ruchomej rzędu m2k1 istnieją wcześniejsze obserwacje, k późniejsze obserwacje i obserwacja środkowa uśrednione. Ale gdyby m było równe, nie byłoby już symetryczne. Średnie kroczące średnich kroczących Można zastosować średnią ruchomą do średniej ruchomej. Jednym z powodów takiego rozwiązania jest równomierna ruchoma symetryczna średnica. Na przykład możemy przyjąć średnią ruchomej rzędu 4, a następnie zastosować kolejną średnią ruchoma rzędu 2 do wyników. W tabeli 6.2 dokonano tego w pierwszych kilku latach australijskich kwartalnych danych o produkcji piwa. piwo2 lt - okno 40 ausbeer, start 1992 41 ma4 lm 40 piwo2, zamówienie 4. środek FALSE 41 ma2x4 lt-40 piwo2, zamówienie 4. środek TRUE 41 Notacja 2times4-MA w ostatniej kolumnie oznacza 4-MA a następnie 2-MA. Wartości w ostatniej kolumnie uzyskuje się biorąc średnią ruchomą rzędu 2 wartości w poprzedniej kolumnie. Na przykład pierwsze dwie wartości w kolumnie 4-MA to 451,2 (443410420532) 4 i 448,8 (410420532433) 4. Pierwszą wartością w kolumnie 2times4-MA jest średnia z tych dwóch: 450.0 (451.2448.8) 2. Kiedy 2-MA idzie za średnią ruchu równomiernego (np. 4), nazywana jest środkową średnią ruchoma rzędu 4. To dlatego, że wyniki są teraz symetryczne. Aby zobaczyć, że tak jest, możemy napisać 2times4-MA w następujący sposób: begin hat amp frac Bigfrac (y y y y) frac (y y y y) frac18y frac18y frac18y frac18y koniec Jest to ważona średnia obserwacji, ale jest symetryczna. Możliwe są również inne kombinacje średnich ruchomej. Na przykład często stosuje się 3times3-MA i składa się z średniej ruchomej rzędu 3, a następnie innej średniej ruchomej rzędu 3. Ogólnie rzecz biorąc, MA równomierne musi być za nią równomierne, aby symetryczne. Podobnie, nieparzysta kolejność MA powinna następować po nieparzystej kolejności. Szacowanie cyklu trendu z danymi sezonowymi Najczęstszym zastosowaniem średnich ruchomej jest oszacowanie cyklu trendu z danych sezonowych. Rozważmy 2times4-MA: frac18y frac18y. W odniesieniu do danych kwartalnych, w każdym kwartale roku podaje się taką samą wagę, jak pierwsze i ostatnie warunki mają zastosowanie do tego samego kwartału w kolejnych latach. W konsekwencji sezonowa zmiana będzie uśredniona, a uzyskane wartości kapelusza t pozostaną niewiele lub nie pozostaną wcale zmian sezonowych. Podobny efekt uzyskano przy użyciu 2-krotnego 8-MA lub 2-krotnego 12-MA. Ogólnie rzecz biorąc, 2times m-MA jest równoważne ważonej ruchomą średnią rzędu m1 ze wszystkimi obserwacjami mającymi ciężar 1m, z wyjątkiem pierwszego i ostatniego określenia, które przyjmują wagi 1 (2m). Jeśli więc okres sezonowy jest równy i rzędu m, użyj 2times m-MA do oszacowania cyklu trendu. Jeśli okres sezonowy jest nieparzysty i rzędu m, użyj m-MA do oszacowania cyklu trendu. W szczególności można wykorzystać oszacowanie cyklu trendu danych miesięcznych w oparciu o 2-godzinną 12-MA, a 7-MA można wykorzystać do oszacowania cyklu trendu danych dziennych. Inne decyzje dotyczące kolejności rejestracji zazwyczaj powodują, że szacunki cyklu koniunkturalnego są zanieczyszczone sezonowością danych. Przykład 6.2 Produkcja urządzeń elektrycznych Na rysunku 6.9 przedstawiono indeks 2times12-MA stosowany do indeksu zamówień urządzeń elektrycznych. Zauważ, że gładka linia nie wykazuje sezonowości jest prawie taka sama jak cykl trendu pokazany na rysunku 6.2, który został oszacowany przy użyciu bardziej wyrafinowanej metody niż średnie ruchome. Każdy inny wybór dla kolejności średniej ruchomej (z wyjątkiem 24, 36 itd.) Spowodowałby gładką linię, która wykaże pewne wahania sezonowe. działka 40 elecequip, ylab quotNowy zamówień indexquot. (obszar Euro) 41 wierszy 40 ma 40 elecequip, kolejność 12 41. colredredquot 41 Średnie ważone średnie ruchome Połączenie średnich ruchów powoduje średnie ważone ruchomości. Na przykład opisany powyżej model 2x4-MA jest równowaŜny waŜonym 5-MA z cięŜarami podanymi przez frac, frac, frac, frac, frac. Ogólnie ważona m-MA może być zapisana jako suma kapeluszowa k aj y, gdzie k (m-1) 2, a ciężary są podane w punktach, ak. Ważne jest, aby wagi wszystkie były sumą jednego i że są symetryczne, tak aby aj. Prosty m-MA to szczególny przypadek, w którym wszystkie wagi są równe 1m. Główną zaletą ważonych średnich kroczących jest to, że dają gładszą prognozę cyklu trendu. Zamiast obserwacji wchodzących i wychodzących z obliczeń przy pełnej masie, ich ciężary powoli rosną, a następnie powoli zmniejszają się, powodując gładszą krzywiznę. Znane są niektóre zestawy ciężarów. Niektóre z nich podano w tabeli 6.3.

Comments

Popular Posts