Wykładniczo ruchome przeciętne staty


Stata Analiza danych i oprogramowanie statystyczne. Nicholas J Cox, Durham University, Wielka Brytania Christopher Baum, Boston College. egen, ma i jego ograniczenia. Stata najbardziej oczywistym poleceniem do obliczania ruchomych średnich jest funkcja ma egen Biorąc pod uwagę wyrażenie, tworzy średnia długość tej wypowiedzi Domyślnie przyjmuje się, że 3 musi być nieparzysta. Jednak, ponieważ wpis ręczny wskazuje, egen, ma nie może być łączony z przez listę i dlatego nie ma ona zastosowania do danych paneli W każdym przypadku znajduje się poza zestawem poleceń napisanych specjalnie dla serii czasowych, patrz serie czasowe dla szczegółów. Metody alternatywne. Aby obliczyć średnie ruchome dla danych panelu, istnieją co najmniej dwie możliwości. Zależy to od zestawu danych, który został wcześniej zresetowany. Jest to bardzo warto robić nie tylko możesz zaoszczędzić sobie na wielokrotne określanie zmiennej i zmiennej czasowej panelu, ale Stata zachowuje się elegancko, biorąc pod uwagę luki w danych.1 zapisz własną definicję używając generate. Using serii czasów o peratory takie jak L i F dają definicję średniej ruchomej jako argumentu do generowania instrukcji Jeśli to zrobisz, naturalnie nie ograniczasz się do równoważnych ważonych średnic ruchomych bez średnic, obliczonych przez np. ma. Na przykład równomiernie trzy ciężkie średnie ruchome zostaną podane przez. Niektóre ciężary można łatwo określić. Można oczywiście określić wyrażenie, takie jak log myvar, zamiast zmiennej nazwy, takiej jak myvar. One wielką zaletą tego podejścia jest to, Stata automatycznie wykonuje właściwą metodę wprowadzania danych panelowych, a wartości opóźnień są opracowywane w panelach, podobnie jak logika mówi, że powinny być najbardziej zauważalną wadą jest to, że linia poleceń może być dość długa, jeśli średnia ruchoma wymaga kilku terminów. Innym przykładem jest jednostronna średnia ruchoma oparta jedynie na poprzednich wartościach To mogłoby być użyteczne w celu wygenerowania adaptacyjnego oczekiwania co zmienna będzie oparta wyłącznie na dotychczasowej informacji, co ktoś mógłby przewidzieć r bieżący okres w oparciu o ostatnie cztery wartości, przy użyciu stałego schematu ważenia A 4-letnie opóźnienie może być szczególnie powszechnie stosowane w kwartalnych odstępach czasowych.2 Użyj egen, filter z SSC. Użyj egen filtra funkcji egen z pakietu egenmore na SSC w Stacie 7 zaktualizowany po 14 listopada 2001 r. można zainstalować ten pakiet, po którym pomoc np. wskazuje na szczegóły filtru Dwa przykłady powyżej zostałyby wyświetlone. W tym porównaniu prawdopodobieństwo wygenerowania jest być może bardziej przezroczyste, ale w przeciwnym przypadku zobaczymy przykład odwrotny Opóźnienia są liczbami liczbowymi, które są ujemnymi opóźnieniami -1 -1 rozszerza się do -1 0 1 lub prowadzi 1, , opóźnienie 1 Współczynnik, inna liczba, zwielokrotniać odpowiadające mu opóźnienie lub wiodące elementy w tym przypadku te elementy są myvar i Efektem normalizacji jest skalowanie każdego współczynnika sumą współczynników tak, że coef 1 1 1 normalizuje co odpowiada 1 3 1 3 1 3 i coef 1 2 1 normalizuje jest równoważna współczynnikom 1 4 1 2 1 4. Należy określić nie tylko opóźnienia, ale i współczynniki Ponieważ egen, ma dostarcza równie ważonej sprawy, Głównym powodem filtra egen, jest wspieranie nierównej wagi sprawy, dla której należy określić współczynniki Można również powiedzieć, że zobowiązanie użytkowników do określenia współczynników jest niewielką dodatkową presją na nich, aby zastanowić się nad tym, jakie współczynniki chcą. Główne uzasadnienie dla równych ciężarów jest, jak przypuszczamy, prostota, ale równe odważniki mają złe właściwości w domenie częstotliwości, wspomnieć tylko jeden przykład. Trzeci przykład powyżej mógłby być. Każdy z nich jest tak samo skomplikowany, jak w przypadku generowania podejścia Istnieją przypadki, w których egen , filtr daje prostszy formułowanie niż generuje Jeśli chcesz, aby 9-krotny filtr dwumianowy, który klimatologologów okaże się użyteczny, może być mniej straszny niż i łatwiej uzyskać niż. z danymi panelowymi W rzeczywistości, jak wspomniano powyżej, zależy to od zestawu danych, który został wcześniej zresetowany. Wskazówka graficzna. Po obliczeniu średnich kroczących prawdopodobnie będzie trzeba spojrzeć na wykres. Polecenie napisane przez użytkownika tsgraph jest inteligentne dla zestawów danych tsset Zainstaluj go w aktualnej wersji Stata 7 przez ssc inst tsgraph. What o podziale na if. Naz powyższych przykładów nie skorzystasz, jeśli ograniczenia W rzeczywistości egen, ma nie zezwala, jeśli ma być określony Sporadycznie ludzie wa nt używać, jeśli przy obliczaniu ruchomych średnich, ale jego wykorzystanie jest trochę bardziej skomplikowane niż zazwyczaj. What można oczekiwać od średniej ruchomych obliczyć jeśli zidentyfikować dwie możliwości. Weak interpretacji Nie chcę zobaczyć żadnych wyników dla wykluczone obserwacje. Kompensowa interpretacja Nie chcę nawet używać wartości wykluczonych obserwacji. Tutaj jest konkretnym przykładem Załóżmy, że w wyniku pewnego stanu, jeśli chodzi o warunek, uwzględnia się obserwacje 1-42, ale nie obserwuje się 43. Ale średnia ruchoma dla 42 zależy od między innymi od wartości obserwacji 43, jeśli średnia rozciąga się do tyłu i do przodu i ma długość co najmniej 3, a w pewnych okolicznościach podobnie będzie zależała od niektórych obserwacji od 44. Przypuszczam, że większość ludzi chętnie skorzysta na słabej interpretacji, ale czy jest to prawidłowe, np. filtrowanie nie obsługuje, jeśli możesz zawsze zignorować to, czego nie chcesz, a nawet ustaw niepożądane wartości, aby później brakować y przy użyciu replace. A notatki na brakujące wyniki na końcach serii. Ponieważ średnie kroczące są funkcjami opóźnień i prowadzi, egen, ma produkuje brakujące, gdy opóźnienia i opóźnienia nie istnieją, na początku i na końcu serii An option nomiss zmusza do obliczania krótszych, niekondensowanych średnic ruchomych dla ogonów. W przeciwieństwie do tego, ani wygenerować ani egen, filtrować czy nie zezwala, co jest szczególne, aby uniknąć brakujących wyników. Jeśli brakuje jakiejkolwiek wartości potrzebnej do obliczenia, wynik tego nie ma zależy od tego, czy i jakie operacje korygujące są potrzebne w przypadku takich obserwacji, przypuszczalnie po zapoznaniu się z zestawem danych i rozważeniu wszelkich podstawowych nauk, które można przynieść do wykonania. Metody z serii C. Metody z serii serii są technikami statystycznymi, które wykorzystują historyczne dane zgromadzone przez pewien czas Metody szeregów czasowych zakładają, że to, co wydarzyło się w przeszłości, będzie nadal występować w przyszłości Jak sugerują serie nazw czasowych, te metody dotyczą e prognoza tylko jednego czynnika - czas Obejmują one ruchome średnie, wyrównywanie wykładnicze i liniową linię trendu i należą do najpopularniejszych metod prognozowania krótkoterminowego wśród firm usługowych i produkcyjnych Te metody zakładają, że możliwe do zidentyfikowania wzorce lub trendy historyczne na żądanie w miarę upływu czasu Powtarzajmy się. Średnia Średnia prognoza czasowa może być tak prosta, jak zapotrzebowanie w bieżącym okresie, aby przewidzieć zapotrzebowanie w następnym okresie Czasami nazywa się ona naiwną lub intuicyjną prognozą 4 Na przykład, jeśli popyt wynosi 100 jednostki w tym tygodniu, prognoza na następny tydzień popyt jest 100 jednostek, jeśli popyt okazuje się 90 jednostek, a następnie żądanie w następnym tygodniu jest 90 jednostek itd. Ten typ metody prognozowania nie uwzględnia zachowań popytu w przeszłości to polega tylko na żądanie w bieżącym okresie Reasumuje ona bezpośrednio do normalnych, przypadkowych ruchów popytu. Prosta metoda średniej ruchomości wykorzystuje kilka wartości popytu w ostatnim czasie przeszłość w celu opracowania prognozy To ma tendencję do tłumienia lub wygładzania losowego wzrostu i spadku prognozy, która wykorzystuje tylko jeden okres Prosta średnia ruchoma jest przydatna do prognozowania popytu, który jest stabilny i nie wykazuje żadnych wyraźnych zachowań popytu, takich jak trend lub wzorzec sezonowy. Średnia roczna obliczana jest na konkretne okresy, na przykład trzy miesiące lub pięć miesięcy, w zależności od tego, ile przewiduje dążenie do wygładzenia danych dotyczących potrzeb. Im dłuższy jest średni okres, tym gładsza będzie formuła obliczania prosta średnia ruchoma równa jest Simple Moving Average. Firma Instant Paper Clip Office Supply Supply sprzedaje i dostarcza materiały biurowe dla firm, szkół i agencji w promieniu 50 miliardów jego magazynu Biuro zajmujące się dostawami biurowymi jest konkurencyjne, a zdolność do dostarczania zamówienia szybko jest czynnikiem w pozyskiwaniu nowych klientów i utrzymaniu starych urzędów zazwyczaj zamówić nie, gdy są one na niskim poziomie dostaw, ale kiedy całkowicie uruchomić ou t W rezultacie potrzebują natychmiast swoich zamówień Kierownik firmy chce mieć pewność, że wystarczająco dużo kierowców i pojazdów jest dostępnych do natychmiastowego dostarczenia zamówień i dysponują odpowiednim zapasem w magazynie Dlatego menedżer chce mieć możliwość prognozowania liczby zamówień które nastąpi w ciągu następnego miesiąca, tj. w celu prognozowania zapotrzebowania na dostawę. Z zapisów zleceń dostawy kierownictwo zgromadziło w ciągu ostatnich 10 miesięcy następujące dane, z których chce obliczyć średnie ruchome na poziomie 3- i 5-miesięcznym. przypuśćmy, że jest koniec października Prognoza wynikająca z 3- lub 5-miesięcznej średniej ruchomej jest zazwyczaj następnym miesiącem w sekwencji, która w tym przypadku przypada w listopadzie Średnia ruchoma jest obliczana na podstawie zapotrzebowania na zamówienia na poprzednich 3 miesięcy w sekwencji według następującego wzoru. Średnia miesięczna 5 miesięcy obliczona jest z danych dotyczących zapotrzebowania z poprzednich 5 miesięcy w następujący sposób. Prognozy średnie ruchome 3- i 5-miesięczne prognozy dla wszystkich m dane o popycie są przedstawione w poniższej tabeli W rzeczywistości tylko prognoza na listopad na podstawie ostatniego miesięcznego zapotrzebowania byłaby wykorzystywana przez menedżera Jednak wcześniejsze prognozy dotyczące poprzednich miesięcy pozwalają nam porównać prognozę z rzeczywistym zapotrzebowaniem, aby zobaczyć, jak dokładna metoda prognozowania jest - to znaczy, jak dobrze. Średnie i pięciomiesięczne średnie. Zarówno średnie ruchome prognozy w powyższej tabeli mają tendencję do wygładzania zmienności występującej w rzeczywistych danych Ten efekt wygładzania można zaobserwować w następująca postać, w której na wykresie pierwotnych danych nałożono średnie 3-miesięczne i 5-miesięczne średnie kroczące 5 miesięcy w poprzedniej postaci, co znacznie poprawia fluktuacje niż średnia 3-miesięczna średnia ruchoma. średnia 3-miesięczna bardziej odzwierciedla najnowsze dane dostępne dla menedżera ds. zaopatrzenia biura W ogóle, prognozy wykorzystujące średnią ruchową w dłuższym okresie są słabsze do reagowania na ostatnie zmiany popytu niż ose wykonywane przy użyciu średniorocznych średnich kroków Dodatkowe okresy danych tłumią szybkość, z jaką reaguje prognoza Określenie odpowiedniej liczby okresów, które mają być użyte w prognozie średniej ruchomej, często wymaga pewnej ilości eksperymentów z próbą i błędem. metoda średniej ruchomej polega na tym, że nie reaguje na wahania występujące z jakiegoś powodu, takie jak cykle i efekty sezonowe Czynniki powodujące zmiany są na ogół ignorowane Jest to w zasadzie metoda mechaniczna, która odzwierciedla dane historyczne w sposób spójny Jednak średnia ruchoma Metoda ta ma tę zaletę, że jest łatwa w obsłudze, szybka i stosunkowo niedroga. Ogólnie rzecz biorąc, metoda ta może stanowić dobrą prognozę dla krótkiego okresu czasu, ale nie powinna być zbytnio naciągnięta. Przeciętna średnia ruchoma metoda może być dostosowana do bardziej odzwierciedlającej fluktuacje danych W metodzie ważonej średniej ruchomej wagi przypisywane są do najnowszych danych zgodnie z następująca formuła. Dane o popycie dla PM Computer Services pokazane w tabeli dla przykładu 10 3 wydają się postępować zgodnie ze wzrastającym trendem liniowym Firma chce obliczyć liniową linię trendu, aby sprawdzić, czy jest dokładniejsza niż wyrównywanie wykładnicze i wyrównanie wykładnicze prognozy opracowane w przykładach 10 3 i 10 4.Niektóre wymagane wartości dla obliczeń najmniejszych kwadratów są następujące. Przy tych wartościach, parametry liniowej linii trendu są obliczane w następujący sposób. Zatem liniowe równanie linii trendu jest. Aby obliczyć prognoza dla okresu 13, niech x 13 w liniowej linii trendu. Następujący wykres pokazuje liniową linię trendu w porównaniu z rzeczywistymi danymi Linia tendencji wydaje się odzwierciedlać rzeczywiste dane - to znaczy być dobrym dopasowaniem - i byłby zatem dobrym modelem prognozowania tego problemu. Jednak wadą liniowej linii trendu jest to, że nie dostosuje się ona do zmiany trendu, ponieważ przewidywane metody wygładzania wykładniczego są takie, że jest to że wszystkie przyszłe prognozy będą odbywać się za linią prostą To ogranicza stosowanie tej metody do krótszej ram czasowych, w której można być stosunkowo pewnym, że tendencja ta nie ulegnie zmianie. Sprawne korekty. Wzorzec sezonowy to powtarzający się wzrost i spadek popytu Wiele artykułów popytu charakteryzuje się zachowaniem sezonowym Sprzedaż odzieży odbywa się zgodnie z sezonowymi wzorcami sezonowymi, a popyt na ciepłe ubrania rośnie w okresie jesiennym i zimowym, a wiosną i latem spada, ponieważ zapotrzebowanie na chłodniejsze ubrania wzrasta Popyt na wiele artykułów detalicznych, w tym zabawek, sprzętu sportowego, odzież, sprzęt elektroniczny, szynka, indyki, wino i owoce zwiększają się w okresie wakacyjnym. Zapotrzebowanie na kartę z życzeniami wzrasta wraz ze szczególnymi dniami, takimi jak Dzień Walentynki i Dzień Matki. Dotyczy to także miesięcznych, tygodniowych lub nawet codzienne Niektóre restauracje mają większy popyt w godzinach wieczornych niż w porze lunchu lub w weekendy w przeciwieństwie do dni powszednich Ruch - a więc sprzedaż - na zakupy mal Odbywa się w piątek i sobotę. Jest kilka metod odzwierciedlania sezonowych wzorców w prognozie serii czasowej Opisujemy jedną z prostszych metod wykorzystujących czynnik sezonowy Czynnik sezonowy to wartość liczbowa pomnożona przez normalną prognozę, prognozowane sezonowo. Jedną z metod rozwijania zapotrzebowania na czynniki sezonowe jest podzielenie zapotrzebowania na każdy okres sezonowy przez całkowity roczny popyt, zgodnie z następującą formułą. Powstające czynniki sezonowe między 0 a 1 0 są w efekcie częścią całkowity roczny popyt przypisany do każdego sezonu Te czynniki sezonowe są pomnożone przez roczny prognozowany popyt na wydajność skorygowane prognozy dla każdego sezonu z uwzględnieniem prognoz z dostosowaniami sezonowymi. Farmy szkieletowe zwiększają indyki sprzedając firmie przetwórstwa mięsa przez cały rok. Jednak sezon szczytowy jest wyraźnie w czwartym kwartale roku, od października do grudnia farmy Wishbone doświadczały zapotrzebowania na indyki na th e w ciągu ostatnich trzech lat pokazano w poniższej tabeli. Ponieważ mamy trzy lata danych o popy, możemy obliczyć czynniki sezonowe, dzieląc całkowity kwartalny popyt na trzy lata na całkowity popyt we wszystkich trzech latach. Następnie chcemy pomnożyć prognozowane popyt na przyszły rok, 2000, według każdego z czynników sezonowych, aby uzyskać prognozowany popyt na każdy kwartał Aby to osiągnąć potrzebujemy prognozy popytu na 2000 rok W tym przypadku, ponieważ dane o popycie w tabeli wydają się ogólnie wzrastać trend, obliczymy liniową linię trendu w ciągu trzech lat danych w tabeli, aby uzyskać przybliżoną prognozę pogody. Jednak prognoza na 2000 rok wynosi 58 17 lub 58.170 indyków. Wykorzystując tę ​​roczną prognozę popytu, prognozy skorygowane sezonowo, SFi, w 2000 r. Są zgodne z tymi kwartalnymi prognozami przy rzeczywistych wartościach popytu w tabeli, wydają się one stosunkowo dobre prognozy dotyczące prognoz, odzwierciedlające zarówno sezonowe wahania danych, jak i ogólny trend wzrostowy. 10-12 Ho w to ruchomą średnią metodę podobną do wyrównania wykładniczego.10-13 Jaki wpływ na wykładniczy wykładzina wygładza wzrasta stała wygładzania.10.10 Jak wyrównywany wyrównany wykład różni się od wygładzania wykładniczego.10-15 Co decyduje o wyborze stała wygładzająca dla trendów w wyrównanym elemencie wyrównania wykładniczego.10-16 W przykładach dotyczących szeregów czasowych, prognoza początkowa zawsze zakładała, że ​​jest taka sama jak rzeczywiste zapotrzebowanie w pierwszym okresie. Zaproponować inne sposoby, aby można było wyprowadzić prognozę początkową w rzeczywistym użyciu.10-17 Jak model prognozowania liniowego modelu trendu różni się od modelu regresji liniowej dla prognozowania.10-18 Z modeli szeregów czasowych przedstawionych w tym rozdziale, w tym średniej ruchomej i ważonej średniej ruchomej, wygładzanie wykładnicze i skorygowane gładkość wykładnicza i linijka liniowa, którą uważasz za najlepszą Why.10-19 Jakie są zalety korekty wygładzania wykładniczego mają charakter liniowy linia trendu przewidywanego zapotrzebowania, która wykazuje tendencję.4 KB Kahn i JT Mentzer, Prognozowanie na rynkach konsumenckich i przemysłowych, Journal of Business Forecasting 14, nr 2 Lato 1995 21-28.Monowanie średnich i wykładniczych modeli wygładzania. Jest to pierwszy krok wykraczając poza średnie modele, modele losowego chodu i modele trendów liniowych, nieuzasadnione wzorce i trendy mogą być ekstrapolowane przy użyciu modelu ruchomo-średniego lub wygładzającego Podstawowym założeniem za modelami uśredniania i wygładzania jest to, że szereg czasowy jest lokalnie stacjonarny i powoli zmienia się średnia W związku z tym rzucimy ruchomą lokalną średnią w celu oszacowania bieżącej wartości średniej, a następnie użyć jej jako prognozy na najbliższą przyszłość Można to uznać za kompromis między średnim modelem a modelem losowego chodzenia bez dryfu Ta sama strategia może być użyta do oszacowania i ekstrapolacji tendencji lokalnej Średnia ruchoma jest często nazywana wygładzoną wersją oryginalnej serii, ponieważ uśrednianie krótkotrwałe ma wpływ na wygładzenie wyeliminować uderzenia w oryginalne serie Dzięki dostosowaniu stopnia wygładzania szerokości średniej ruchomej możemy mieć nadzieję na osiągnięcie jakiegoś optymalnego balansu między osiągnięciem średnich i przypadkowych modeli chodu Najprostszym modelem uśredniania jest prosty przykład. średnia ważona średnia ważona Średnia prognoza dla wartości Y w czasie t1, która jest równa w czasie t, jest równa średniej średniej z ostatnich obserwacji m. Tutaj i gdzie indziej będę używać symbolu Y-hat do prognozowania serii czasowej Y dokonanej najwcześniej w poprzednim terminie przez dany model Średnia ta jest skoncentrowana w przedziale 1 2, co oznacza, że ​​oszacowanie lokalna średnia będzie miała tendencję do opóźnienia w stosunku do prawdziwej wartości średniej lokalnej o około m 1 2 okresy Tak więc mówimy średni wiek danych w prostej średniej ruchomej wynosi m 1 2 w stosunku do okresu, na który obliczana jest prognoza jest to kwota czasu, w jakim prognozy będą się spóźniały za punktami zwrotnymi w danych Na przykład, jeśli uśrednimy ostatnie 5 wartości, prognozy będą wynosić około 3 okresy późne w odpowiedzi na punkty zwrotne Zauważ, że jeśli m 1, prosty średni ruchowy model SMA jest równoważny modelowi losowego spaceru bez wzrostu Jeśli m jest bardzo duże porównywalne z długością okresu szacowania, model SMA jest równoważny modelowi średniemu Tak jak w przypadku dowolnego parametru modelu prognozowania, zwyczajowo dostosować wartość ki n Aby uzyskać najlepsze dopasowanie do danych, tzn. najmniejsze błędy prognozy przeciętnie. Oto przykład serii, która wydaje się wykazywać przypadkowe wahania wokół średnio zróżnicowanej średniej. Po pierwsze, spróbuj dopasować ją do przypadkowego spaceru model, co odpowiada prostej średniej ruchomej 1 terminu. Model przypadkowego spaceru reaguje bardzo szybko na zmiany w serii, ale w ten sposób pobiera dużo hałasu w danych losowych wahań, jak również sygnału lokalnego średnia Jeśli weźmiemy pod uwagę prostą średnią ruchomą wynoszącą 5 terminów, otrzymujemy gładsze wyobrażenia prognoz. 5-letnia prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego spaceru w tym przypadku Przeciętny wiek danych w tym prognoza wynosi 3 5 1 2, tak że ma ona tendencję do opóźnienia za punktami zwrotnymi o około trzy okresy Na przykład, spadek koniunktury wydaje się mieć miejsce w okresie 21, ale prognozy nie odwracają się do kilku okresów później. Notyczność, długoterminowe prognozy z mod SMA mod El jest poziomej prostej, podobnie jak w modelu random-walk. Model SMA zakłada więc, że nie ma tendencji do danych. Jednak prognozy z modelu random walk są po prostu równe ostatniej obserwowanej wartości, prognozy od model SMA jest równy średniej ważonej z ostatnich wartości. Obciążenia ufności obliczone przez Statgraphics w odniesieniu do długoterminowych prognoz dotyczących prostej średniej ruchomej nie są szersze w miarę wzrostu horyzontu prognozowego. To oczywiście nie jest poprawne Niestety, nie ma podstaw teorii statystycznej, która mówi nam, jak przedziały ufności powinny poszerzać się w tym modelu Jednak nie jest zbyt trudno obliczyć empiryczne szacunki dopuszczalnych granic dla prognoz dłuższego horyzontu Na przykład można utworzyć arkusz kalkulacyjny, w którym model SMA byłby wykorzystywany do prognozowania 2 kroków do przodu, 3 kroków do przodu, itd. w ramach historycznej próbki danych Można następnie obliczyć próbkowe odchylenia standardowe błędów w każdej prognozie h orizon, a następnie skonstruuj interwały zaufania na potrzeby prognoz długoterminowych przez dodawanie i odejmowanie wielokrotności odpowiedniego odchylenia standardowego. Jeśli spróbujemy 9-letnią prostą średnią ruchomej, otrzymamy jeszcze gładsze prognozy i bardziej opóźniamy efekt. Średni wiek to teraz 5 okresów 9 1 2 Jeśli weźmiemy 19-letnią średnią ruchliwą, średni wiek wzrasta do 10.Notice, że rzeczywiście prognozy są teraz w tyle za punktami zwrotnymi o około 10 okresów. Jaka ilość wygładzania jest najlepsza dla tej serii Oto tabela, w której porównano ich statystykę błędów, również zawierającą średnią 3-miesięczną. Model C, 5-letnia średnia ruchoma, daje najniższą wartość RMSE przez mały margines w średnim okresie 3-letnim i 9-dniowym, a ich inne statystyki są prawie identyczne Więc wśród modeli o bardzo podobnych statystykach błędów możemy wybrać, czy wolelibyśmy nieco lepszej odpowiedzi lub trochę bardziej płynnie w prognozach. Powrót do góry strony. Brown s Simple Exponential Wygładzanie wykładniczo ważone średniej ruchomej. Opisany powyżej prosty model średniej prędkości ma niepożądaną właściwość, która traktuje ostatnie obserwacje równomiernie i całkowicie ignoruje wszystkie poprzednie obserwacje Intuicyjnie, dane z przeszłości powinny być dyskontowane w sposób bardziej stopniowy - na przykład najnowsze obserwacje powinny trochę więcej niż druga ostatnia, a druga najnowsza powinna mieć trochę więcej wagi niż trzeci ostatni, i tak dalej Prosty wygładzający model SES osiąga to. Oznacza to, że wygładzanie stale zmienia liczbę pomiędzy 0 a 1 Jednym ze sposobów zapisania modelu jest zdefiniowanie serii L, która reprezentuje poziom bieżący tj. Lokalna średnia wartość serii, szacowana na podstawie danych do dnia dzisiejszego. Wartość L w czasie t jest obliczana rekurencyjnie od własnej poprzedniej wartości, jak ta. Tak więc bieżąca wygładzona wartość jest interpolacją między poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie kontroluje bliskość interpolowanej wartości najbardziej średnia prognoza Prognoza na następny okres jest po prostu aktualną wygładzoną wartością. W równym stopniu możemy wyrazić następną prognozę bezpośrednio w odniesieniu do poprzednich prognoz i wcześniejszych obserwacji, w każdej z następujących równoważnych wersji W pierwszej wersji prognoza jest interpolacją pomiędzy poprzednią prognozą a wcześniejszą obserwacją. W drugiej wersji następna prognoza uzyskuje się przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu w ułamkowej wartości. Jest to błąd popełniony w czasie t W trzecim projekcie prognoza jest wykładnicza ważona, tzn. zdyskontowana średnia ruchoma ze współczynnikiem dyskonta 1. Wersja interpolacyjna formuły prognozowania jest najprostszym rozwiązaniem, jeśli model jest stosowany w arkuszu kalkulacyjnym, który mieści się w jednej komórce i zawiera odwołania do komórek wskazujące na poprzednią prognozę, poprzednią obserwacja i komórka, w której zachowana jest wartość. Zwróć uwagę, że jeśli 1, model SES jest równoważny losowemu modelowi spacerowemu z hout growth Jeśli 0, model SES jest równoważny modelowi średniemu, przy założeniu, że pierwsza wygładzona wartość jest równa średniej. Powrót na górę strony. Średni wiek danych w prognozie wygładzania wykładnicza prostokątnego wynosi 1 względny do okresu, w którym obliczana jest prognoza To nie powinno być oczywiste, ale można to łatwo wykazać przez ocenę nieskończonej serii W związku z tym prosta prognoza średniej ruchowej skłania się do punktów zwrotnych o około 1 okresy Przykładowo, gdy 0 5 opóźnienie to 2 okresy, gdy 0 2 opóźnienie wynosi 5 okresów, gdy 0 1 opóźnienie wynosi 10 okresów, itd. Dla danego wieku średniego tj. Czas opóźnienia, prosta predykcyjna wygładzająca prognoza SES jest nieco wyższa niż zwykłe poruszanie się średnia prognoza SMA, ponieważ w ostatniej obserwacji obserwuje się relatywnie większą wagę - co nieco odpowiada na zmiany zachodzące w niedawnej przeszłości Przykładowo model SMA z 9 terminami i model SES z 0 2 mają średni wiek z 5 dla da w swoich prognozach, ale model SES wiąże się z ostatnimi 3 wartościami niż model SMA, a jednocześnie nie zapominają o wartościach powyżej 9 okresów, jak pokazano na poniższej wykresie. Inna ważna przewaga model SES w modelu SMA polega na tym, że model SES wykorzystuje parametr wygładzania, który jest ciągle zmienny, dzięki czemu można z łatwością zoptymalizować przy użyciu algorytmu solver w celu zminimalizowania średniego kwadratu. wynosiła 0 2961. Średni wiek danych w tej prognozie wynosi 1 0 2961 3 4 okresów, co jest zbliżone do średniej 6-letniej średniej ruchomej. Prognozy długoterminowe z modelu SES to horyzontalna linia prosta, jak w modelu SMA i model losowego chodzenia bez wzrostu Jednak należy zauważyć, że przedziały ufności obliczane przez Statgraphics różnią się w rozsądny sposób i że są one znacznie węższe niż przedziały ufności dla rand om walk model Model SES zakłada, że ​​seria jest nieco bardziej przewidywalna niż model losowego spaceru. Model SES jest w rzeczywistości przypadkiem specjalnym modelu ARIMA, więc statystyczna teoria modeli ARIMA stanowi solidną podstawę do obliczania przedziałów ufności dla Model SES W szczególności model SES jest modelem ARIMA z odmienną różnicą, terminem MA 1, a nie określonym terminem znanym jako model ARIMA 0,1, bez stałego Współczynnik MA 1 w modelu ARIMA odpowiada ilość 1 - w modelu SES Przykładowo, jeśli pasujesz do modelu ARIMA 0,1,1 bez stałej wartości w analizowanych seriach, szacowany współczynnik MA 1 wyniósł 0 7029, czyli prawie o jeden minus 0 2961. Możliwe jest dodanie założenia niezerowej stałej tendencji liniowej do modelu SES W tym celu wystarczy podać model ARIMA z jedną różniczką różniczkową i termin MA 1 ze stałą, tj. Model ARIMA 0,1,1 ze stałymi prognozami długoterminowymi a następnie mają tendencję, która jest równa średniej tendencji obserwowanej w całym okresie szacowania Nie można tego zrobić w połączeniu z dostosowaniem sezonowym, ponieważ opcje sezonowej korekty są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stałą długo tendencja wykładnicza do prostego modelu wyrównania wykładniczego z sezonową korektą lub bez sezonu z zastosowaniem opcji dostosowania inflacji w ramach procedury prognozowania Odpowiednia stopa wzrostu inflacji w danym okresie może być oszacowana jako współczynnik nachylenia w modelu tendencji liniowej dopasowany do danych w w połączeniu z naturalną transformacją logarytmową lub może opierać się na innych, niezależnych informacjach dotyczących perspektyw wzrostu długoterminowego Powrót na górę strony. Brown s Linear czyli podwójne wyrównywanie wyrównania. Modele SMA i modele SES zakładają, że nie ma tendencji do jakiegokolwiek rodzaju w danych, które zwykle są OK lub przynajmniej nie-zbyt-kiepskie w przypadku prognoz jednostopniowych, gdy dane są stosunkowo noi sy i mogą być modyfikowane w celu uwzględnienia stałej tendencji liniowej, jak pokazano powyżej. Co z trendami krótkoterminowymi Jeśli seria wykazuje zmienną szybkość wzrostu lub cykliczny wzór, który wyróżnia się wyraźnie na tle hałasu, a jeśli istnieje potrzeba prognozowanie bardziej niż 1 okresu do przodu, a następnie oszacowanie lokalnej tendencji może być problem Prosty model wyrównywania wykładniczego może być uogólniony w celu uzyskania liniowego modelu wygładzania wykładniczego mierzącego lokalną estymację zarówno poziomu, jak i tendencji. Najprostszy trend zmieniający się w czasie model jest brązowym linearnym wykładnikiem wykładniczym, który wykorzystuje dwie różne wygładzone serie, które są skoncentrowane w różnych punktach czasu Formuła prognozowana oparta jest na ekstrapolacji linii przez dwa centra Wyrafinowaną wersją tego modelu, Holt s, jest omówione poniżej. Forma algorytmowa liniowego modelu wygładzania wykładanego przez Brown'a, podobnego do prostego modelu wygładzania wykładniczego, może być wyrażona w wielu różnych, ale formy kwantancyczne Standardowa forma tego modelu jest zwykle wyrażana w następujący sposób Niech S oznacza pojedynczo wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego do serii Y Oznacza to, że wartość S w okresie t jest podana przez. Przypomnijmy, że w prostym wyrównaniu wykładniczym byłaby to prognoza dla Y w okresie t 1 Następnie niech S oznacza podwójnie wygładzoną serię otrzymaną przez zastosowanie prostego wyrównania wykładniczego przy użyciu tego samego do serii S. Na koniec prognoza dla Y tk dla dowolnego k 1, daje te plony e 1 0 tj. oszukiwać nieco i niech pierwsza prognoza będzie równa rzeczywistej pierwszej obserwacji, a y 2 Y 2 Y 1, po której generowane są prognozy przy użyciu powyższego równania To daje takie same dopasowane wartości jako wzór oparty na S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1 Ta wersja modelu jest używana na następnej stronie, która ilustruje kombinację wygładzania wykładniczego z dostosowaniem sezonowym. Holt s Linear Exponential Smoothing. Brown s Model LES oblicza lokalne szacunki poziomu i tendencji, wygładzając ostatnie dane, ale fakt, że robi to z pojedynczym parametrem wygładzania, ogranicza wzorce danych, które jest w stanie dopasować do poziomu i tendencji nie można zmieniać w niezależne modele Model LES Holt'a rozwiązuje ten problem przez uwzględnienie dwóch stałych wygładzania, po jednym dla poziomu i jednego dla trendu W dowolnym momencie t, podobnie jak w modelu Browna, istnieje szacunkowy poziom L t na poziomie lokalnym i szacunek T t lokalnej tendencji Tutaj są one obliczane rekurencyjnie z wartości Y obserwowanej w czasie t oraz poprzednich szacunków poziomu i tendencji przez dwa równania, które stosują wyrównywanie wykładnicze osobno dla nich. Jeśli szacowany poziom i tendencja w czasie t-1 są odpowiednio L t 1 i T t 1, wówczas prognoza dla Y t, która została dokonana w czasie t-1, jest równa L t-1 T t-1 Gdy rzeczywista wartość jest zaobserwowana, zaktualizowane oszacowanie poziom jest obliczany rekurencyjnie przez interpolowanie pomiędzy Y t a jego prognozą, L t-1 T t-1, przy użyciu odważników i 1. Zmiana szacowanego poziomu, mianowicie L t L t 1 może być interpretowana jako hałaśliwy pomiar trend w czasie t Uaktualniony szacunek trendu oblicza się rekurencyjnie przez interpolację między L t L t 1 i poprzedni szacunek trendu T t-1 przy użyciu odważników i 1. Interpretacja stała wygładzania trendu jest analogiczna do stałej wygładzania poziomu Modele o małych wartościach zakładają, że tendencja zmienia się tylko bardzo powoli w czasie, a modele o większym założeniu, że zmienia się szybciej Model z dużą grupą uważa, że ​​dalekiej przyszłości jest bardzo niepewna, ponieważ błędy w oszacowaniu tendencji stają się bardzo ważne, gdy prognozuje się więcej niż jeden rok naprzód Powrót do początku strony. Stałe wygładzania i można je oszacować w zwykły sposób minimalizując średnie kwadratowe błędy prognoz 1-krotnego wyprzedzenia Jeśli to nastąpi w programie Statgraphics, szacunki szacuje się na 0 3048 i 0 008 Bardzo mała wartość oznacza, że ​​model zakłada bardzo niewielką zmianę tendencji z jednego okresu do następnego, więc w zasadzie ten model próbuje oszacować długoterminową tendencję Przez analogię do pojęcia średniego wieku danych używanych do szacowania t lokalny poziom szeregu, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej jest proporcjonalny do 1, choć nie jest do niego równy. W tym przypadku okazuje się, że wynosi on 1 0 006 125 To jest bardzo dokładna liczba ponieważ dokładność szacunkowa nie jest naprawdę 3 miejsc po przecinku, ale ma ten sam ogólny porządek wielkości jak wielkość próbki 100, więc model ten jest uśredniony w odniesieniu do dość dużej liczby historii w szacowaniu tendencji Wykres prognozy poniżej pokazuje, że model LES szacuje nieco większą tendencję lokalną na końcu serii niż stała tendencja szacowana w modelu tendencji SES Również szacunkowa wartość jest niemal identyczna z wartością otrzymaną przez dopasowanie modelu SES z tendencją lub bez , więc jest to prawie ten sam model. Jest to wyglądające jak uzasadnione prognozy modelu, które ma być szacowaniem tendencji lokalnej Jeśli zauważysz tę fabułę, wygląda na to, że lokalny trend spadł w dół pod koniec seria Wh jak się zdarzyło Parametry tego modelu zostały oszacowane przez zminimalizowanie kwadratu błędu prognoz 1-krotnego wyprzedzenia, a nie dłuższych prognoz, w których to przypadku trend nie robi dużo różnicy Jeśli wszystko, co szukasz, to 1 - stop-ahead błędy, nie widzisz większego obrazu trendów w ciągu 10 lub 20 okresów Aby uzyskać ten model w zgodzie z naszą ekstrapolacją danych wzrokowych, możemy ręcznie dostosować stałą wygładzania trendu tak, aby używa krótszej linii odniesienia do szacowania tendencji Na przykład, jeśli zdecydujemy się na ustawienie 0 1, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej wynosi 10 okresów, co oznacza, że ​​uśrednimy tendencję w ciągu ostatnich 20 okresów Oto jak wygląda planowana fabuła, jeśli ustawimy 0 1, zachowując 0 3 To intuicyjnie rozsądne dla tej serii, chociaż prawdopodobne jest, że prawdopodobne jest, że ekstrapolacja tej tendencji nastąpi więcej niż 10 okresów w przyszłości. porównanie modelu f lub dwóch modeli pokazanych powyżej oraz trzech modeli SES Optymalna wartość modelu SES wynosi około 0 3, ale uzyskuje się podobne wyniki z nieco większą lub mniejszą czułością na reakcję przy wartości 0 5 i 0 2. Wyrównanie liniowe Holta z alfa 0 3048 i beta 0 008. B Wyrównanie liniowe Holta z alfa 0 3 i beta 0 1. C Zwykłe wyrównanie wykładnicze z alfa 0 5. D Zwykłe wyrównanie wykładnicze z alfa 0 3. E Proste wyrównanie wykładnicze z alfa 0 2 Statystyki są prawie identyczne, więc naprawdę nie możemy dokonać wyboru na podstawie jednoetapowych prognoz błędów w próbce danych Musimy zwrócić uwagę na inne rozważania Jeśli uważamy, że ma sens oprzeć obecny oszacowanie tendencji na tym, co się wydarzyło w ciągu ostatnich 20 okresów, możemy stworzyć przypadek modelu LES z 0 3 i 0 1 Jeśli chcemy być agnostyczni na temat tego, czy istnieje tendencja lokalna, wówczas jeden z modeli SES mógłby łatwiej wyjaśnić, a także dać więcej middl e-of-the-road prognozy na najbliższe 5 lub 10 okresy Powrót na początek strony. Jakiego rodzaju tendencja-ekstrapolacja jest najlepsza w horyzontalnym lub liniowym Dane empiryczne sugerują, że jeśli dane zostały już skorygowane, jeśli jest to konieczne dla inflacji, to może być nierozsądne ekstrapolacja krótkoterminowych trendów liniowych bardzo daleko w przyszłość Trendy widoczne dziś mogą spowolnić w przyszłości ze względu na różne przyczyny, takie jak nieaktualność produktu, zwiększona konkurencja i cykliczne spowolnienie gospodarcze lub wzrost w przemyśle Z tego powodu prosty wykładniczy wygładzanie często wykonuje lepszą próbę poza próbą niż oczekiwano inaczej, pomimo jej naiwnej ekstrapolacji trendu horyzontalnego Często w praktyce często stosuje się modyfikacje trendu tłumiącego liniowego modelu wygładzania wykładniczego, aby wprowadzić w notatki konserwatyzmu tendencje tendencji tendencji tłumionej Model LES może być implementowany jako szczególny przypadek modelu ARIMA, w szczególności modelu 1,1,2 ARIMA. Można obliczyć przedziały ufności a długoterminowe prognozy wygenerowane przez wykładnicze modele wygładzania, biorąc pod uwagę je jako szczególne przypadki modeli ARIMA Należy uważać, że nie wszystkie programy obliczają prawidłowe przedziały ufności dla tych modeli prawidłowo Szerokość przedziałów ufności zależy od błędu RMS modelu, ii typu wygładzanie proste lub liniowe iii wartość s stała wygładzania s oraz liczba przewidywanych okresów W ogóle odstępy czasowe rozciągają się szybciej, powiększając się w modelu SES i rozchodzą się znacznie szybciej, gdy liniowy, a nie prosty wygładzanie jest używane Ten temat został omówiony w dalszej części sekcji ARIMA notatek Powrót na początek strony.

Comments

Popular Posts