Thursday 16 November 2017

Flytte Gjennomsnittet Tilnærming Prognoser


Introduksjon til ARIMA: nonseasonal modeller ARIMA (p, d, q) prognoser likning: ARIMA modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres til å være 8220stationary8221 ved differensiering (om nødvendig), kanskje i forbindelse med ikke-lineære transformasjoner som logging eller deflatering (om nødvendig). En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstante over tid. En stasjonær serie har ingen trend, dens variasjoner rundt sin gjennomsnitt har en konstant amplitude, og den svinger på en konsistent måte. det vil si at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dets autokorrelasjoner (korrelasjoner med sine egne tidligere avvik fra gjennomsnittet) forblir konstante over tid, eller tilsvarende, at dets effektspektrum forblir konstant over tid. En tilfeldig variabel i dette skjemaet kan ses som en kombinasjon av signal og støy, og signalet (hvis det er tydelig) kan være et mønster av rask eller langsom, gjennomsnittlig reversering eller sinusformet svingning eller rask veksling i tegn , og det kan også ha en sesongbestemt komponent. En ARIMA-modell kan ses som en 8220filter8221 som forsøker å skille signalet fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognose-ligningen for en stasjonær tidsserie er en lineær (dvs. regresjonstype) ekvation hvor prediktorene består av lag av de avhengige variable ogor lagene av prognosefeilene. Det er: Forutsigbar verdi for Y en konstant og en vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene kun består av forsinkede verdier av Y. Det er en ren autoregressiv (8220self-regressed8221) modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kunne være utstyrt med standard regresjonsprogramvare. For eksempel er en førsteordens autoregressiv (8220AR (1) 8221) modell for Y en enkel regresjonsmodell der den uavhengige variabelen bare er Y forsinket med en periode (LAG (Y, 1) i Statgraphics eller YLAG1 i RegressIt). Hvis noen av prediktorene er lags av feilene, er en ARIMA-modell det IKKE en lineær regresjonsmodell, fordi det ikke er mulig å spesifisere 8220last period8217s error8221 som en uavhengig variabel: feilene må beregnes fra tid til annen når modellen er montert på dataene. Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellen8217s spådommer ikke er lineære funksjoner av koeffisientene. selv om de er lineære funksjoner av tidligere data. Så koeffisienter i ARIMA-modeller som inkluderer forsinkede feil må estimeres ved ikke-lineære optimaliseringsmetoder (8220hill-klatring8221) i stedet for bare å løse et system av ligninger. Akronymet ARIMA står for Auto-Regressive Integrated Moving Average. Lags av den stasjonære serien i prognosekvotasjonen kalles kvotoregressivequot vilkår, lags av prognosefeilene kalles quotmoving averagequot vilkår, og en tidsserie som må differensieres for å bli stillestående, sies å være en quotintegratedquot-versjon av en stasjonær serie. Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponentielle utjevningsmodeller er alle spesielle tilfeller av ARIMA-modeller. En nonseasonal ARIMA-modell er klassifisert som en quotARIMA (p, d, q) kvotemodell hvor: p er antall autoregressive termer, d er antall ikke-sekundære forskjeller som trengs for stasjonar, og q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y angi den forskjellen på Y. Det betyr: Merk at den andre forskjellen på Y (d2-saken) ikke er forskjellen fra 2 perioder siden. Snarere er det den første forskjellen-av-første forskjellen. som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for sin lokale trend. Når det gjelder y. Den generelle prognosekvasjonen er: Her er de bevegelige gjennomsnittsparametrene (9528217s) definert slik at deres tegn er negative i ligningen, etter konvensjonen innført av Box og Jenkins. Noen forfattere og programvare (inkludert R programmeringsspråket) definerer dem slik at de har pluss tegn i stedet. Når faktiske tall er koblet til ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren bruker når du leser utgangen. Ofte er parametrene benevnt der av AR (1), AR (2), 8230 og MA (1), MA (2), 8230 etc. For å identifisere den aktuelle ARIMA modellen for Y. begynner du ved å bestemme differensordren (d) trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessighet, kanskje i forbindelse med en variansstabiliserende transformasjon som logging eller deflating. Hvis du stopper på dette punktet og forutser at den forskjellige serien er konstant, har du bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen antall AR-termer (p 8805 1) og eller noen nummer MA-termer (q 8805 1) også er nødvendig i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere avsnitt av notatene (hvis koblinger er øverst på denne siden), men en forhåndsvisning av noen av typene av nonseasonal ARIMA-modeller som ofte oppstår, er gitt nedenfor. ARIMA (1,0,0) førstegangs autoregressiv modell: Hvis serien er stasjonær og autokorrelert, kan den kanskje forutsies som et flertall av sin egen tidligere verdi, pluss en konstant. Forutsigelsesligningen i dette tilfellet er 8230 som er Y regressert i seg selv forsinket med en periode. Dette er en 8220ARIMA (1,0,0) constant8221 modell. Hvis gjennomsnittet av Y er null, vil ikke det konstante begrepet bli inkludert. Hvis hellingskoeffisienten 981 1 er positiv og mindre enn 1 i størrelsesorden (den må være mindre enn 1 i størrelsesorden dersom Y er stasjonær), beskriver modellen gjennomsnittsreferanseadferd hvor neste periode8217s verdi skal anslås å være 981 1 ganger som langt unna gjennomsnittet som denne perioden8217s verdi. Hvis 981 1 er negativ, forutser det middelreferanseadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet denne perioden. I en andre-ordregivende autoregressiv modell (ARIMA (2,0,0)), ville det være et Y t-2 begrep til høyre også, og så videre. Avhengig av tegnene og størrelsene på koeffisientene, kunne en ARIMA (2,0,0) modell beskrive et system hvis gjennomsnitts reversering foregår i sinusformet oscillerende mote, som bevegelse av en masse på en fjær som er utsatt for tilfeldige støt . ARIMA (0,1,0) tilfeldig tur: Hvis serien Y ikke er stasjonær, er den enkleste modellen for den en tilfeldig turmodell, som kan betraktes som et begrensende tilfelle av en AR (1) modell der autoregressive koeffisienten er lik 1, det vil si en serie med uendelig sakte gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som: hvor den konstante sikt er den gjennomsnittlige period-til-periode-endringen (dvs. den langsiktige driften) i Y. Denne modellen kan monteres som en ikke-avskjæringsregresjonsmodell der Første forskjell på Y er den avhengige variabelen. Siden den inneholder (bare) en ikke-sesongforskjell og en konstant periode, er den klassifisert som en quotARIMA (0,1,0) modell med constant. quot. Den tilfeldige tur-uten-drift modellen ville være en ARIMA (0,1, 0) modell uten konstant ARIMA (1,1,0) forskjellig førsteordens autoregressiv modell: Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet løses ved å legge til et lag av den avhengige variabelen til prediksjonsligningen - - dvs ved å regresse den første forskjellen på Y i seg selv forsinket med en periode. Dette vil gi følgende prediksjonsligning: som kan omarrangeres til Dette er en førsteordens autoregressiv modell med en rekkefølge av ikke-soneforskjeller og en konstant term, dvs. en ARIMA (1,1,0) modell. ARIMA (0,1,1) uten konstant enkel eksponensiell utjevning: En annen strategi for korrigering av autokorrelerte feil i en tilfeldig gangmodell er foreslått av den enkle eksponensielle utjevningsmodellen. Husk at for noen ikke-stationære tidsserier (for eksempel de som viser støyende svingninger rundt et sakte varierende gjennomsnitt), utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnittsverdier av tidligere verdier. Med andre ord, i stedet for å ta den nyeste observasjonen som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier for å oppnå denne effekten. Forutsigelsesligningen for den enkle eksponensielle utjevningsmodellen kan skrives i en rekke matematisk ekvivalente former. hvorav den ene er den såkalte 8220error correction8221 skjemaet, der den forrige prognosen er justert i retning av feilen den gjorde: Fordi e t-1 Y t-1 - 374 t-1 per definisjon kan dette omskrives som : som er en ARIMA (0,1,1) - out-konstant prognosekvasjon med 952 1 1 - 945. Dette betyr at du kan passe en enkel eksponensiell utjevning ved å angi den som en ARIMA (0,1,1) modell uten konstant, og den estimerte MA (1) - koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen er gjennomsnittsalderen for dataene i 1-periode fremover prognosene 1 945. Det betyr at de vil ha en tendens til å ligge bak trender eller vendepunkter med ca 1 945 perioder. Det følger at gjennomsnittlig alder av dataene i 1-periode fremover prognosene for en ARIMA (0,1,1) uten konstant modell er 1 (1 - 952 1). For eksempel, hvis 952 1 0,8 er gjennomsnittsalderen 5. Når 952 1 nærmer seg 1, blir ARIMA (0,1,1) uten konstant modell et veldig langsiktig glidende gjennomsnitt og som 952 1 nærmer seg 0 blir det en tilfeldig tur uten drivmodell. What8217s den beste måten å korrigere for autokorrelasjon: legge til AR-vilkår eller legge til MA-vilkår I de to foregående modellene ble problemet med autokorrelerte feil i en tilfeldig turmodell løst på to forskjellige måter: ved å legge til en forsinket verdi av differensierte serier til ligningen eller legge til en forsinket verdi av prognosen feil. Hvilken tilnærming er best En tommelfingerregel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk for modellen og negativ autokorrelasjon vanligvis behandles best ved å legge til en MA term. I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. (Generelt reduserer differensiering positiv autokorrelasjon og kan til og med føre til en bryter fra positiv til negativ autokorrelasjon.) Så, ARIMA (0,1,1) modellen, der differensiering er ledsaget av en MA-term, brukes hyppigere enn en ARIMA (1,1,0) modell. ARIMA (0,1,1) med konstant enkel eksponensiell utjevning med vekst: Ved å implementere SES-modellen som en ARIMA-modell, får du faktisk en viss fleksibilitet. Først og fremst er estimert MA (1) - koeffisient tillatt å være negativ. Dette tilsvarer en utjevningsfaktor som er større enn 1 i en SES-modell, som vanligvis ikke er tillatt i SES-modellprosedyren. For det andre har du muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA-modellen (0,1,1) med konstant har prediksjonsligningen: Forventningene for en periode fremover fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene vanligvis er en skrånende linje (hvis skråning er lik mu) i stedet for en horisontal linje. ARIMA (0,2,1) eller (0,2,2) uten konstant lineær eksponensiell utjevning: Linjære eksponentielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-soneforskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og seg selv forsinket av to perioder, men det er den første forskjellen i den første forskjellen - dvs. Y-endringen i Y i periode t. Således er den andre forskjellen på Y ved periode t lik (Y t - Y t-1) - (Y t-1 - Y t-2) Y t - 2Y t-1 Y t-2. En annen forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon: det måler kvoteringsberegningsquot eller quotcurvaturequot i funksjonen på et gitt tidspunkt. ARIMA-modellen (0,2,2) uten konstant forutser at den andre forskjellen i serien er lik en lineær funksjon av de to siste prognosefeilene: som kan omarrangeres som: hvor 952 1 og 952 2 er MA (1) og MA (2) koeffisienter. Dette er en generell lineær eksponensiell utjevningsmodell. i hovedsak det samme som Holt8217s modell, og Brown8217s modell er et spesielt tilfelle. Den bruker eksponensielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA (1,1,2) uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modellene. Den ekstrapolerer den lokale trenden i slutten av serien, men flater ut på lengre prognoshorisonter for å introdusere et konservatismedokument, en praksis som har empirisk støtte. Se artikkelen om hvorfor Damped Trend worksquot av Gardner og McKenzie og quotgolden Rulequot-artikkelen av Armstrong et al. for detaljer. Det er generelt tilrådelig å holde fast i modeller der minst en av p og q ikke er større enn 1, dvs. ikke prøv å passe på en modell som ARIMA (2,1,2), da dette sannsynligvis vil føre til overfitting og kvadrat-faktorquot problemer som er omtalt nærmere i notatene om den matematiske strukturen til ARIMA-modellene. Implementering av regneark: ARIMA-modeller som de som er beskrevet ovenfor, er enkle å implementere på et regneark. Forutsigelsesligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene. Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B, og feilene (data minus prognoser) i kolonne C. Forutsigelsesformelen i en typisk celle i kolonne B ville ganske enkelt være et lineært uttrykk som refererer til verdier i forrige rad av kolonner A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket. FORECASTING Forecasting kan bredt betraktes som en metode eller en teknikk for å estimere mange fremtidige aspekter av en forretning eller annen operasjon. Det er mange teknikker som kan brukes til å oppnå målet om prognoser. For eksempel kan et detaljhandelsfirma som har vært i virksomhet i 25 år, prognostisere salgsvolumet i det kommende året basert på erfaringen i løpet av 25-årsperioden, da en prognosemetode baserer fremtidsprognosen på tidligere data. Mens begrepet x0022forecastingx0022 ser ut til å være ganske teknisk, er planlegging for fremtiden et kritisk aspekt ved å administrere enhver organisasjon, virksomhet, ideell eller annen. Faktisk er den langsiktige suksessen til enhver organisasjon nært knyttet til hvor godt ledelsen av organisasjonen er i stand til å forutse sin fremtid og utvikle hensiktsmessige strategier for å håndtere sannsynlige fremtidsscenarier. Intuisjon, god vurdering og en bevissthet om hvor godt økonomien gjør, kan gi lederen til et bedriftsfirma en grov ide (eller x0022feelingx0022) av det som sannsynligvis vil skje i fremtiden. Ikke desto mindre er det ikke lett å omdanne en følelse om fremtiden til et presist og nyttig nummer, for eksempel neste årssalgsvolum eller råvarekostnaden per utgangsenhet. Prognosemetoder kan bidra til å estimere mange slike fremtidige aspekter ved en forretningsdrift. Anta at en prognosekspert har blitt bedt om å gi estimater av salget for et bestemt produkt for de neste fire kvartaler. Man kan enkelt se at en rekke andre beslutninger vil bli påvirket av prognosene eller estimatene av salgsmengder som foreskriveren har gitt. Klart vil produksjonsplaner, råvareinnkjøpsplaner, retningslinjer for varebeholdninger og salgskvoter bli påvirket av slike prognoser. Som et resultat kan dårlige prognoser eller estimater føre til dårlig planlegging og dermed føre til økte kostnader for virksomheten. Hvordan skal man gå om å utarbeide kvartalsvise prognosen for salgsvolumet Man vil sikkert se gjennom de faktiske salgsdataene for det aktuelle produktet i tidligere perioder. Anta at prospektoren har tilgang til faktiske salgsdata for hvert kvartal i løpet av 25 år som firmaet har vært i virksomhet. Ved hjelp av disse historiske dataene kan forecasteren identifisere det generelle salgsnivået. Han eller hun kan også avgjøre om det er et mønster eller en trend, for eksempel en økning eller reduksjon i salget over tid. En videre gjennomgang av dataene kan avsløre noen form for sesongmessig mønster, for eksempel toppsalg som skjer før en ferie. Således ved å se på historiske data over tid, kan forecasteren ofte utvikle en god forståelse av det foregående salgsmønsteret. Å forstå et slikt mønster kan ofte føre til bedre prognoser for fremtidig salg av produktet. I tillegg, hvis forecasteren er i stand til å identifisere faktorene som påvirker salget, kan historiske data om disse faktorene (eller variablene) også brukes til å generere prognoser for fremtidige salgsmengder. Alle prognosemetoder kan deles inn i to brede kategorier: kvalitative og kvantitative. Mange prognoseteknikker bruker tidligere eller historiske data i form av tidsserier. En tidsserie er ganske enkelt et sett med observasjoner målt på suksessive punkter i tid eller over påfølgende tidsperioder. Prognoser gir i hovedsak fremtidige verdier av tidsseriene på en bestemt variabel som salgsvolum. Fordeling av prognosemetoder i kvalitative og kvantitative kategorier er basert på tilgjengeligheten av historiske tidsseriedata. Kvalitative prognostiseringsteknikker bruker generelt dommen av eksperter på det aktuelle feltet for å generere prognoser. En viktig fordel ved disse prosedyrene er at de kan brukes i situasjoner hvor historiske data ikke er enkelt tilgjengelige. Videre, selv når historiske data er tilgjengelige, kan betydelige endringer i miljøforhold som påvirker relevante tidsserier, gjøre bruken av tidligere data irrelevante og tvilsomme i å prognostisere fremtidige verdier av tidsserien. Tenk for eksempel at historiske data om bensin salg er tilgjengelige. Hvis regjeringen da implementerte et bensin ranseringsprogram, endrer måten bensin blir solgt, må man stille spørsmålstegn ved gyldigheten av en bensinsalgsprognose basert på tidligere data. Kvalitative prognosemetoder gir en måte å generere prognoser i slike tilfeller. Tre viktige kvalitative prognosemetoder er: Delphi-teknikken, scenariet skriftlig og emnet tilnærming. DELPHI TECHNOLOGY. I Delphi-teknikken blir det forsøkt å utvikle prognoser gjennom x0022group konsensus. x0022 Vanligvis blir et panel av eksperter bedt om å svare på en rekke spørreskjemaer. Eksperter, fysisk skilt fra og ukjent til hverandre, blir bedt om å svare på et første spørreskjema (et sett med spørsmål). Deretter utarbeides et andre spørreskjema med informasjon og meninger fra hele gruppen. Hver ekspert blir bedt om å revurdere og revidere hans eller hennes første svar på spørsmålene. Denne prosessen fortsetter til en viss konsensus blant eksperter er nådd. Det skal bemerkes at målet med Delphi-teknikken ikke er å produsere et enkelt svar på slutten. I stedet forsøker det å produsere en relativt smal spredning av opinionx2014sområdet hvor meninger fra flertallet av eksperter ligger. SCENARIO SKRIFT. Under denne tilnærmingen starter forecasteren med forskjellige sett av antagelser. For hvert sett av antagelser er et sannsynlig scenario av forretningsresultatet kartlagt. Dermed vil forecasteren kunne generere mange forskjellige fremtidige scenarier (som svarer til de ulike settene av antagelser). Beslutningsmannen eller forretningsmannen presenteres med de ulike scenariene, og må bestemme hvilket scenario som mest sannsynlig vil seire. Emneoppgave. Den subjektive tilnærmingen tillater at enkeltpersoner som deltar i prognosebeslutningen, kommer frem til en prognose basert på deres subjektive følelser og ideer. Denne tilnærmingen er basert på forutsetningen om at et menneskelig sinn kan komme til en beslutning basert på faktorer som ofte er svært vanskelig å kvantifisere. x0022Brainstorming sessionsx0022 brukes ofte som en måte å utvikle nye ideer på eller for å løse komplekse problemer. I løst organiserte økter, føler deltakerne seg fri fra pressetrykket, og enda viktigere kan uttrykke sine synspunkter og ideer uten frykt for kritikk. Mange bedrifter i USA har begynt å bruke den subjektive tilnærmingen i økende grad. Kvantitative prognosemetoder Kvantitative prognosemetoder brukes når historiske data om variabler av interesse er tilgjengeligex2014 disse metodene er basert på en analyse av historiske data angående tidsseriene til den spesifikke variabelen av interesse og muligens andre relaterte tidsserier. Det er to hovedkategorier av kvantitative prognosemetoder. Den første typen bruker den siste trenden for en bestemt variabel for å basere fremtidig prognose for variabelen. Da denne kategorien av prognosemetoder bare bruker tidsserier på tidligere data av variabelen som forventes, blir disse teknikkene kalt tidsserie-metoder. Den andre kategorien av kvantitative prognose teknikker bruker også historiske data. Men når vi forutsier fremtidige verdier av en variabel, undersøker forecaster årsak-og-effekt-relasjonene til variabelen med andre relevante variabler som nivået av forbrukertillid, endringer i forbrukernes eksponeringsinntekter, renten som forbrukere kan finansiere sine utgifter til gjennom låneopptak, og økonomienes tilstand representert av slike variabler som arbeidsledigheten. Således bruker denne kategorien av prognostiseringsteknikker tidligere tidsserier på mange relevante variabler for å produsere prognosen for interessevarianten. Forekomsteknikker som faller under denne kategorien kalles årsaksmetoder, som grunnlag for slik prognose er årsakssammenheng mellom variabelen prognostisert og andre tidsserier valgt for å bidra til å generere prognosene. TIDSREGNSMETODER FOR PROSPEKTERING. Før du diskuterer tidsseriemetoder, er det nyttig å forstå oppføringene av tidsserier generelt. Tidsserier består av fire separate komponenter: trendkomponent, syklisk komponent, sesongkomponent og uregelmessig komponent. Disse fire komponentene ses som å gi spesifikke verdier for tidsseriene når de kombineres. I en tidsserie, blir målinger tatt på suksessive punkter eller over påfølgende perioder. Målingene kan tas hver time, dag, uke, måned eller år, eller ved noe annet vanlig (eller uregelmessig) intervall. Mens de fleste tidsseriedata generelt viser noen tilfeldige svingninger, kan tidsseriene fortsatt vise gradvise skift til relativt høyere eller lavere verdier over en lengre periode. Den gradvise forandringen av tidsseriene henvises ofte til av profesjonelle forutsetninger som trenden i tidsseriene. En trend oppstår på grunn av en eller flere langsiktige faktorer, for eksempel endringer i befolkningsstørrelse, endringer i befolkningens demografiske egenskaper og forandringer i smak og forbrukernes preferanser. For eksempel kan produsenter av biler i USA se at det er store variasjoner i bilsalg fra en måned til den neste. Men ved å gjennomgå automatisk salg i løpet av de siste 15 til 20 årene, kan bilprodusentene oppdage en gradvis økning i årlig salgsvolum. I dette tilfellet øker trenden for automatisk salg over tid. I et annet eksempel kan trenden reduseres over tid. Profesjonelle prognosere beskriver ofte en økende trend med en stigende skrå linje og en nedadgående trend med en nedadgående skrå linje. Ved å bruke en rett linje for å representere en trend, er det bare en forenkling i mange situasjoner, kan ikke-lineære trender mer nøyaktig representere den virkelige trenden i tidsseriene. Selv om en tidsserie ofte kan vise en trend over en lang periode, kan det også vise alternerende sekvenser av punkter som ligger over og under trendlinjen. En hvilken som helst tilbakevendende sekvens av punkter over og under trenderlinjen som varer mer enn et år regnes for å utgjøre den sykliske komponenten av tidsserien x2014.det er at disse observasjonene i tidsseriene avviker fra trenden på grunn av konjunktursvingninger (fluktuasjoner som gjentas med intervaller på mer enn ett år). Tidsserien til aggregatutgangen i økonomien (kalt det reelle bruttonasjonalproduktet) gir et godt eksempel på en tidsserie som viser syklisk oppførsel. Mens trendlinjen for bruttonasjonalproduktet (BNP) er stigende, viser produksjonsveksten en konjunktiv oppførsel rundt trendlinjen. Denne konjunkturoppførelsen av BNP har blitt kalt konjunkturer av økonomer. Den sesongbaserte komponenten ligner den konjunkturelle komponenten ved at de begge refererer til noen regelmessige svingninger i en tidsserie. Det er imidlertid en viktig forskjell. Mens sykliske komponenter i en tidsserie identifiseres ved å analysere flerårige bevegelser i historiske data, oppdager sesongbestandige komponenter det vanlige variasjonsmønsteret i tidsseriene innen ettårig perioder. Mange økonomiske variabler viser sesongmessige mønstre. Eksempelvis produsenter av svømmebassenger opplever lavt salg i høst - og vinterhalvåret, men de oppdager toppsalg av svømmebassenger i løpet av vår - og sommermånedene. Produsenter av snøfjerningsutstyr, derimot, opplever det motsatte årlige salgsmønsteret. Komponenten i tidsseriene som fanger variabiliteten i dataene på grunn av sesongvariasjoner kalles sesongkomponenten. Den uregelmessige komponenten av tidsserien representerer resterende igjen i en observasjon av tidsseriene når virkningene på grunn av trend, syklisk og sesongkomponenter er ekstrahert. Trend, konjunktur og sesongkomponenter regnes for å ta hensyn til systematiske variasjoner i tidsseriene. x0027h e uregelmessig komponent står dermed for tilfeldig variabilitet i tidsseriene. De tilfeldige variasjonene i tidsseriene er igjen forårsaket av kortsiktige, uventede og ikke-gjenværende faktorer som påvirker tidsseriene. Den uregelmessige komponenten av tidsserien, av naturen, kan ikke forutsies på forhånd. TIDS SERIES FORECASTING BRUKE SMOOTHING METHODS. Utjevningsmetoder er hensiktsmessige når en tidsserie ikke viser noen signifikante effekter av trend-, sykliske eller sesongbestandige komponenter (ofte kalt en stabil tidsserie). I et slikt tilfelle er målet å jevne ut den uregelmessige delen av tidsserien ved å bruke en gjennomsnittsprosess. Når tidsserien er utjevnet, brukes den til å generere prognoser. Den bevegelige gjennomsnittsmetoden er trolig den mest brukte utjevningsteknikken. For å glatte tidsseriene, bruker denne metoden gjennomsnittet av et antall tilgrensende datapunkter eller perioder. Denne gjennomsnittsprosessen bruker overlappende observasjoner for å generere gjennomsnitt. Anta at en forecaster ønsker å generere tre-års glidende gjennomsnitt. Forecaster ville ta de tre første observasjonene av tidsseriene og beregne gjennomsnittet. Deretter vil forecasteren slippe den første observasjonen og beregne gjennomsnittet av de neste tre observasjonene. Denne prosessen vil fortsette til tre-års gjennomsnitt beregnes ut fra dataene som er tilgjengelige fra hele tidsserien. Uttrykket x0022movingx0022 refererer til måten gjennomsnittene beregnes for2014forforskeren beveger seg opp eller ned i tidsserien for å velge observasjoner for å beregne et gjennomsnitt av et fast antall observasjoner. I tre-periode-eksemplet vil gjennomsnittlig gjennomsnittlig gjennomsnittlig de siste tre observasjonene av data i tidsseriene være som prognosen for neste periode. Denne prognosenverdien for neste periode, sammenholdt med de to siste observasjonene i den historiske tidsserien, ville gi et gjennomsnitt som kan brukes som prognose for den andre perioden i fremtiden. Beregningen av et tre-års glidende gjennomsnitt kan illustreres som følger. Anta at en forecaster ønsker å prognose salgsvolumet for amerikanskgjorte biler i USA for det neste året. Salg av amerikanskgjorte biler i USA i løpet av de foregående tre årene var: 1,3 millioner, 900,000 og 1,1 millioner (den siste observasjonen rapporteres først). Tre-års glidende gjennomsnitt i dette tilfellet er 1,1 millioner biler (det vil si: (1,3 0,90 1,1) 3 1,1). Basert på tre-års glidende gjennomsnitt, kan prognosen forutse at 1,1 millioner amerikanskgjorte biler mest sannsynlig blir solgt i USA neste år. Ved beregning av bevegelige gjennomsnitt for å generere prognoser, kan forecasteren eksperimentere med forskjellig lengde glidende gjennomsnitt. Forecaster vil velge lengden som gir høyest nøyaktighet for prognosene som genereres. x0022 Det er viktig at prognosene ikke genereres for langt fra de faktiske fremtidige resultatene. For å undersøke nøyaktigheten av prognosene som er generert, utarbeider prognosemenn generelt et mål for prognosefeilen (det vil si forskjellen mellom den prognostiserte verdien for en periode og den tilknyttede virkelige verdien av variabelen av interesse). Anta at salgsvolumet for amerikanskgjorte biler i USA er beregnet til å være 1,1 millioner biler i et gitt år, men bare jeg millioner biler selges faktisk det året. Prognosen feilen i dette tilfellet er lik 100.000 biler. Med andre ord overvurderte forecasteren salgsvolumet for året med 100.000. Selvfølgelig vil prognosefeil noen ganger være positiv og andre ganger være negativ. Således tar et enkelt gjennomsnitt av prognosefeil over tid ikke fange den virkelige størrelsen av prognosefeil. Store positive feil kan ganske enkelt avbryte store negative feil, noe som gir et misvisende inntrykk av nøyaktigheten av prognosene som genereres. Som et resultat bruker prognosemennene vanligvis feilen i gjennomsnittlige kvadrater for å måle prognosen feil. Den gjennomsnittlige kvadratfeilen, eller MSE, er gjennomsnittet av summen av kvadrert prognosefeil. Dette tiltaket, ved å ta firkantene av prognosefeil, eliminerer sjansen for at negative og positive feil avbrytes. Ved å velge lengden på de bevegelige gjennomsnittene, kan en forecaster bruke MSE-målet til å bestemme antall verdier som skal inkluderes i beregning av de bevegelige gjennomsnitt. Forecasteren eksperimenterer med forskjellige lengder for å generere bevegelige gjennomsnitt og beregner deretter prognosefeil (og tilhørende middelkvadratfeil) for hver lengde som brukes til å beregne glidende gjennomsnitt. Deretter kan forecasteren velge lengden som minimerer den gjennomsnittlige kvadratfeilen av prognosene som genereres. Veidede glidende gjennomsnitt er en variant av bevegelige gjennomsnitt. I den bevegelige gjennomsnittsmetoden får hver observasjon av data samme vekt. I den vektede glidende gjennomsnittsmetoden blir forskjellige vekter tilordnet observasjonene på data som brukes til å beregne de bevegelige gjennomsnittene. Anta igjen at en forecaster ønsker å generere tre-års glidende gjennomsnitt. Under den veide gjennomsnittlige metoden vil de tre datapunktene motta forskjellige vekter før gjennomsnittet beregnes. Generelt mottar den siste observasjonen maksimalvekten, med vekten tilordnet redusert for eldre dataverdier. Beregningen av et treårsvektet glidende gjennomsnitt kan illustreres som følger. Anta at en forspiller igjen vil forutse salgsvolumet for amerikanskgjorte biler i USA for det neste året. Salg av amerikanskgjorte biler til USA i løpet av de foregående tre årene var: 1,3 millioner, 900,000 og 1,1 millioner (den siste observasjonen rapporteres først). Et estimat av det vektede tre-års glidende gjennomsnittet i dette eksemplet kan være lik 1,133 millioner biler (det vil si 1 (36) x (1,3) (26) x (0,90) (16) x (1,1) 3 1,133). Basert på de tre-årige vektede glidende gjennomsnittene, kan prognosen forutsi at 1.133 millioner amerikanskgjorte biler mest sannsynlig blir solgt i USA i det neste året. Nøyaktigheten av vektede gjennomsnittlige prognoser er bestemt på samme måte som for enkle glidende gjennomsnitt. Eksponensiell utjevning er noe vanskeligere matematisk. I hovedsak bruker eksponensiell utjevning imidlertid også vektet gjennomsnittskonsept2014 i form av det veide gjennomsnittet av alle tidligere observasjoner, som det finnes i de relevante tidsseriene for å generere prognoser for neste periode. Uttrykket x0022exponential smoothingx0022 kommer fra det faktum at denne metoden benytter en vektingsplan for de historiske verdiene av data som er eksponentiell i naturen. I vanlige termer tilordnes en eksponentiell vektingsplan maksimalvekten til den siste observasjonen, og vektene synker systematisk, ettersom eldre og eldre observasjoner er inkludert. Nøyaktigheten til prognosene ved bruk av eksponensiell utjevning bestemmes på en måte som ligner den for den bevegelige gjennomsnittsmetoden. TIDS SERIES FORECASTING BRUKE TREND PROJECTION. Denne metoden bruker den underliggende langsiktige trenden i en tidsserie med data for å prognostisere fremtidige verdier. Anta at en forecaster har data om salg av amerikanskgjorte biler i USA de siste 25 årene. Tidsseriedataene på amerikansk bilsalg kan plottes og undersøkes visuelt. Sannsynligvis vil den automatiske salgstidsserien vise en gradvis vekst i salget, til tross for x0022upx0022 og x0022downx0022 bevegelsene fra år til år. Trenden kan være lineær (tilnærmet med en rett linje) eller ikke-lineær (tilnærmet av en kurve eller en ikke-lineær linje). Ofte antar prognoserne en lineær trend, selvfølgelig, hvis en lineær trend antas når faktisk en ikke-lineær trend er tilstede, kan denne feilrepresentasjonen føre til grovt unøyaktige prognoser. Anta at tidsseriene på amerikansk-laget auto-salg er faktisk lineære og dermed kan det representeres av en rett linje. Matematiske teknikker brukes til å finne den rette linjen som mest nøyaktig representerer tidsseriene på automatisk salg. Denne linjen relaterer salg til ulike poeng over tid. Hvis vi antar videre at den siste trenden vil fortsette i fremtiden, kan fremtidige verdier av tidsseriene (prognoser) utledes fra den rette linjen basert på tidligere data. Man bør huske at prognosene basert på denne metoden også skal vurderes på grunnlag av et mål på prognosefeil. Man kan fortsette å anta at forecaster bruker den gjennomsnittlige kvadratfeil som diskuteres tidligere. TIDS SERIES FORECASTING BRUKE TREND OG SEASONAL COMPONENTS. Denne metoden er en variant av trendprojeksjonsmetoden, og benytter seg av sesongkomponenten i en tidsserie i tillegg til trendkomponenten. Denne metoden fjerner sesongvirkningen eller sesongkomponenten fra tidsseriene. Dette trinnet blir ofte referert til som de-sesongbaserte tidsseriene. Når en tidsserie har blitt de-sesongbasert, vil den bare ha en trendkomponent. Trendprojeksjonsmetoden kan da brukes til å identifisere en rettlinjestrøm som representerer tidsseriedataene godt. Deretter genereres prognoser for fremtidige perioder med denne trendlinjen. Det endelige trinnet under denne metoden er å innlemme sesongkomponenten i tidsseriene (bruk det såkalte sesongindeksen) for å justere prognosene basert på trenden alene. På denne måten består prognosene som består av både trend og sesongkomponenter. Man vil normalt forvente at disse prognosene skal være mer nøyaktige enn de som er basert på trendprojeksjonen. FORSIKTIGHETSMETODE. Som nevnt tidligere bruker årsaksmetoder årsak-og-effekt-forholdet mellom variabelen hvis fremtidige verdier er prognostisert og andre relaterte variabler eller faktorer. Den allment kjente årsaksmetoden kalles regresjonsanalyse, en statistisk teknikk som brukes til å utvikle en matematisk modell som viser hvordan et sett med variabler er relatert. Dette matematiske forholdet kan brukes til å generere prognoser. I terminologien som brukes i regresjonsanalysekontekst, kalles variabelen som prognostiseres, avhengig eller responsvariabel. Variabelen eller variablene som bidrar til å prognostisere verdiene av den avhengige variabelen, kalles de uavhengige eller prediktorvariablene. Regresjonsanalyse som benytter en avhengig variabel og en uavhengig variabel og tilnærmer forholdet mellom disse to variablene med en rett linje kalles en enkel lineær regresjon. Regresjonsanalyse som bruker to eller flere uavhengige variabler til å prognose verdier av den avhengige variabelen kalles en multiple regresjonsanalyse. Nedenfor presenteres prognoseteknikken som benytter regresjonsanalyse for den enkle lineære regresjonssaken. Anta at en forecaster har data om salg av amerikanskgjorte biler i USA de siste 25 årene. Forecaster har også identifisert at salg av biler er relatert til individualsx0027 real disponibel inntekt (grovt sett er inntekt etter skatt betalt, justert for inflasjonsraten). Forecaster har også tilgjengelig tidsserien (for de siste 25 årene) på den reelle disponible inntekten. Tidsseriedataene for amerikanske bilsalg kan tegnes mot tidsseriedataene på real disponibel inntekt, slik at den kan undersøkes visuelt. Mest sannsynlig vil den automatiske salgstidsserien vise en gradvis vekst i salgsvolumet ettersom reall disponibel inntekt øker til tross for sporadisk mangel på consistencyx2014. Det kan til tider være mulig at bilsalg faller selv når real disponibel inntekt stiger. Forholdet mellom de to variablene (automatisk salg som avhengig variabel og real disponibel inntekt som uavhengig variabel) kan være lineær (tilnærmet med en rett linje) eller ikke-lineær (tilnærmet av en kurve eller en ikke-lineær linje). Anta at forholdet mellom tidsseriene på salg av amerikanskgjorte biler og konsumets reelle disponible inntekt faktisk er lineær og dermed kan representeres av en rett linje. En ganske streng matematisk teknikk brukes til å finne den rette linjen som mest nøyaktig representerer forholdet mellom tidsseriene på auto salg og disponibel inntekt. Intuisjonen bak den matematiske teknikken som brukes ved å ankomme til riktig rettlinje, er som følger. Tenk deg at forholdet mellom de to tidsseriene har blitt plottet på papir. Plottet vil bestå av en scatter (eller sky) av poeng. Hvert punkt i plottet representerer et par observasjoner om automatisk salg og disponibel inntekt (det vil si automatisk salg som svarer til gitt nivå av real disponibel inntekt i et hvilket som helst år). Spredningen av poeng (i likhet med tidsseriemetoden beskrevet ovenfor) kan ha en oppadgående eller en nedadgående drift. Det vil si at forholdet mellom auto salg og real disponibel inntekt kan tilnærmet ved en oppover eller nedover skrånende rett linje. I all sannsynlighet vil regresjonsanalysen i det nåværende eksemplet gi en oppadgående skråning av straight linex2014as disponibel inntektsøkning, slik at volumet av bilsalg. Å komme til den mest nøyaktige rette linjen er nøkkelen. Formentlig kan man tegne mange rette linjer gjennom spredningen av poeng i plottet. Ikke alle av dem, men vil likevel representere forholdet som kommer til å bli nærmere de fleste poeng, og andre vil være langt unna de fleste punkter i spredningen. Regresjonsanalyse bruker deretter en matematisk teknikk. Ulike rette linjer trekkes gjennom dataene. Avvik av de faktiske verdiene til datapunktene i plottet fra de tilsvarende verdiene som er angitt av den rette linjen valgt i noen tilfelle, blir undersøkt. Summen av kvadratene til disse avvikene fanger essensen av hvor nær en rett linje er til datapunktene. Linjen med den minste summen av kvadratiske avvik (kalt regimeringslinjen x0022least squaresx0022) betraktes som linjen med den beste passformen. Etter å ha identifisert regresjonslinjen, og antar at forholdet basert på tidligere data vil fortsette, kan fremtidige verdier av den avhengige variabelen (prognoser) utledes fra den rette linjen basert på tidligere data. Hvis forecasteren har en ide om hva den reelle disponible inntekt kan være i det kommende året, kan en prognose for fremtidig bilsalg bli generert. Man bør huske at prognoser basert på denne metoden også skal vurderes på grunnlag av et mål på prognosefeil. Man kan fortsette å anta at forecaster bruker den gjennomsnittlige kvadratfeil som diskuteres tidligere. I tillegg til å bruke prognosefeil, bruker regresjonsanalyse ytterligere måter å analysere effektiviteten av den estimerte regresjonslinjen i prognoser. Anderson, David R. Dennis J. Sweeney, og Thomas A. Williams. En introduksjon til ledelsesvitenskap: Kvantitative tilnærminger til beslutningstaking. 8. utg. MinneapolisSt. Paul: West Publishing, 1997. x2014x2014. Statistikk for næringsliv og økonomi. 7. utg. Cincinnati: SouthWestern College Publishing, 1999. FORSØKING Seasonal Factor - prosentandelen av gjennomsnittlig kvartalsbehov som oppstår i hvert kvartal. Årlig prognose for år 4 er beregnet til å være 400 enheter. Gjennomsnittlig prognose per kvartal er 4004 100 enheter. Kvartalsvisvarsel avg. prognose sesongfaktor. Kausale prognosemetoder Kausale prognosemetoder er basert på et kjent eller oppfattet forhold mellom den faktor som skal prognoses og andre eksterne eller interne faktorer. 1. regresjon: Matematisk ligning relaterer en avhengig variabel til en eller flere uavhengige variabler som antas å påvirke den avhengige variabelen 2. Økonometriske modeller: System av gjensidige regresjonsligninger som beskriver noen sektor av økonomisk aktivitet 3. Inndata-utgangsmodeller: beskriver strømmen fra en sektor av økonomien til en annen, og forutsetter derfor inngangene som kreves for å produsere utganger i en annen sektor 4. simuleringsmodeller MÅLING FORECAST FEIL Det er to aspekter ved prognosefeil å være opptatt av - Bias og nøyaktighet Bias - En prognose er partisk hvis den går mer i en retning enn i den andre - Metoden har en tendens til å være under-prognoser eller over-prognoser. Nøyaktighet - Forecast nøyaktighet refererer til avstanden til prognosene fra den faktiske etterspørselen ignorerer retningen av den feilen. Eksempel: I seks perioder har prognosen og den faktiske etterspørselen blitt sporet. Følgende tabell gir den faktiske etterspørselen D t og prognosefterspørselen F t i seks perioder: Kumulativ sum av prognosefeil (CFE) -20 gjennomsnittlig absolutt avvik (MAD) 170 6 28,33 gjennomsnittlig kvadrat feil (MSE) 5150 6 858.33 standardavvik for prognosefeil 5150 6 29.30 gjennomsnittlig absolutt prosentfeil (MAPE) 83,4 6 13,9 Hvilken informasjon gir hver prognose en tendens til å overskride etterspørsels gjennomsnittlig feil per prognose var 28,33 enheter eller 13,9 av Den faktiske etterspørselsprøvefordelingen av prognosefeil har standardavvik på 29,3 enheter. KRITERIER FOR VELGING AV EN FORSIKLINGSMETODE Mål: 1. Maksimere nøyaktighet og 2. Minimer Bias Potensielle Regler for å velge en prognosemetode for tidsserier. Velg metoden som gir den minste bias, målt ved kumulativ prognosefeil (CFE) eller gir den minste gjennomsnittlige absoluttavviket (MAD) eller gir det minste sporingssignalet eller støtter ledelsens tro på det underliggende mønsteret av etterspørsel eller andre. Det synes åpenbart at noe måling av både nøyaktighet og forspenning skal brukes sammen. Hvordan Hva med antall perioder som skal samples hvis etterspørselen er iboende stabil, foreslås lave verdier av og og høyere verdier av N hvis etterspørselen er ustabil, høye verdier av og og lavere verdier av N er foreslått FOCUS FORECASTING quotfocus forecastingquot refererer til en tilnærming til prognoser som utvikler prognoser ved hjelp av ulike teknikker, plukker deretter prognosen som ble produsert av kvotekvoten til disse teknikkene, hvor kvotekvot bestemmes av noe mål på prognosefeil. FOKUSFORSIKRING: EKSEMPEL For første halvår har etterspørselen etter en varehandel vært 15, 14, 15, 17, 19 og 18 enheter. En forhandler bruker et fokusprognosesystem basert på to prognoseteknikker: et to-års glidende gjennomsnitt og en trendjustert eksponensiell utjevningsmodell med 0,1 og 0,1. Med den eksponentielle modellen var prognosen for januar 15 og trenden gjennomsnittlig ved utgangen av desember var 1. Forhandleren bruker gjennomsnittlig absolutt avvik (MAD) de siste tre månedene som kriterium for å velge hvilken modell som vil bli brukt til å prognose for neste måned. en. Hva blir prognosen for juli og hvilken modell vil bli brukt b. Vil du svare på del a. være annerledes hvis etterspørselen etter mai hadde vært 14 i stedet for 19

No comments:

Post a Comment