Sunday, October 16, 2016

Bewegende gemiddelde model variansie

DAX sluit 'n paar statistiese samevoeging funksies, soos gemiddelde, variansie en standaardafwyking. Ander tipiese statistiese berekeninge vereis dat jy meer DAX uitdrukkings skryf. Excel, uit hierdie oogpunt, het 'n veel ryker taal. Die statistiek Patrone is 'n versameling van algemene statistiese berekeninge: mediaan, modus, bewegende gemiddelde, persentiel, en kwartiel. Ons wil graag dankie sê Colin Banfield, Gerard Brueckl, en Javier Guilln, wie se blogs geïnspireer sommige van die volgende patrone. Basiese Patroon Voorbeeld Die formules in hierdie patroon is die oplossings vir spesifieke statistiese berekeninge. Gemiddeld Jy kan standaard DAX funksies gebruik om die gemiddelde (rekenkundige gemiddelde) van 'n stel waardes te bereken. GEMIDDELDE. gee die gemiddeld van al die getalle in 'n numeriese kolom. AVERAGEA. gee die gemiddeld van al die nommers in 'n kolom, die hantering van beide teks en nie-numeriese waardes (nie-numeriese en leë teks waardes tel as 0). AVERAGEX. bereken die gemiddelde op 'n uitdrukking geëvalueer oor 'n tafel. Bewegende gemiddelde Die bewegende gemiddelde is 'n berekening om datapunte te analiseer deur die skep van 'n reeks van gemiddeldes van verskillende onderafdelings van die volle datastel. Jy kan baie DAX tegnieke te gebruik om hierdie berekening te implementeer. Die eenvoudigste tegniek gebruik AVERAGEX, iterating 'n tafel van die gewenste korrelig en berekening vir elke iterasie die uitdrukking dat die enkele datapunt om te gebruik in die gemiddelde genereer. Byvoorbeeld, die volgende formule bereken die bewegende gemiddelde van die afgelope 7 dae, in die veronderstelling dat jy 'n tafel Datum in jou data model. Die gebruik van AVERAGEX, jy outomaties die maatstaf te bereken by elke korrelig vlak. By die gebruik van 'n maatstaf wat gebruik kan word saamgevoeg (soos som), en dan die ander approachbased op CALCULATEmay vinniger wees. Jy kan hierdie alternatiewe benadering in die volledige patroon van bewegende gemiddelde vind. Variansie Jy kan standaard DAX funksies gebruik om die variansie van 'n stel waardes te bereken. VAR. S. terug die variansie van waardes in 'n kolom verteenwoordig 'n monster bevolking. VAR. P. terug die variansie van waardes in 'n kolom wat die hele bevolking. VARX. S. terug die variansie van 'n uitdrukking geëvalueer oor 'n tafel wat 'n monster bevolking. VARX. P. terug die variansie van 'n uitdrukking geëvalueer oor 'n tafel wat die hele bevolking. Standaardafwyking Jy kan standaard DAX funksies gebruik om die standaard afwyking van 'n stel waardes te bereken. STDEV. S. gee die standaardafwyking van waardes in 'n kolom verteenwoordig 'n monster bevolking. STDEV. P. gee die standaardafwyking van waardes in 'n kolom wat die hele bevolking. STDEV. S. gee die standaard afwyking van 'n uitdrukking geëvalueer oor 'n tafel wat 'n monster bevolking. STDEV. P. gee die standaard afwyking van 'n uitdrukking geëvalueer oor 'n tafel wat die hele bevolking. Mediaan Die mediaan is die numeriese waarde skei die hoër helfte van 'n bevolking van die onderste helfte. As daar 'n onewe aantal rye, die mediaan is die middelste waarde (sorteer die rye van die laagste waarde van die hoogste waarde). As daar 'n ewe aantal rye, dit is die gemiddeld van die twee middelste waardes. Die formule ignoreer leeg waardes, wat nie beskou as deel van die bevolking. Die resultaat is identies aan die mediaan funksie in Excel. Figuur 1 toon 'n vergelyking tussen die resultate teruggestuur deur Excel en die ooreenstemmende DAX formule vir die mediaan berekening. Figuur 1 Voorbeeld van mediaan berekening in Excel en DAX. Modus Die modus is die waarde wat die meeste voorkom in 'n stel data. Die formule ignoreer leeg waardes, wat nie beskou as deel van die bevolking. Die resultaat is identies aan die modus en MODE. SNGL funksies in Excel, wat net die minimum waarde wanneer daar is verskeie vorme in die stel waardes beskou terugkeer. Die Excel-funksie MODE. MULT sal al die modes terugkeer, maar jy kan dit nie implementeer as 'n maatstaf in DAX. Figuur 2 vergelyk die resultaat teruggekeer deur Excel met die ooreenstemmende DAX formule vir die modus berekening. Figuur 2 Voorbeeld van af berekening in Excel en DAX. Persentiel Die persentiel is die waarde hieronder wat 'n gegewe persentasie van waardes in 'n groep val. Die formule ignoreer leeg waardes, wat nie beskou as deel van die bevolking. Die berekening in DAX vereis 'n paar stappe, in die volledige Patroon artikel, wat wys hoe om dieselfde resultate van die Excel funksies PERCENTILE, PERCENTILE. INC, en PERCENTILE. EXC verkry beskryf. Kwartiel Die kwartiele is drie punte wat 'n stel waardes verdeel in vier gelyke groepe, elke groep wat bestaan ​​uit 'n kwart van die data. Jy kan die kwartiele met behulp van die Percentile patroon bereken, na aanleiding van hierdie ooreenkomste: Eerste kwartiel onderste kwartiel 25 ste persentiel tweede kwartiel mediaan 50 ste persentiel derde kwartiel boonste kwartiel 75 ste persentiel Volledige Patroon n Paar statistiese berekeninge het 'n langer beskrywing van die volledige patroon, omdat jy dalk verskillende implementering het na gelang van data modelle en ander vereistes. Bewegende gemiddelde Gewoonlik jy die bewegende gemiddelde evalueer deur die verwysing na die dag korrelig vlak. Die algemene sjabloon van die volgende formule het hierdie merkers: ltnumberofdaysgt is die aantal dae vir die bewegende gemiddelde. ltdatecolumngt is die datum kolom van die datum tafel as jy een het, of die datum kolom van die tabel met waardes indien daar geen afsonderlike datum tafel. ltmeasuregt is die maatstaf om te bereken as die bewegende gemiddelde. Die eenvoudigste patroon gebruik die AVERAGEX funksie in DAX, wat outomaties oorweeg slegs die dae waarvoor daar nie 'n waarde. As 'n alternatief, kan jy die volgende sjabloon in datamodelle gebruik sonder 'n datum tafel en met 'n mate dat kan saamgevoeg word (soos som) oor die hele tydperk beskou. Die vorige formule van mening 'n dag met geen ooreenstemmende data as 'n maatstaf wat 0 waarde het. Dit kan net gebeur wanneer jy 'n aparte datum tafel, wat dae waarvoor daar geen ooreenstemmende transaksies kan bevat. Jy kan die deler vir die gemiddelde gebruik van slegs die aantal dae op te los waarvoor daar transaksies met behulp van die volgende patroon, waar: ltfacttablegt is die tafel wat verband hou met die datum tafel en met waardes bereken deur die maatstaf. Jy kan gebruik maak van die DATESBETWEEN of DATESINPERIOD funksies in plaas van FILTER, maar dit werk net in 'n gereelde datum tafel, terwyl jy die bogenoemde ook beskryf om nie-gereelde datum tafels en modelle wat nie 'n datum tafel patroon kan toepas. Byvoorbeeld, kyk na die verskillende resultate wat deur die volgende twee mate. In Figuur 3, kan jy sien dat daar geen verkope op 11 September 2005 is egter hierdie datum ingesluit in die tabel Datum dus is daar 7 dae (vanaf September 11-17 September) dat slegs 6 dae met data het. Figuur 3 Voorbeeld van 'n bewegende gemiddelde berekening oorweeg en ignoreer datums met geen verkope. Die maatreël Moving Gemiddelde 7 Dae het 'n laer getal tussen 11 September en 17 September, want dit is van mening 11 September as 'n dag saam met 0 verkope. As jy wil dae ignoreer sonder verkope, gebruik dan die maatstaf Moving Gemiddelde 7 dae Geen Zero. Dit kan die regte benadering wees wanneer jy 'n volledige datum tafel, maar jy wil dae met geen transaksies ignoreer. Die gebruik van die bewegende gemiddelde 7 Dae formule, die resultaat is korrek, want AVERAGEX mening outomaties enigste nie-leeg waardes. Hou in gedagte dat jy die prestasie van 'n bewegende gemiddelde kan verbeter deur volgehoue ​​waarde in 'n berekende kolom van 'n tafel met die gewenste korrelig, soos datum, of 'n datum en produk. Maar die dinamiese berekening benadering met 'n mate bied die vermoë om 'n parameter gebruik vir die aantal dae van die bewegende gemiddelde (bv vervang ltnumberofdaysgt met 'n mate die implementering van die Parameters Table patroon). Mediaan Die mediaan ooreenstem met die 50 ste persentiel, wat jy kan bereken met behulp van die Percentile patroon. Maar die Mediaan patroon kan jy optimaliseer en vereenvoudig die mediaan berekening met behulp van 'n enkele maatstaf, in plaas van die verskeie maatreëls wat deur die Percentile patroon. Jy kan hierdie benadering gebruik wanneer jy die mediaan te bereken vir waardes in ltvaluecolumngt, soos hieronder getoon: Om prestasie te verbeter, wil jy dalk die waarde van 'n maatstaf volhard in 'n berekende kolom, as jy wil hê dat die mediaan vir die resultate van verkry 'n maatstaf in die data model. Maar, voordat dit te doen optimalisering, jy moet die MedianX berekening gebaseer op die volgende sjabloon te implementeer, met behulp van hierdie merkers: ltgranularitytablegt is die tafel wat die korrelig van die berekening definieer. Byvoorbeeld, kan dit die tafel Datum wees as jy wil hê dat die mediaan van 'n mate bereken teen die dag te bereken, of dit kan waardes (8216DateYearMonth) as jy wil hê dat die mediaan van 'n mate bereken teen die maand vlak te bereken. ltmeasuregt is die maatstaf om te bereken vir elke ry van ltgranularitytablegt vir die mediaan berekening. ltmeasuretablegt is die tafel wat data gebruik word deur ltmeasuregt. Byvoorbeeld, as die ltgranularitytablegt is 'n dimensie soos 8216Date8217, dan is die ltmeasuretablegt sal wees 8216Internet Sales8217 met die Internet verkope Bedrag kolom opgesom deur die Internet Totaal Verkope meet. Byvoorbeeld, kan jy die mediaan van Internet Totaal Verkope skryf vir al die kliënte in Avontuur Werke soos volg: Wenk Die volgende patroon: word gebruik om rye van ltgranularitytablegt dat geen ooreenstemmende data in die huidige seleksie het verwyder. Dit is 'n vinniger manier as die gebruik van die volgende uitdrukking: Maar kan jy die hele CALCULATETABLE uitdrukking te vervang met net ltgranularitytablegt as jy wil leeg waardes van die ltmeasuregt beskou as 0. Die prestasie van die MedianX formule hang af van die aantal rye in die tafel herhaal en op die kompleksiteit van die maatstaf. As prestasie is sleg, kan jy die ltmeasuregt gevolg volhard in 'n berekende kolom van die lttablegt, maar dit sal die vermoë van die toepassing van filters om die mediaan berekening by navraag tyd verwyder. Persentiel Excel het twee verskillende implementering van persentiel berekening met drie funksies: PERCENTILE, PERCENTILE. INC, en PERCENTILE. EXC. Hulle het almal die standaard van die K-ste persentiel van waardes, waar K is in die reeks 0 tot 1. Die verskil is dat PERCENTILE en PERCENTILE. INC oorweeg K as 'n inklusiewe reeks, terwyl PERCENTILE. EXC van mening dat die K-reeks 0-1 as eksklusiewe . Al hierdie funksies en hul DAX implementering ontvang 'n persentiel waarde as parameter, wat ons noem K. ltKgt persentiel waarde is in die reeks 0 tot 1. Die twee DAX implementering van persentiel vereis dat 'n paar maatreëls wat soortgelyk is, maar verskillende genoeg om te vereis twee ander stel formules. Die gedefinieer in elke patroon maatreëls is: KPerc. Die persentiel waarde dit ooreenstem met ltKgt. PercPos. Die posisie van die persentiel in die gesorteerde stel waardes. ValueLow. Die waarde onder die persentiel posisie. ValueHigh. Die waarde bo die persentiel posisie. Persentiel. Die finale berekening van die persentiel. Jy moet die ValueLow en ValueHigh maatreëls in geval die PercPos bevat 'n desimale deel, want dan moet jy interpoleer tussen ValueLow en ValueHigh ten einde die korrekte persentiel waarde terugkeer. Figuur 4 toon 'n voorbeeld van die berekeninge gemaak met Excel en DAX formules, met behulp van beide algoritmes van persentiel (inklusiewe en eksklusiewe). Figuur 4 Percentile berekeninge met behulp van Excel formules en die ekwivalent DAX berekening. In die volgende afdelings, die Percentile formules uit te voer die berekening van waardes gestoor word in 'n tabel kolom, DataValue, terwyl die PercentileX formules uit te voer die berekening van waardes teruggekeer met 'n mate bereken op 'n gegewe korrelig. Persentiel Inklusiewe Die persentiel Inklusiewe implementering is die volgende. Persentiel Exclusive Die persentiel Exclusive implementering is die volgende. PercentileX Inklusiewe Die PercentileX Inklusiewe implementering is gebaseer op die volgende sjabloon, met behulp van hierdie merkers: ltgranularitytablegt is die tafel wat die korrelig van die berekening definieer. Byvoorbeeld, kan dit die tafel Datum wees as jy wil hê dat die persentiel van 'n maatstaf te bereken op die dag vlak, of dit kan waardes (8216DateYearMonth) as jy wil hê dat die persentiel van 'n maatstaf te bereken op die maand vlak. ltmeasuregt is die maatstaf om te bereken vir elke ry van ltgranularitytablegt vir persentiel berekening. ltmeasuretablegt is die tafel wat data gebruik word deur ltmeasuregt. Byvoorbeeld, as die ltgranularitytablegt is 'n dimensie soos 8216Date, 8217 dan die ltmeasuretablegt sal wees 8216Sales8217 met die bedrag kolom opgesom deur die totale bedrag meet. Byvoorbeeld, kan jy die PercentileXInc van totale bedrag van verkope te skryf vir al die datums in die tabel Datum soos volg: PercentileX Exclusive Die PercentileX Exclusive implementering is gebaseer op die volgende sjabloon, met behulp van dieselfde merkers gebruik word in PercentileX Inklusiewe: Byvoorbeeld, jy kan die PercentileXExc van totale bedrag van verkope te skryf vir al die datums in die tabel Datum soos volg: Populariteit Hou my op die hoogte oor die komende patrone (nuusbrief). Ontmerk om die lêer vrylik te laai. Gepubliseer op 17 Maart 2014 deur Ander patrone wat jy kan hou Parameter Table Die Parameter Table patroon is handig wanneer jy wil 'n Snijder voeg by 'n PivotTable en maak dit die gevolg van 'n paar berekening verander, spuit parameters in DAX uitdrukkings. Om dit te gebruik, moet jy 'n tabel wat hellip Begroting Patrone het definieer Die begroting patrone is tegnieke wat jy gebruik om die begroting inligting met ander data te vergelyk. Hulle is 'n uitbreiding van die hantering van verskillende korrelrighede en, as sodanig, gebruik toekenning algoritmes om die begroting op korrelrighede waarvoor dit hellip Dax Patrone is vervaardig deur SQLBI vertoon. Kopiereg kopie Loader. Alle regte voorbehou. Microsoft Excel Reg en alle ander handelsmerke en kopieregte is die eiendom van hulle onderskeie owners.8.4 Moving gemiddelde modelle Eerder as om te gebruik afgelope waardes van die voorspelling veranderlike in 'n regressie, 'n bewegende gemiddelde model gebruik afgelope voorspelling foute in 'n regressie-agtige model. y c et theta e theta e kolle theta e, waar et is wit geraas. Ons noem dit 'n MA (Q) model. Natuurlik, ons het nie die waardes van et waarneem, so dit is nie regtig regressie in die gewone sin. Let daarop dat elke waarde van yt gesien kan word as 'n geweegde bewegende gemiddelde van die afgelope paar voorspel foute. Maar bewegende gemiddelde modelle moet nie verwar word met bewegende gemiddelde smoothing ons in Hoofstuk 6. 'n bewegende gemiddelde model bespreek word gebruik vir die voorspelling van toekomstige waardes, terwyl bewegende gemiddelde smoothing word gebruik vir die bepaling van die tendens-siklus van verlede waardes wees. Figuur 8.6: Twee voorbeelde van data uit bewegende gemiddelde modelle met verskillende parameters. Links: MA (1) met y t 20e t 0.8e t-1. Regs: MA (2) met y t e t-e t-1 0.8e t-2. In beide gevalle, is e t normaalverdeelde wit geraas met gemiddelde nul en variansie een. Figuur 8.6 toon 'n mate van data uit 'n MA (1) model en 'n MA (2) model. Die verandering van die parameters theta1, kolle, thetaq resultate in verskillende tyd reeks patrone. Soos met outoregressiemodelle, sal die afwyking van die term fout et net verander die skaal van die reeks, nie die patrone. Dit is moontlik om 'n stilstaande AR (p) model as 'n MA (infty) model skryf. Byvoorbeeld, met behulp van herhaalde vervanging, kan ons hierdie bewys vir 'n AR (1) model: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amp phi13y phi12e phi1 e et amptext einde verstande -1 Dit phi1 Dit 1, sal die waarde van phi1k kleiner te kry as k groter word. So uiteindelik kry ons yt et phi1 e phi12 e phi13 e cdots, 'n MA (infty) proses. Die omgekeerde gevolg het as ons 'n paar beperkinge op te lê op die MA parameters. Toe die MA-model is omkeerbaar genoem. Dit wil sê, dat ons 'n omkeerbare MA (Q) proses as 'n AR (infty) proses kan skryf. Omkeerbare modelle is nie net om ons in staat stel om van MA modelle om modelle AR. Hulle het ook 'n paar wiskundige eienskappe wat maak dit makliker om te gebruik in die praktyk. Die inverteerbaarheid beperkings is soortgelyk aan die stasionariteit beperkings. Vir 'n MA (1) model: -1lttheta1lt1. Vir 'n MA (2) model: -1lttheta2lt1, theta2theta1 GT-1, theta1 - theta2 Dit 1. Meer ingewikkelde voorwaardes hou vir qge3. Weereens, sal R sorg van hierdie beperkings te neem wanneer die beraming van die models. Exploring Die eksponensieel Geweegde Moving Gemiddelde Volatiliteit is die mees algemene maatstaf van risiko, maar dit kom in verskeie geure. In 'n vorige artikel het ons gewys hoe om eenvoudige historiese wisselvalligheid te bereken. (Om hierdie artikel te lees, sien Die gebruik van Volatiliteit Om toekomstige risiko te meet.) Ons gebruik Googles werklike aandele prys data om daaglikse wisselvalligheid gebaseer op 30 dae van voorraad data bereken. In hierdie artikel, sal ons verbeter op eenvoudige wisselvalligheid en bespreek die eksponensieel geweeg bewegende gemiddelde (EWMA). Historiese Vs. Geïmpliseer Volatiliteit Eerste, laat sit hierdie metrieke in 'n bietjie van perspektief. Daar is twee breë benaderings: historiese en geïmpliseer (of implisiete) wisselvalligheid. Die historiese benadering veronderstel dat verlede is proloog ons geskiedenis te meet in die hoop dat dit voorspellende. Geïmpliseerde wisselvalligheid, aan die ander kant, ignoreer die geskiedenis wat dit oplos vir die wisselvalligheid geïmpliseer deur markpryse. Hulle hoop dat die mark weet die beste en dat die markprys bevat, selfs al is implisiet, 'n konsensus skatting van wisselvalligheid. (Vir verwante leesstof, sien die gebruike en beperkinge van Volatiliteit.) As ons fokus op net die drie historiese benaderings (op die bogenoemde links), hulle het twee stappe in gemeen: Bereken die reeks periodieke opgawes Pas 'n gewig skema Eerstens, ons bereken die periodieke terugkeer. Dis gewoonlik 'n reeks van die daaglikse opgawes waar elke terugkeer uitgedruk in voortdurend saamgestel terme. Vir elke dag, neem ons die natuurlike log van die verhouding van aandele pryse (dit wil sê die prys vandag gedeel deur die prys gister, en so aan). Dit veroorsaak 'n reeks van die daaglikse opbrengs van u ek u i-m. afhangende van hoeveel dae (m dae) ons meet. Dit kry ons by die tweede stap: Dit is hier waar die drie benaderings verskil. In die vorige artikel (Die gebruik van Volatiliteit Om toekomstige risiko Gauge), ons het getoon dat onder 'n paar aanvaarbare vereenvoudigings, die eenvoudige afwyking is die gemiddeld van die kwadraat opbrengste: Let daarop dat hierdie som elk van die periodieke opgawes, verdeel dan wat totaal deur die aantal dae of waarnemings (m). So, dit is regtig net 'n gemiddeld van die kwadraat periodieke opgawes. Anders gestel, is elke vierkant terugkeer gegee 'n gelyke gewig. So as alfa (a) is 'n gewig faktor (spesifiek, 'n 1 / m), dan 'n eenvoudige variansie lyk iets soos hierdie: Die EWMA Verbeter op Eenvoudige Variansie Die swakheid van hierdie benadering is dat alle opgawes verdien dieselfde gewig. Yesterdays (baie onlangse) terugkeer het geen invloed meer op die variansie as verlede maande terugkeer. Hierdie probleem is opgelos deur die gebruik van die eksponensieel geweeg bewegende gemiddelde (EWMA), waarin meer onlangse opbrengste het 'n groter gewig op die variansie. Die eksponensieel geweeg bewegende gemiddelde (EWMA) stel lambda. wat die smoothing parameter genoem. Lambda moet minstens een wees. Onder daardie toestand, in plaas van gelyke gewigte, elke vierkant terugkeer is geweeg deur 'n vermenigvuldiger soos volg: Byvoorbeeld, RiskMetrics TM, 'n finansiële risikobestuur maatskappy, is geneig om 'n lambda van 0,94, of 94. gebruik in hierdie geval, die eerste ( mees onlangse) kwadraat periodieke terugkeer is geweeg deur (1-0,94) (. 94) 0 6. die volgende kwadraat terugkeer is bloot 'n lambda-veelvoud van die vorige gewig in hierdie geval 6 vermenigvuldig met 94 5.64. En die derde voor dae gewig gelyk (1-0,94) (0.94) 2 5,30. Dis die betekenis van eksponensiële in EWMA: elke gewig is 'n konstante vermenigvuldiger (dit wil sê lambda, wat moet wees minder as een) van die dae gewig voor. Dit sorg vir 'n afwyking wat geweeg of voorkeur vir meer onlangse data. (Vir meer inligting, kyk na die Excel Werkkaart vir Googles Volatiliteit.) Die verskil tussen net wisselvalligheid en EWMA vir Google word hieronder getoon. Eenvoudige wisselvalligheid effektief weeg elke periodieke terugkeer deur 0,196 soos uiteengesit in kolom O (ons het twee jaar van die daaglikse aandeleprys data. Dit is 509 daaglikse opgawes en 1/509 0,196). Maar let op dat Kolom P ken 'n gewig van 6, dan 5.64, dan 5.3 en so aan. Dis die enigste verskil tussen eenvoudige variansie en EWMA. Onthou: Nadat ons die hele reeks (in kolom Q) het ons die variansie, wat is die kwadraat van die standaardafwyking som. As ons wil hê wisselvalligheid, moet ons onthou om die vierkantswortel van daardie afwyking te neem. Wat is die verskil in die daaglikse wisselvalligheid tussen die variansie en EWMA in Googles geval beduidende: Die eenvoudige variansie het ons 'n daaglikse wisselvalligheid van 2,4, maar die EWMA het 'n daaglikse wisselvalligheid van slegs 1.4 (sien die sigblad vir besonderhede). Blykbaar, Googles wisselvalligheid bedaar meer onlangs dus kan 'n eenvoudige variansie kunsmatig hoog wees. Vandag se afwyking is 'n funksie van Pior Dae Variansie Youll kennisgewing wat ons nodig het om 'n lang reeks van eksponensieel afneem gewigte bereken. Ons sal nie die wiskunde doen hier, maar een van die beste eienskappe van die EWMA is dat die hele reeks gerieflik verminder tot 'n rekursiewe formule: Rekursiewe beteken dat vandag se stryd verwysings (dit wil sê 'n funksie van die vorige dae variansie). Jy kan hierdie formule in die sigblad ook, en dit lei tot die presies dieselfde resultaat as die skuldbewys berekening Dit sê: Vandag se variansie (onder EWMA) gelyk yesterdays variansie (geweeg volgens lambda) plus yesterdays kwadraat terugkeer (geweeg deur een minus lambda). Let op hoe ons net bymekaar te tel twee terme: yesterdays geweegde variansie en yesterdays geweeg, vierkantig terugkeer. Net so is, lambda is ons glad parameter. 'N Hoër lambda (bv soos RiskMetrics 94) dui stadiger verval in die reeks - in relatiewe terme, gaan ons meer datapunte in die reeks en hulle gaan stadiger af te val. Aan die ander kant, as ons die lambda verminder, dui ons hoër verval: die gewigte val vinniger af en, as 'n direkte gevolg van die snelle verval, is minder datapunte gebruik. (In die sigblad, lambda is 'n inset, sodat jy kan eksperimenteer met sy sensitiwiteit). Opsomming Volatiliteit is die oombliklike standaardafwyking van 'n voorraad en die mees algemene risiko metrieke. Dit is ook die vierkantswortel van variansie. Ons kan variansie histories of implisiet (geïmpliseer wisselvalligheid) te meet. Wanneer histories meet, die maklikste metode is eenvoudig variansie. Maar die swakheid met 'n eenvoudige afwyking is alle opgawes kry dieselfde gewig. So staan ​​ons voor 'n klassieke kompromis: ons wil altyd meer inligting, maar hoe meer data het ons die meer ons berekening verwater deur verre (minder relevant) data. Die eksponensieel geweeg bewegende gemiddelde (EWMA) verbeter op eenvoudige variansie deur die toeken van gewigte aan die periodieke opgawes. Deur dit te doen, kan ons albei gebruik 'n groot monster grootte, maar ook 'n groter gewig te gee aan meer onlangse opbrengste. (Om 'n fliek handleiding te sien oor hierdie onderwerp, besoek die Bionic skilpad.) 'N Persoon wat handel dryf afgeleides, kommoditeite, effekte, aandele of geldeenhede met 'n hoër-as-gemiddelde risiko in ruil vir. quotHINTquot is 'n akroniem wat staan ​​vir vir quothigh inkomste nie taxes. quot Dit is van toepassing op 'n hoë-verdieners wat verhoed dat die betaling federale inkomste. 'N Mark outeur wat koop en verkoop baie kort termyn korporatiewe effekte genoem kommersiële papier. 'N papier handelaar is tipies. 'N bestelling geplaas met 'n makelaar om 'n sekere aantal aandele te koop of te verkoop teen 'n bepaalde prys of beter. Die onbeperkte koop en verkoop van goedere en dienste tussen lande sonder die oplegging van beperkings soos. In die sakewêreld, 'n buffel is 'n maatskappy, gewoonlik 'n aanloop wat nie 'n gevestigde prestasie record.2.1 bewegende gemiddelde modelle (MA modelle) tydreeksmodelle bekend as ARIMA modelle kan outoregressiewe terme en / of bewegende gemiddelde sluit het nie terme. In Week 1, het ons geleer 'n outoregressiewe term in 'n tydreeks model vir die veranderlike x t is 'n vertraagde waarde van x t. Byvoorbeeld, 'n lag 1 outoregressiewe termyn is x t-1 (vermenigvuldig met 'n koëffisiënt). Hierdie les definieer bewegende gemiddelde terme. 'N bewegende gemiddelde termyn in 'n tydreeks model is 'n verlede fout (vermenigvuldig met 'n koëffisiënt). Laat (WT omslaan N (0, sigma2w)), wat beteken dat die w t is identies, onafhanklik versprei, elk met 'n normaalverdeling met gemiddelde 0 en dieselfde afwyking. Die 1 ste orde bewegende gemiddelde model, aangedui deur MA (1) is (xt mu wt theta1w) Die 2de orde bewegende gemiddelde model, aangedui deur MA (2) is (xt mu wt theta1w theta2w) Die Q de orde bewegende gemiddelde model , aangedui deur MA (Q) is (xt mu wt theta1w theta2w kolle thetaqw) Nota. Baie handboeke en sagteware programme definieer die model met negatiewe tekens voor die terme. Dit nie die geval verander die algemene teoretiese eienskappe van die model, hoewel dit flip die algebraïese tekens van beraamde koëffisiënt waardes en (unsquared) terme in formules vir ACFs en afwykings. Jy moet jou sagteware kyk om te kontroleer of negatiewe of positiewe tekens is gebruik om korrek te skryf die beraamde model. R gebruik positiewe tekens in sy onderliggende model, soos ons hier doen. Teoretiese Eienskappe van 'n tydreeks met 'n MA (1) Model Let daarop dat die enigste nie-nul waarde in die teoretiese ACF is vir lag 1. Alle ander outokorrelasies is 0. So 'n monster ACF met 'n beduidende outokorrelasie net by lag 1 is 'n aanduiding van 'n moontlike MA (1) model. Vir belangstellende studente, bewyse van hierdie eienskappe is 'n bylae tot hierdie opdragstuk. Voorbeeld 1 Veronderstel dat 'n MA (1) model is x t 10 w t 0,7 w t-1. waar (WT omslaan N (0,1)). So het die koëffisiënt 1 0.7. Die teoretiese ACF gegee word deur 'n plot van hierdie volg ACF. Die plot net aangedui is die teoretiese ACF vir 'n MA (1) met 1 0.7. In die praktyk, 'n monster gewoond gewoonlik verskaf so 'n duidelike patroon. Die gebruik van R, gesimuleerde ons N 100 monster waardes gebruik te maak van die model x t 10 w t 0,7 w t-1 waar w t IID N (0,1). Vir hierdie simulasie, 'n tydreeks plot van die steekproefdata volg. Ons kan nie sê baie van hierdie plot. Die monster ACF vir die gesimuleerde data volg. Ons sien 'n skerp styging in lag 1 gevolg deur die algemeen nie-beduidende waardes vir lags afgelope 1. Let daarop dat die monster ACF kom nie ooreen met die teoretiese patroon van die onderliggende MA (1), en dit is dat al outokorrelasies vir lags afgelope 1 sal wees 0 . 'n ander voorbeeld sou 'n effens verskillende monster ACF hieronder getoon, maar sal waarskynlik dieselfde breë funksies. Theroretical Eienskappe van 'n tydreeks met 'n MA (2) model vir die MA (2) model, teoretiese eienskappe is soos volg: Let daarop dat die enigste nie-nul waardes in die teoretiese ACF is vir lags 1 en 2. outokorrelasies vir hoër lags is 0 . So, 'n monster ACF met 'n beduidende outokorrelasies by lags 1 en 2, maar nie-beduidende outokorrelasies vir hoër lags dui op 'n moontlike MA (2) model. IID N (0,1). Die koëffisiënte is 1 0.5 en 2 0.3. Want dit is 'n MA (2), sal die teoretiese ACF nul waardes het net by lags 1 en 2. Waardes van die twee nie-nul outokorrelasies is 'n plot van die teoretiese ACF volg. Soos byna altyd die geval is, monster data gewoond te tree heeltemal so perfek as teorie. Ons gesimuleerde N 150 monster waardes vir die model x t 10 w t 0,5 w t-1 0,3 w t-2. waar w t IID N (0,1). Die tydreekse plot van die data volg. Soos met die tydreeks plot vir die MA (1) voorbeeld van die data, kan nie vir jou sê baie daaruit. Die monster ACF vir die gesimuleerde data volg. Die patroon is tipies vir situasies waar 'n MA (2) model nuttig kan wees. Daar is twee statisties beduidende spykers by lags 1 en 2, gevolg deur nie-beduidende waardes vir ander lags. Let daarop dat as gevolg van steekproeffout, die monster ACF nie die teoretiese patroon presies ooreenstem. ACF vir Algemene MA (Q) Models n eiendom van MA (Q) modelle in die algemeen is dat daar nie-nul outokorrelasies vir die eerste Q lags en outokorrelasies 0 vir alle lags GT q. Nie-uniekheid van verband tussen waardes van 1 en (rho1) in MA (1) Model. In die MA (1) model, vir enige waarde van 1. die wedersydse 01/01 gee dieselfde waarde vir so 'n voorbeeld, gebruik 0,5 vir 1. en gebruik dan 1 / (0,5) 2 vir 1. Jy sal kry (rho1) 0.4 in beide gevalle. Om 'n teoretiese beperking genoem inverteerbaarheid bevredig. Ons beperk MA (1) modelle om waardes met absolute waarde minder as 1. In die voorbeeld net gegee, 1 0.5 sal 'n toelaatbare parameter waarde wees nie, terwyl 1 1 / 0.5 2 nie. Inverteerbaarheid van MA modelle 'n MA-model word gesê omkeerbare te wees indien dit algebraïes gelykstaande aan 'n konvergerende oneindige orde AR model. Bevestig deur die, bedoel ons dat die AR koëffisiënte daal tot 0 as ons terug beweeg in die tyd. Inverteerbaarheid is 'n beperking geprogrammeer in die tyd reeks sagteware wat gebruik word om die koëffisiënte van modelle te skat met MA terme. Dit is nie iets wat ons gaan vir die data-analise. Bykomende inligting oor die inverteerbaarheid beperking vir MA (1) modelle word in die bylaag. Gevorderde teorie Nota. Vir 'n MA (Q) model met 'n bepaalde ACF, daar is net een omkeerbare model. Die noodsaaklike voorwaarde vir inverteerbaarheid is dat die koëffisiënte waardes sodanig dat die vergelyking 1- 1 y. - Q y q 0 het oplossings vir y wat buite die eenheidsirkel val. R-kode vir die voorbeelde in Voorbeeld 1, ons geplot die teoretiese ACF van die model x t 10 w t. 7W t-1. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik word om die teoretiese ACF plot was: acfma1ARMAacf (Mac (0,7), lag. max10) 10 lags van ACF vir MA (1) met theta1 0.7 lags0: 10 skep 'n veranderlike genaamd lags wat wissel van 0 tot 10. plot (lags, acfma1, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (1) met theta1 0.7) abline (H0) voeg n horisontale as om die plot die eerste opdrag bepaal die ACF en slaan dit in 'n voorwerp vernoem acfma1 (ons keuse van naam). Die plot opdrag (die 3de gebod) erwe lags teenoor die ACF waardes vir lags 1 tot 10. Die ylab parameter etikette die y-as en die belangrikste parameter sit 'n titel op die plot. Om te sien die numeriese waardes van die ACF net gebruik die opdrag acfma1. Die simulasie en erwe is gedoen met die volgende opdragte. xcarima. sim (N150, lys (Mac (0,7))) Simuleer N 150 waardes van MA (1) xxc10 voeg 10 tot gemiddelde 10. Simulasie gebreke maak beteken 0. plot (x, typeb, mainSimulated MA (1) data) ACF (x, xlimc (1,10), mainACF vir gesimuleerde steekproefdata) In Voorbeeld 2, ons geplot die teoretiese ACF van die model xt 10 wt 0,5 w t-1 0,3 w t-2. en dan nageboots N 150 waardes van hierdie model en geplot die monster tydreekse en die monster ACF vir die gesimuleerde data. Die R bevele gebruik was acfma2ARMAacf (Mac (0.5,0.3), lag. max10) acfma2 lags0: 10 plot (lags, acfma2, xlimc (1,10), ylabr, typeh, hoof ACF vir MA (2) met theta1 0.5, theta20.3) abline (H0) xcarima. sim (N150, lys (Mac (0.5, 0.3))) xxc10 plot (x, typeb, hoof Gesimuleerde MA (2) Series) ACF (x, xlimc (1,10), mainACF vir gesimuleerde MA (2) Data) Bylae: Bewys van eiendomme van MA (1) vir belangstellende studente, hier is bewyse vir teoretiese eienskappe van die MA (1) model. Variansie: (teks (xt) teks (mu wt theta1 w) 0 teks (WT) teks (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wanneer h 1, die vorige uitdrukking 1 W 2. Vir enige h 2, die vorige uitdrukking 0 . die rede hiervoor is dat per definisie van onafhanklikheid van die WT. E (w k w j) 0 vir enige k j. Verder, omdat die w t het intussen 0, E (w j w j) E (w j 2) w 2. Vir 'n tydreeks, Pas hierdie resultaat aan die ACF hierbo kry. 'N omkeerbare MA model is die een wat geskryf kan word as 'n oneindige orde AR model wat konvergeer sodat die AR koëffisiënte konvergeer na 0 as ons oneindig terug in die tyd beweeg. Wel demonstreer inverteerbaarheid vir die MA (1) model. Ons het toe plaasvervanger verhouding (2) vir w t-1 in vergelyking (1) (3) (ZT wt theta1 (Z - theta1w) wt theta1z - theta2w) op tydstip t-2. vergelyking (2) word Ons het toe plaasvervanger verhouding (4) vir w t-2 in vergelyking (3) (ZT wt theta1 Z - theta21w wt theta1z - theta21 (Z - theta1w) wt theta1z - theta12z theta31w) As ons voortgaan ( oneindig), sou ons die oneindige orde AR model kry (ZT wt theta1 Z - theta21z theta31z - theta41z kolletjies) Nota egter dat as 1 1, die koëffisiënte die lags van Z vermenigvuldig sal toeneem (oneindig) in grootte as ons terug beweeg in tyd. Om dit te voorkom, moet ons 1 LT1. Dit is die voorwaarde vir 'n omkeerbare MA (1) model. Oneindige Bestel MA model In week 3, goed sien dat 'n AR (1) model kan omgeskakel word na 'n oneindige orde MA model: (xt - mu wt phi1w phi21w kolle phik1 w kolle som phij1w) Hierdie opsomming van verlede wit geraas terme is bekende as die oorsaaklike voorstelling van 'n AR (1). Met ander woorde, x t is 'n spesiale tipe MA met 'n oneindige aantal terme terug gaan in die tyd. Dit is 'n oneindige orde MA of MA () genoem. 'N Eindige orde MA is 'n oneindige orde AR en enige eindige orde AR is 'n oneindige orde MA. Onthou in Week 1, het ons opgemerk dat 'n vereiste vir 'n stilstaande AR (1) is dat 1 LT1. Kom ons bereken die Var (x t) met behulp van die oorsaaklike verteenwoordiging. Die laaste stap gebruik 'n basiese feit oor meetkundige reeks wat vereis (phi1lt1) anders sal die reeks divergeer. NavigationEWMA 101 Die EWMA benadering het 'n aantreklike kenmerk: dit vereis relatief min data wat gestoor word. Om ons skatting op enige punt op te dateer, ons moet net 'n vorige skatting van die variansie koers en die mees onlangse waarneming waarde. 'N Sekondêre doel van EWMA is om veranderinge in die wisselvalligheid op te spoor. Vir klein waardes, Onlangse waarnemings beïnvloed die skatting stiptelik. Vir waardes nader aan een, die skatting veranderinge stadig gebaseer op onlangse veranderings in die opbrengste van die onderliggende veranderlike. Die RiskMetrics databasis (wat deur JP Morgan en openbaar gemaak beskikbaar) gebruik die EWMA met vir die opdatering daagliks wisselvalligheid. BELANGRIK: Die EWMA formule nie aanvaar 'n lang loop gemiddelde variansie vlak. So, die konsep van wisselvalligheid beteken terugkeer is nie vasgevang word deur die EWMA. Die ARCH / GARCH modelle is beter geskik vir hierdie doel. Lambda 'n Sekondêre doel van EWMA is om veranderinge in die wisselvalligheid op te spoor, sodat vir klein waardes, onlangse waarneming beïnvloed die skatting stiptelik, en vir waardes nader aan een, die skatting veranderinge stadig onlangse veranderinge in die opbrengste van die onderliggende veranderlike. Die RiskMetrics databasis (wat deur JP Morgan) en openbare beskikbaar gestel in 1994, gebruik die EWMA model met vir die opdatering daagliks wisselvalligheid skatting. Die maatskappy het bevind dat oor 'n reeks van die mark veranderlikes, hierdie waarde van gee voorspelling van die variansie wat die naaste aan besef variansie koers kom. Die besef variansie tariewe op 'n bepaalde dag is bereken as 'n ewe-gemiddelde van die daaropvolgende 25 dae. Net so, om die optimale waarde van lambda bereken vir ons datastel, moet ons die besef wisselvalligheid by elke punt te bereken. Daar is verskeie metodes, so kies een. Volgende, bereken die som van 'n vierkant foute (SSE) tussen EWMA skatting en besef wisselvalligheid. Ten slotte, verminder die SSE deur wisselende die lambda waarde. Klink maklik dit is. Die grootste uitdaging is om in te stem op 'n algoritme om besef wisselvalligheid bereken. Byvoorbeeld, die mense by RiskMetrics verkies die daaropvolgende 25-dag te besef variansie koers bereken. In jou geval, kan jy 'n algoritme wat daaglikse volume gebruik, MI / LO en / of openbare-close pryse te kies. Vrae Q 1: Kan ons gebruik EWMA om te skat (of voorspel) wisselvalligheid meer as 'n stap vorentoe Die EWMA wisselvalligheid verteenwoordiging nie aanvaar 'n langtermyn gemiddelde wisselvalligheid, en dus, vir enige vooruitsig horison meer as een-stap, die EWMA gee 'n konstante waarde:


No comments:

Post a Comment