Residual Containment Approach (RCA)

 

Residual Containment Approach (RCA)

En variation af den traditionelle salgssammenligningstilgang til vurdering

Introduktion og oversigt

af Bert Craytor, Pacific Vista Net, 6. august 2022
Pacifica, Californien

 

Jeg introducerede en ny metode til salgssammenligningstilgangen i 2020 og 2021, der lover langt højere nøjagtighed, objektivitet og pålidelighed end de nuværende metoder, der almindeligvis anvendes af taksatorer. Bemærk, at jeg har brugt metoden under flere forskellige navne, såsom Subjective Value eller Imtangible Value Containment Approach til at vurdere ejendomme i San Francisco Bay Area til IRS og udlånsformål. Den nye betegnelse skal give mere mening. I stedet for "immaterielle" eller "subjektive" attributter for tilstand, kvalitet, funktionel nytte, udsigt og lignende, er det mere præcist at bruge udtrykket "umålte" attributter, da denne teknik inkorporerer værdien af ​​alle umålte attributter gennem regressionsresidualer . Jeg foreslår derfor, at "Residual Containment Approach" er det mest kortfattede og korrekte udtryk.

 

Metoden kan beskrives som en arbejdsgang, der omfatter:

 

 

  1. Fokus på bestemmelsen af ​​værdibidraget af alle funktioner, der tilføjer værdien af ​​en ejendom, snarere end den klassiske direkte bestemmelse af justeringsværdier gennem matchede par eller normale regressionsteknikker. Justeringsværdier er simpelthen forskellen mellem fagets bidragsværdier og de sammenlignelige. Alligevel omgår justeringsværdierne nemt sikkerhedsbegrænsninger. Bidragsværdier skal summere til salgsprisen. Derfor er det bestemt mere sikkert at beregne bidragsværdierne før beregning af reguleringer.
  2. Indsamling af mange sammenlignelige salg fra nabolaget eller markedsområdet. Dette kan omfatte en by eller et særskilt område af en større by. Du bør forsøge at holde dig inden for en radius på 3 km, men det afhænger selvfølgelig af ejendomstypen. Du bør prøve at få mindst 80 eller flere sammenlignelige funktioner, der har funktioner, der sandsynligvis i det mindste delvist overlapper hinanden og emnet. Mit gennemsnitlige antal sammenlignelige produkter er 125-180, men kan gå op til 600. Du skal muligvis også gå 5 til 15 år eller mere tilbage for at få et brugbart antal salg og sikre, at du har et godt udvalg af funktioner, som du finder i emne ejendom. Et emne med en sjælden kombination af funktionsværdier kan kræve at gå 10 eller flere år tilbage i tiden. Der er også retrospektive vurderinger. Salgsdatoen for en sammenlignelig eller den pågældende ejendom kan altid justeres for. Forstå dog, at jo længere tilbage i tiden du går, jo flere faktorer er der i prisændringer. Hvis du går mere end 10 år tilbage, vil du sandsynligvis opdage, at købers smag har ændret sig i den periode, hvilket skaber en vekselvirkning mellem salgsdatoen og andre funktioner. Du bliver så nødt til at bruge to-vejs interaktioner, hvilket øger kompleksiteten af ​​den endelige regressionsmodel.
  3. Adskillelse af målte og umålte attributter. Regression køres kun på målte attributværdier. Værdiansættelsen af ​​umålte attributter sker gennem residualer.
  4. Konstruktion af en regressionsmodel baseret på målte attributværdier såsom GLA, partistørrelse, salgsdato, historier, rumantal, GIS-koordinater og alder (faktisk eller effektiv), ved brug af en meget nøjagtig regressionsteknik såsom multivariate adaptive regressionssplines ( MARS). Til dette anbefales open source "jord"-pakken af ​​R sammen med "caret"-pakken. Dette kan køres i open source R Studio med parallel behandling. Jeg kører i øjeblikket dette på en AMD Ryzen 9 5950 desktop, der typisk bruger omkring 28 ud af 32 kerner, hvor caret spinner 28 +/- separate forekomster af R Studio til parallel behandling af flere jordkørsler.
  5. Oprettelse af en restmodel baseret på forskellen mellem estimaterne fra regressionsmodellen og de faktiske salgspriser for de salgssammenlignelige. Denne model er to ting:

     

    1. En funktion, der kortlægger en restscore på f.eks. 0.00 til 10.00 til en restværdi. Du får denne funktion ved at rangere salg sammenlignelige efter restværdi fra størst til mindste, og derefter oprette en score baseret på procentdelen af ​​salg mindre end en given værdi. Funktionen kan oprettes ved at køre en regression på disse to værdisæt eller blot ved at oprette en opslagsmatrix, der kortlægger en bestemt score til en værdi. Du skal skrive et program i R for at gøre dette. Ved at bruge denne funktion kan du derefter indtaste forsøgspersonens estimerede restscore for at få et estimat af dets restværdi. Det er nøglen til at estimere salgsprisen for emnet.   Bemærk: Dette trin kan automatiseres fuldt ud i R.
    2. Allokering af restværdien for hvert salg sammenligneligt og emneejendommen til de umålte attributter. Residualen giver den samlede værdi af alle umålte attributter. Typisk vil brugeren af ​​rapporten gerne have noget mere meningsfuldt. Residualerne skal deles mellem de forskellige umålte attributter, såsom Quality, Condition, Functional Utility, View og hvilke andre umålte attributter, du mener er værdifulde. Taksatoren behøver kun at gøre dette for de sammenlignelige, der går ind i salgsnettet. Det er en god ting, fordi det kræver noget arbejde og tid at gøre dette.  Bemærk, at dette er en manuel proces, der kræver kendskab til vurdering.    Husk, at for så vidt angår den endelige værdikonklusion, er det kun den samlede værdi, der har nogen indflydelse. Hvordan du opdeler den samlede restværdi, påvirker kun din kommunikation til rapportlæseren om, hvordan salget sælges for mere eller mindre end emnet og andre sammenlignelige produkter. Dette trin er, hvor metodens "begrænsning" kommer ind i billedet. Du tildeler værdi til de umålte attributter – under den begrænsning, at alle sådanne restkomponentværdier for en bestemt sammenlignelig skal summeres til den tilsvarende restværdi. Hvis du vil tilføje ekstra værdi for Condition, skal du tage denne værdi væk fra en eller flere af de andre attributter.

      Bemærk: Dette trin kan ikke automatiseres fuldt ud. I hvert fald ikke lige om lidt – som i det næste årti. Hvor godt et stykke arbejde du udfører i dette trin vil dog ikke påvirke værdikonklusionen - kun kvaliteten af ​​din forklaring på, hvorfor en ejendom blev solgt for mere eller mindre end en anden. Du kan genveje denne proces ved at estimere umålte værdier baseret på procenter, hvis du mangler tid. For eksempel kan du automatisk tildele 30 % af restproduktet til Kvalitet, 30 % til Betingelse, 20 % til Funktionelt hjælpeprogram og 20 % til Vis og derefter justere individuelle salg (eller emnet) baseret på undtagelser. Mere sandsynligt vil du dog finde opgaven mere kompliceret, da residualet kan være sammensat af både negative og positive værdier. For eksempel, hvis restværdien for en sammenlignelig er $50K, så går $75K måske til Condition, og – $25K går til View. Igen kan du automatisere den indledende tildeling baseret på procenter og derefter justere tildelingen baseret på afvigelser fra normen.

  6. Erkendelse af, at en regressionsmodel med en signifikant høj R2-værdi vil give restværdier, der korrelerer med værdien af ​​de umålte attributter. Det vil sige en ejendom, der sælger for mere end forventet eller angivet af modellen baseret på målte attributter, men som har umålte attributter, der er mere værd end den gennemsnitlige ejendom.
  7. Rangering af sammenlignelige efter restværdi fra stor til lille, svarer derefter til værdien af ​​de umålte attributter. Rangeringen kan give procentvise scorer, for eksempel 0.00 til 10.00, hvor for eksempel en score på 6.25 ville indikere, at 62.5 % af de sammenlignelige salg havde en lavere restscore. Du kan bruge score, der går fra 0.0 til 100.0, men jeg synes, at 0.00 til 10.00 er mere praktisk.
  8. Rangering af emneegenskaber i forhold til den rangerede liste over sammenlignelige residualer for at finde ud af, hvilke to egenskaber der passer bedst mellem baseret på umålte attributter. Dette ville så indikere en score et sted mellem de bedre og mindre (med hensyn til resterende) egenskaber. Et groft skøn kan bruges. Denne score kan derefter omvendt kortlægges til en restværdi, og denne værdi kan derefter bruges som forsøgspersonens restværdi.
  9. Den estimerede restværdi for emneegenskaben tilføjes derefter til estimatet fra regressionsmodellen baseret på dens målte attributter for at nå frem til en angivet værdi.

For eksempel kan faget passe mellem en sammenlignelig med en score på 6.2 og en med en score på 6.3, så du tildeler faget en score på 6.25. Fra denne score finder du, at den tilsvarende restværdi for emnet er $120K. Sammenlignelig 1 har en restværdi på $80, så forskellen er +$40, hvilket er din samlede justering for alle umålte funktioner i Comparable 1. Heraf allokerer du $20 til tilstand, $10 til visning og $10 til funktionel Utility. Og bemærk, at sammenlignelig 1 i dette tilfælde er underlegen i forhold til emnet med hensyn til umålte attributter.

Hvis vi tager outputtet fra ovenstående arbejdsgang og placerer det i et salgsgitter, beregner vi hver attributjustering som   

              Attributjustering = Emneattributværdibidrag – Salgssammenlignelig værdibidrag,

vi vil opnå alle justeringer, bortset fra at den samlede reguleringsværdi for alle umålte attributter vil være under en enkelt resterende justering. Vi kan dog tage backup og først opdele de resterende bidragsværdier mellem de forskellige umålte attributter, før vi beregner justeringerne. Hvordan vi opdeler restjusteringen vil ikke påvirke det endelige værdiudfald (eller med andre ord gennemsnittet af alle justerede salgspriser), så længe de individuelle værdier stadig summeres til resttotalen for hvert salg sammenligneligt. Som en genvej kunne vi også bare dele den resterende justering mellem de salgssammenlignelige umålte attributter, selvom det risikerer justeringer, der sandsynligvis vil være noget off-base, selvom sådanne fejl ikke vil påvirke de justerede salgspriser.

Slutresultatet vil være, at alle salgssammenligninger vil have nøjagtig den samme justerede salgspris. Og hvis vi gennemsnit af disse værdier, vil vi have den samme værdi som opnået ved trin 8 ovenfor.  

Man kan spørge – hvorfor ikke bare smide salgsnettet og bruge værdien fra trin 8 ovenfor? Den bedste grund er, at salgsnettet giver begrundet støtte til værdikonklusionen, som brugeren kan gennemgå. Det giver en begrundelse for, hvorfor de enkelte salgssammenligninger er solgt for mindre eller mere end værdikonklusionen for den pågældende ejendom.

Spørgsmål svar

  1. Spørgsmål: Hvordan ved vi, at rangeringen af ​​salgssammenlignelige efter restværdi vil svare til værdibidraget af de forskellige umålte attributter?

    Svar: Dette afhænger af, hvor godt regressionsmodellen for de målte attributter er. En høj R2-værdi på 70-80%+ sikrer, at 70-80% af værdiafvigelserne mellem de sammenlignelige er redegjort for af regressionsmodellen af ​​målte attributter. 20-30% må nødvendigvis skyldes de umålte egenskaber og fejl. Fejlene antages at være tilfældige i forhold til sammenlignelige og deres egenskaber. Da regression er et gennemsnit af virkningen af ​​disse funktioner, vil fejlens indvirkning på regressionsmodellen sandsynligvis være upartisk med hensyn til målte attributter.

    Det skal derfor forstås, at effektiviteten af ​​denne metode afhænger af at bruge en meget nøjagtig og raffineret regressionsteknik, såsom multivariate adaptive regressionssplines (MARS). R/earth anbefales som en gratis open source softwarepakke til dette formål.

    Bemærk også, at blot at bruge en avanceret og præcis regressionsmetode ikke garanterer kvaliteten af ​​resultatet. Brug af MARS-regression kræver en del erfaring, viden og dygtighed. Selv en høj R2 er ikke en garanti for kvalitet, da det kan være resultatet af overfitting. Hver model skal gennemgås for overfitting, og om det giver mening i den virkelige verden.

  2. Spørgsmål: Betyder ovenstående QA, at denne metode vil være svær at automatisere?

    Svar: Automatisering er absolut nødvendig, fordi ovenstående arbejdsgang involverer en række mindre trin, der skal udføres på en ensartet og meget nøjagtig måde. 

    Men opbygningen af ​​en regressionsmodel er en kunst, der ikke kun kræver viden om det anvendte regressionsværktøj, men også god viden og erfaring med vurdering. Automatisering går dog kun så vidt. Enhver model eller sæt af værdiligninger, der sparkes ud af MARS, skal gennemgås af analytikeren/vurderingsmanden, som ved, hvad han skal kigge efter. Mange modeller vil sandsynligvis blive genereret og gennemgået ved at ændre parametrene til MARS og derefter rette eller på anden måde modificere data for at finde en passende model, der vil give nøjagtige værdiansættelsesresultater.

    Selvom det burde være muligt at designe et fuldt automatiseret system i fremtiden, er det sandsynligvis en vej ud. Som følge heraf er denne metode, selv om den lover mere nøjagtighed og objektivitet i værdiansættelsen, også mere tidskrævende og kræver flere færdigheder.

  3. Spørgsmål: Hvor robust er denne metode mod vurderingsmandsbias?

    Svar: Denne metode har i virkeligheden kun ét sted, hvor bias kan indføres, og det er placeringen af ​​emneegenskaben i den resterende rangering af salgssammenligninger. Hvis modellen ikke er overmonteret, er dataene rimeligt nøjagtige, og R2-værdien er omkring 70 % eller højere, så vil skævhed i placeringen sandsynligvis være indlysende. Placering er sværere i det brede rangordnede område omkring gennemsnittet, mellem 10 % og 90 % – hvor restværdi vs score-kurven typisk ikke er særlig stejl. Placeringsfejl i denne del af den resterende rangordning påvirker typisk ikke værdien så meget. Residualkurven har dog en tendens til at være stejl i både den lave og høje ende, de lavere og højere restværdiegenskaber. I denne del af spektret er forskellene i kvalitet og andre umålte egenskaber så store, at det burde være indlysende at placere emnet for lavt eller for højt på den rangerede liste. Under alle omstændigheder ved anmelderen, hvor han skal lede efter tegn på bias. Det kommer ikke til at være et spørgsmål om at forsøge at finde en nål i en høstak. Hvis der opstår spørgsmål, vil næste skridt være at gennemgå regressionsmodellens grafer og ligninger.

  4. Spørgsmål: “Hvordan får subjektive parametre, såsom kvalitet, tilstand og beliggenhed/udsigt input til systemet? Og hvis de ikke indtastes manuelt, findes dataene i nutidens MLS-systemer med tilstrækkelig granularitet/dybde til at automatisere input af disse faktorer? (Som granit vs Corian vs laminat bordplader, eller 10′ vs 8′ lofter)." (Fra AppraisersForum.com)

    Svar: Disse funktioner, du nævnte, er bare "umålte" funktioner. Vi har ikke foranstaltninger til dem. I hvert fald ikke god nok til at være nyttig. Hvis vi gjorde det, ville vi blot indtaste dem i regression sammen med GLA, Lot Size, Room Count, og så videre.

    Så det, vi gør, er at indtaste alle målte funktioner i regressionen, og det starter en model, der estimerer salgsprisen baseret på disse input. Selvfølgelig er modellen ikke perfekt. I bedste fald kan det tegne sig for omkring 80 % af prisafvigelsen. Det efterlader omkring 20%, kaldet "resten". (“Residualet” i denne sammenhæng er den “sammenlignelige udsalgspris” – “regression estimeret udsalgspris” !!) De 20 % er værdien af ​​alle de umålte værdier klumpet sammen plus fejl fra forkerte data. Det meste af denne rest kommer dog til at være for de egenskaber, der ikke gik ind i regression, for det meste tilstand, kvalitet og udsigt.

    Nu er dette det kritiske punkt: Vi behøver virkelig ikke at værdsætte hver af disse umålte funktioner separat, for som det viser sig, har vi kun brug for deres samlede værdi for at få en værdikonklusion for emnet. Du kan dog opdele restproduktet mellem de forskellige umålte attributter for at fuldende din forklaring på, hvorfor salgspriserne er forskellige mellem en given salgssammenlignelighed og emnet og andre sammenlignelige. Hvordan du gør opdelingen har ingen indflydelse på den justerede salgspris og ved overførsel (gennem gennemsnit) den angivne værdi for emnet. Da alle dine justerede salgspriser vil være nøjagtig de samme, vil vægtning ikke tjene noget formål. Hele spørgsmålet om at håndtere umålte attributter ved hjælp af residualer er et emne i sig selv. Du behøver ikke at være overdrevent bekymret over det – da det ikke har nogen indflydelse på værdien, kun på din støtte til den givne værdikonklusion, det vil sige din evne til at forklare præcis, hvorfor nogle ejendomme blev solgt for mere eller mindre end en anden .

    Der er et andet kritisk punkt: Lad os sige, at du laver regression på 120 sammenlignelige salg. så vender du om og laver estimater baseret på de målte attributter, og ud fra de sammenlignelige salgspriser og disse estimater, resterne. Derefter rangerer du de sammenlignelige ud fra deres residualer, størst til mindst. Hvis du har en anstændig regression med en R2 på 70 % eller højere, så du undgår overfitting, så vil du næsten helt sikkert opdage, at rangeringen af ​​de sammenlignelige sammenligner de bedre tilstand, kvalitet og visningssammenligninger øverst på listen — fordi de sælges for mere end forventet. Så du kan bruge den rangering til at score de sammenlignelige med hensyn til disse umålte attributter. Du kan kortlægge scorerne til residualerne for at få en "restmodel". Med en residualmodel kan du indtaste en sådan score, og den vil derefter give dig den estimerede residual. Så du tager emneejendommen og finder ud af, hvor den passer bedst ind i ranglisten. Dens score er gennemsnittet af de to bedste egenskaber, den passer mellem. Fra scoren, få resten. Tilføj emnets estimerede rest til regressionsestimatet for at få en estimeret salgspris. … Eller gør dig den ulejlighed at trække hver sammenlignelig rest fra emneresten for at få en restjustering, beregn alle de justerede salgspriser - de vil alle være ens - og de vil være nøjagtigt lig med emnets førnævnte estimerede salgspris.

    Bemærk: Hvis sammenlignelighederne er rangeret efter residual, men du ikke kan se, at de større residualer relaterer sig særlig godt til de umålte attributter - så kan du være ret sikker på, at din regression har en lav R2 eller er overtilpasset. Dette gør det bydende nødvendigt at bruge en højkvalitets regressionsteknik såsom MARS – og at vide, hvad du laver.

    Til sidst: Et kort svar på dit spørgsmål er, at denne metode giver et ret præcist mål for dine subjektive variabler - kun det er en værdi for dem ALLE. - Men det er godt nok til at nå frem til en værdimæssig konklusion.

 

Rul til top