Как да изчислим емисиите

В статистиката на емисиите - това са стойности, които са рязко различни от други стойности в сглобения набор от данни. Емисиите могат да показват аномалии в разпределението на данните или грешките в измерването, така че често емисиите са изключени от набора от данни. Изключете емисиите от набора от данни, можете да стигнете до неочаквани или по-точни заключения. Следователно е необходимо да се изчисли и оценява емисиите, за да се гарантира правилното разбиране на статистическите данни.

Стъпка

  1. Изображение, озаглавено Изчислете извънредни стойности стъпка 1
един. Научете се да разпознавате потенциалните емисии. Преди да премахнете изходящите стойности от набор от данни, трябва да се определят потенциалните емисии. Емисиите са ценности, които са много различни от повечето стойности в набора от данни - с други думи, емисиите са извън тенденцията на повечето ценности. Лесно е да се открият в таблиците на стойности или (особено) на графиците. Ако стойностите в набора от данни са в графика, тогава емисиите ще лежат далеч от повечето други стойности. Ако например, повечето от стойностите лежат напред, тогава емисиите лежат от двете страни на такова пряко.
  • Например, помислете за набор от данни, представляващи температурата от 12 различни обекта в помещението. Ако 11 обекта имат температура от приблизително 70 градуса, но дванадесетият обект (вероятно пещта) има температура от 300 градуса, след това бързото гледане на стойности може да покаже, че пещта е вероятно емисии.
  • Изображение, озаглавено Изчислете отклонения Стъпка 2
    2. Подредете възходящите данни. Първата стъпка, когато определянето на емисиите е изчисляването на набора от данни Median. Тази задача е значително опростена, ако стойностите в набора данни са разположени възходящи (от по-малки до повече).
  • Продължавайки горния пример, помислете за следния набор от данни, представляващи температурите на няколко обекта: {71, 70, 73, 70, 70, 71, 72, 72, 71, 71, 72, 71, 72, 72, 71. Този комплект трябва да бъде поръчан, както следва: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  • Изображение, озаглавено Изчислете извънредните стойности Стъпка 3
    3. Изчислете средния набор от данни. Median DataSet е стойността в средата на набора от данни. Ако набор от данни съдържат нечетен брой стойности, медианата е стойността, за която и след което са разположени един и същ брой стойности в набора от данни. Но ако набор от данни съдържат четен брой стойности, тогава трябва да намерите средноаритметичната средна стойност на две средни стойности. Имайте предвид, че когато изчисляването на средните емисии обикновено се посочва като Q2, тъй като се крие между Q1 и Q3 - по-ниски и топ квартали, които ще определим по-късно.
  • Не се страхувайте да работите с набори от данни, в които дори броят на стойностите - средните аритметични две средни стойности ще бъдат номерът, който не е в набора от данни е нормален. Но ако две средни стойности са един и същ номер, тогава аритметичната средна стойност е равна на този номер, тя е и в реда на нещата.
  • В горния пример средните 2 стойности са 70 и 71, така че медианата е равна на (((70 + 71) / 2) = 70.5.
  • Изображение, озаглавено Изчислете извънредни стойности Стъпка 4
    4. Изчислете долните квартали. Тази стойност, посочена като Q1, под която се намира 25% от стойностите от набора от данни. С други думи, това е половината от стойностите, разположени преди средата. Ако медианът се състои дори от стойности от набор от данни, трябва да намерите средните аритметични две средни стойности за изчисляване на Q1 (това е подобно на средното изчисление).
  • В нашия пример 6 стойности са разположени след средната и 6 стойности - към нея. Това означава, че за да се изчисли долния квартил, трябва да намерим средноаритметичната средна стойност от шест стойности, разположени на медианата. Тук средните стойности са 70 и 70. По този начин, Q1 = ((((70 + 70) / 2) = 70.
  • Изображение, озаглавено Изчислете външни стойности Стъпка 5
    пет. Изчислете горния квартил. Тази стойност, посочена като Q3, над която се намира 25% от стойностите от набора от данни. Процесът на изчисляване на Q3 е подобен на процеса на изчисляване на Q1, но тук се счита, че стойностите, разположени след средата.
  • В горния пример две средни стойности от шест стойности, разположени след средата, са 71 и 72. Така, Q3 = (((71 + 72) / 2) = 71.5.
  • Изображение, озаглавено Изчислете извънредните стойности Стъпка 6
    6. Изчислете обхвата на Esckelter. Изчисляване на Q1 и Q3, трябва да намерите разстоянието между тези стойности. За да направите това, приспадане Q1 от Q3. Стойността на общуването е изключително важна за определяне на границите на ценностите, които не са емисии.
  • В нашия пример Q1 = 70 и Q3 = 71.5. Интеркомбикалната гама е 71.5 - 70 = 1.5.
  • Обърнете внимание, че това се отнася за отрицателните стойности на Q1 и Q3. Например, ако Q1 = -70, тогава интеркоммуничният обхват е 71.5 - (-70) = 141.5.
  • Изображение, озаглавено Изчислете извънредните стойности Стъпка 7
    7. Намерете "вътрешни граници" на стойностите в набора от данни. Емисиите се определят чрез анализа на стойностите - независимо дали те попадат или не в границите на така наречените "вътрешни граници" и "външни граници". Стойността, подложена на "вътрешни граници", се класифицира като "незначителна емисия", докато стойността зад "външните граници" се класифицира като "значителна емисия". За да намерите вътрешните граници, трябва да добавите ескаротичния диапазон с 1.5 - резултатът трябва да се добави към Q3 и да се приспадне от Q1. Намерени две числа са вътрешни зададени данни.
  • В нашия пример интеркомбанският диапазон е равен на (71.5 - 70) = 1.5. Следваща: 1.5 * 1,5 = 2.25. Този номер трябва да бъде добавен към Q3 и да го извади от Q1, за да намерите вътрешните граници:
  • 71.5 + 2.25 = 73.75
  • 70 - 2.25 = 67.75
  • По този начин вътрешните граници са равни на 67.75 и 73.75.
  • В нашия пример само температурата на пещта - 300 градуса - лежи извън тези граници и може да се счита за непълнолетен. Но не бързайте със заключенията, необходимо е да се определи дали тази температура е значителна емисии. Изображение, озаглавено Изчислете Extiers Step 7Bullet2
  • Изображение, озаглавено Изчислете извънредни стойности Стъпка 8
    Осем. Намерете набор от данни за "външни граници". Това се прави по същия начин, както за вътрешните граници, с изключение на това, че взаимосвързаният обхват се умножава по 3, а не с 1.5. Резултатът трябва да бъде добавен към Q3 и да изважда от Q1. Намерени два номера са външни набори от данни.
  • В нашия пример умножете ескарозната гама с 3: 1.5 * 3 = 4.5. Изчислете външните граници:
  • 71.5 + 4,5 = 76
  • 70 - 4.5 = 65.5
  • По този начин външните граници са равни на 65.5 и 76.
  • Всички стойности, които са извън външните граници, се считат за значителни емисии. В нашия пример температурата на пещта - 300 градуса - се счита за значителни емисии.Изображение, озаглавено Изчислете Extiers Step 8Bullet2
  • Изображение, озаглавено Изчислете извънредни стойности стъпка 9
    девет. Използвайте качествена оценка, за да определите дали да елиминирате емисиите от набора от данни. Описаният по-горе метод ви позволява да определите дали някои емисии (незначителни или значими) са. Въпреки това, не е погрешно - стойността, класифицирана като емисии, е само "кандидат" за изключение, т.е. не сте задължени да го изключите. Причината за появата на емисиите е основният фактор, който засяга решението за изключване на емисиите. Като правило, емисиите, които произтичат поради грешка (при измервания, записи и т.н.), са изключени. От друга страна, емисиите, свързани с грешки, но с нова информация или тенденция, като правило, остават в набора от данни.
  • Също толкова важно е да се оцени въздействието на емисиите в медианския набор от данни (независимо дали те го нарушават или не). Това е особено важно, когато правите заключения, основани на среден набор от данни.
  • В нашия пример е изключително малко вероятно пещта да се нагрява до температура от 300 градуса (само ако не се вземат предвид естествените аномалии). Ето защо може да се сключи (с висок дял на доверие), че такава температура е грешка на измерването, която искате да изключите от набора от данни. Освен това, ако не изключвате емисиите, средният набор от данни ще бъде равен на (69 + 69 + 70 + 70 + 70 + 72 + 73 + 300) / 12 = 89.67 градуса, но ако изключите емисиите, медианата ще бъде равен на (69 + 69 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 градуса.
  • Емисиите обикновено са резултат от човешки грешки, така че емисиите трябва да бъдат изключени от набори от данни.
  • Изображение, озаглавено Изчислете извънредни стойности стъпка 10
    10. Изчислете значението (понякога) емисиите, оставени в набора от данни. Някои емисии трябва да бъдат изключени от набора от данни, тъй като техните причини са грешки и технически проблеми - други емисии трябва да бъдат оставени в набора от данни. Ако например емисиите не са резултат от грешка и / или дава ново разбиране на явлението за изпитване, то трябва да остане в набора от данни. Научните експерименти са особено чувствителни към емисиите - премахване на емисиите по погрешка, можете да пропуснете някаква нова тенденция или отваряне.
  • Например, ние развиваме ново лекарство за увеличаване на размера на рибата в рибарството. Ние ще използваме стария набор от данни ({71, 70, 73, 70, 70, 70, 70, 72, 71, 300, 71, 69}), но този път ще бъде много риба (в грама) след получаване Експериментално лекарство. С други думи, първото лекарство води до увеличаване на масата на рибата до 71 g, второто лекарство - до 70 g и така нататък. В тази ситуация 300 е значителна емисия, но ние не трябва да го изключваме - ако приемем, че няма грешки при измерването, тогава такова емисии е значителен успех в експеримента. Лекарството, което повишава теглото на рибата до 300 грама, действа значително по-добре от други лекарства - по този начин, 300 е най-важната стойност в набора от данни.
  • Съвети

    • Когато са намерени емисии, опитайте се да обясните тяхното присъствие, преди да ги изключите от набора от данни. Те могат да посочат грешки или аномалии за измерване в разпределението.

    От какво имаш нужда

    • Калкулатор
    Подобни публикации