Kā noteikt novirzes: 10 soļi (ar attēliem)

Satura rādītājs:

Kā noteikt novirzes: 10 soļi (ar attēliem)
Kā noteikt novirzes: 10 soļi (ar attēliem)

Video: Kā noteikt novirzes: 10 soļi (ar attēliem)

Video: Kā noteikt novirzes: 10 soļi (ar attēliem)
Video: 👌 Старая Audi A6: еще жива или уже на коленях? Большой гид по слабым местам кузова С5. 2024, Maijs
Anonim

Statistikā izņēmums vai “izņēmums” ir atskaites punkts, kas ļoti tālu atšķiras no jebkura cita parauga vai datu kopas datu bāzes (nulles punktu kopu sauc par datiem). Bieži vien atskaites kopas novirze var kalpot par brīdinājumu statistiķim par novirzi vai eksperimentālu kļūdu veiktajos mērījumos, kas var novest pie tā, ka statistiķis noņem novirzi no atskaites kopas. Ja statistiķis noņem novirzes no atskaites kopas, pētījumā izdarītie secinājumi var būt ļoti atšķirīgi. Tāpēc, lai nodrošinātu pareizu statistikas datu kopas izpratni, ir ļoti svarīgi zināt, kā aprēķināt un analizēt novirzes.

Solis

Novērtējumu aprēķināšana 1. darbība
Novērtējumu aprēķināšana 1. darbība

1. solis. Uzziniet, kā identificēt potenciāli neparastus nulles punktus

Pirms mēs izlemjam, vai no atskaites kopas noņemt vai neatļaut atskaites punktus, protams, mums ir jānosaka, kuri atskaites punkti var kļūt par izņēmumiem. Kopumā novirze ir atsauces punkts, kas vienā datu kopas kopā ļoti tālu atšķiras no citiem nulles punktiem - citiem vārdiem sakot, novirze ir “ārpus” pārējiem nulles punktiem. Parasti datu tabulā vai (jo īpaši) diagrammā ir viegli noteikt novirzes. Ja viena nulles punktu kopa ir vizuāli aprakstīta ar grafiku, ārējais atskaites punkts šķiet "ļoti tālu" no pārējiem nulles punktiem. Ja, piemēram, lielākā daļa atskaites punktu nulles punktu veido taisnu līniju, izņēmuma atskaites punktu nevar pamatoti interpretēt kā šīs līnijas veidošanu.

Apskatīsim datu punktu kopu, kas attēlo 12 dažādu objektu temperatūru telpā. Ja 11 objektu temperatūra ir aptuveni 70 Fārenheita (21 grāds pēc Celsija), bet 12. objekta, krāsns, temperatūra ir 300 Fārenheita (150 grādi pēc Celsija), uzreiz var redzēt, ka cepeškrāsns temperatūra, visticamāk, būs izņēmums

Ārējo vērtību aprēķināšana 2. darbība
Ārējo vērtību aprēķināšana 2. darbība

Solis 2. Sakārtojiet nulles punktus datu kopā no zemākās līdz augstākajai

Pirmais solis, lai aprēķinātu novirzes no nulles punkta, ir atrast šīs atskaites kopas mediānu (vidējo vērtību). Šis uzdevums kļūst ļoti vienkāršs, ja atskaites punktu kopas atskaites punkti ir sakārtoti no mazākā uz lielāko. Tātad, pirms turpināt, sakārtojiet nulles punktus vienā šādā datu kopā.

Turpināsim iepriekš minēto piemēru. Šis ir mūsu datu kopums, kas attēlo vairāku objektu temperatūru telpā: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ja mēs sakārtojam nulles punktus no zemākā līdz augstākajam, nulles punktu secība ir šāda: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}

Ārējo vērtību aprēķināšana 3. darbība
Ārējo vērtību aprēķināšana 3. darbība

3. solis. Aprēķiniet atskaites kopas mediānu

Atskaites kopas mediāna ir atskaites punkts, kur otra nulles punkta puse atrodas virs šī atskaites punkta, bet pārējā puse ir zem tā - būtībā šis atskaites punkts ir atsauces punkts, kas atrodas nulles punkta kopas vidū. Ja atskaites punktu kopas atskaites punktu skaits ir nepāra, to ir ļoti viegli atrast - mediāna ir atskaites punkts, kuram virs un zem ir vienāds skaitlis. Tomēr, ja atskaites punktu kopas atskaites punktu skaits ir vienāds, tad, tā kā neviens nulles punkts neietilpst vidū, vidējie 2 nulles punkti tiek vidēji aprēķināti, lai atrastu mediānu. Jāatzīmē, ka, aprēķinot novirzes, mediānai parasti tiek piešķirts mainīgais Q2-ni, jo Q2 atrodas starp Q1 un Q3, apakšējo un augšējo kvartili, ko mēs apspriedīsim vēlāk.

  • Nevajadzētu jaukt ar atskaites kopu, kurā atskaites punktu skaits ir vienāds-2 vidējo nulles punktu vidējais rādītājs bieži atgriež skaitli, kas nav pašā nulles punktu kopā-tas ir labi. Tomēr, ja 2 vidējie atskaites punkti ir vienādi, vidējais, protams, būs vienāds skaitlis, kas arī ir labi.
  • Iepriekš minētajā piemērā mums ir 12 datu punkti. 2 vidējie nulles punkti ir attiecīgi 6. un 7. nulles punkts-attiecīgi 70 un 71. Tātad mūsu datu kopas mediāna ir šo divu skaitļu vidējais: ((70 + 71) / 2), = 70.5.
Ārējo vērtību aprēķināšana 4. darbība
Ārējo vērtību aprēķināšana 4. darbība

4. solis. Aprēķiniet apakšējo kvartili

Šī vērtība, ko mēs piešķiram mainīgajam Q1, ir atskaites punkts, kas veido 25 procentus (vai ceturtdaļu) no nulles punktiem. Citiem vārdiem sakot, tas ir atskaites punkts, kas sadala nulles punktus, kas ir zem mediānas. Ja atskaites punktu skaits zem mediānas ir vienāds, jums atkal jānovērtē 2 nulles punkti vidū, lai atrastu Q1, tāpat kā jūs varētu atrast pašu mediānu.

Mūsu piemērā ir 6 nulles punkti, kas atrodas virs mediānas, un 6 nulles punkti, kas atrodas zem mediānas. Tas nozīmē, ka, lai atrastu apakšējo kvartili, mums būs jānovērtē 2 nulles punkti 6 nulles punktu vidū zem mediānas. Trešais un ceturtais nulles punkts, kas ir 6 nulles zem mediānas, ir 70. Tātad vidējais ir ((70 + 70) / 2), = 70. 70 kļūst par mūsu Q1.

Ārējo vērtību aprēķināšana 5. darbība
Ārējo vērtību aprēķināšana 5. darbība

5. solis. Aprēķiniet augšējo kvartili

Šī vērtība, ko mēs piešķiram mainīgajam Q3, ir atskaites punkts, uz kura ir 25 procenti nulles punktu. Q3 atrašana ir gandrīz tāda pati kā Q1 atrašana, izņemot to, ka šajā gadījumā mēs skatāmies uz atskaites punktiem virs mediānas, nevis zem mediānas.

Turpinot iepriekš minēto piemēru, 2 nulles punkti 6 nulles punktu vidū virs mediānas ir 71 un 72. Šo divu nulles punktu vidējais lielums ir ((71 + 72)/2), = 71, 5. 71, 5 ir mūsu Q3.

Ārējo vērtību aprēķināšana 6. darbība
Ārējo vērtību aprēķināšana 6. darbība

6. solis. Atrodiet starpkvartilu attālumu

Tagad, kad esam atraduši Q1 un Q3, mums jāaprēķina attālums starp šiem diviem mainīgajiem. Attālums no Q1 līdz Q3 tiek atrasts, no Q3 atņemot Q1. Vērtības, ko iegūstat starpkvartilētiem attālumiem, ir ļoti svarīgas, lai noteiktu nulles punktu robežas jūsu datu kopā.

  • Mūsu piemērā mūsu Q1 un Q3 vērtības ir 70 un 71, 5. Lai atrastu starpkvartilitālo attālumu, mēs atņemam Q3 - Q1 = 71,5 - 70 = 1, 5.
  • Jāatzīmē, ka tas attiecas arī uz gadījumiem, ja Q1, Q3 vai abi ir negatīvi skaitļi. Piemēram, ja mūsu Q1 vērtība bija -70, mūsu pareizais starpkvartilu attālums būtu 71,5 -(-70) = 141, 5.
Ārējo vērtību aprēķināšana 7. darbība
Ārējo vērtību aprēķināšana 7. darbība

7. solis. Atrodiet “iekšējo žogu” atskaites komplektā

Novirzes tiek konstatētas, pārbaudot, vai atsauces punkts neietilpst skaitļu robežās, ko sauc par “iekšējo žogu” un “ārējo žogu”. Atskaites punktu, kas atrodas ārpus atskaites kopas iekšējā žoga, sauc par “nelielu novirzi”, bet nulles punktu, kas atrodas ārpus ārējā žoga, sauc par “galveno novirzi”. Lai atrastu iekšējo žogu datu atskaites komplektā, vispirms reiziniet starpkvartilu attālumu ar 1, 5. Tad pievienojiet rezultātu ar Q3 un arī atņemiet to no Q1. Divas iegūtās vērtības ir jūsu atskaites kopas iekšējās žoga robežas.

  • Mūsu piemērā starpkvartilu attālums ir (71,5–70) vai 1,5. Reiziniet 1,5 ar 1,5, iegūstot 2,25. Mēs pievienojam šo skaitli Q3 un atņemam Q1 ar šo skaitli, lai atrastu iekšējā žoga robežas šādi:

    • 71, 5 + 2, 25 = 73, 75
    • 70 - 2, 25 = 67, 75
    • Tātad, mūsu iekšējā žoga robežas ir 67., 75. un 73., 75. punkts.
  • Mūsu datu bāzes komplektā tikai krāsns temperatūra, 300 Fārenheita, ir ārpus šīm robežām, un tāpēc šis atskaites punkts ir neliels novirze. Tomēr mēs joprojām neesam aprēķinājuši, vai šī temperatūra ir būtiska novirze, tāpēc nesteidzieties ar secinājumiem, kamēr neesam veikuši aprēķinus.

    Novērtējumu aprēķināšana 7. solis Bullet2
    Novērtējumu aprēķināšana 7. solis Bullet2
Ārējo vērtību aprēķināšana 8. darbība
Ārējo vērtību aprēķināšana 8. darbība

8. solis. Atrodiet “ārējo žogu” atskaites komplektā

Tas tiek darīts tāpat kā iekšējā žoga atrašana, izņemot to, ka starpkvartālu attālums tiek reizināts ar 3, nevis 1.5. Pēc tam rezultāts tiek pievienots Q3 un atņemts no Q1, lai atrastu ārējā žoga augšējo un apakšējo robežu.

  • Mūsu piemērā, reizinot starpkvartāla attālumu ar 3, iegūst (1, 5 x 3) vai 4, 5. Mēs atrodam ārējā žoga robežas tāpat kā iepriekš:

    • 71, 5 + 4, 5 = 76
    • 70 - 4, 5 = 65, 5
    • Ārējā žoga robežas ir 65,5 un 76.
  • Datus, kas atrodas ārpus ārējā žoga robežas, sauc par galvenajiem novirzēm. Šajā piemērā cepeškrāsns temperatūra 300 Fārenheita nepārprotami atrodas ārpus ārējā žoga, tāpēc šis atskaites punkts "noteikti" ir būtiska novirze.

    Ārējo vērtību aprēķināšana 8. darbība. Bullet2
    Ārējo vērtību aprēķināšana 8. darbība. Bullet2
Ārējo vērtību aprēķināšana 9. darbība
Ārējo vērtību aprēķināšana 9. darbība

9. solis. Izmantot kvalitatīvu spriedumu, lai noteiktu, vai “izmest” izņēmuma atskaites punktu

Izmantojot iepriekš aprakstīto metodi, var noteikt, vai atskaites punkts ir mazs, galvenais atskaites punkts vai vispār nav izņēmums. Tomēr nekļūdieties - atrodot atsauces punktu kā izņēmumu, tas norāda tikai to, ka atsauces punkts ir “kandidāts”, kas jānoņem no atskaites kopas, nevis kā atskaites punkts, kas “jāiznīcina”. "Iemesls", kas noved pie tā, ka atskaites punkts novirzās no citiem nulles punktiem, ir ļoti svarīgs, lai noteiktu, vai to izmest vai nē. Parasti novirzi, ko izraisa, piemēram, kļūda mērījumos, ierakstīšanā vai eksperimentālā plānošanā, var atmest. No otras puses, novirzes, kuras nav izraisījusi kļūda un kas norāda uz jaunu informāciju vai tendencēm, kuras iepriekš nebija paredzētas, parasti tiek “atmestas”.

  • Vēl viens kritērijs, kas jāņem vērā, ir tas, vai novirzei ir liela ietekme uz atskaites kopas vidējo lielumu, t.i., vai novirze to sajauc vai liek izskatīties nepareizi. Tas ir ļoti svarīgi apsvērt, ja plānojat izdarīt secinājumus no savas datu kopas vidējās vērtības.
  • Izpētīsim mūsu piemēru. Šajā piemērā, jo šķiet "ļoti" maz ticams, ka krāsns sasniedza 300 Fārenheita grādus neparedzamu dabas spēku ietekmē, mēs varam gandrīz droši secināt, ka cepeškrāsns tika nejauši atstāta ieslēgta, kā rezultātā tika konstatēta nulles punkta anomālija augstā temperatūrā. Turklāt, ja nenovēršam novirzes, mūsu atskaites kopas vidējais lielums ir (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73 + 300)/12 = 89,67 Fārenheita (32 grādi pēc Celsija)), bet vidējais, ja noņemam novirzes, ir (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73)/11 = 70,55 Fārenheita (21 grāds pēc Celsija).

    Tā kā šīs novirzes izraisīja cilvēku kļūda un tāpēc, ka nebūtu pareizi apgalvot, ka vidējā istabas temperatūra sasniedz gandrīz 90 Fārenheita (32 grādus pēc Celsija), mēs labāk izvēlamies „izmest” savus novirzes

Ārējo vērtību aprēķināšana 10. darbība
Ārējo vērtību aprēķināšana 10. darbība

10. Ziniet, cik svarīgi (dažreiz) ir saglabāt novirzes

Lai gan daži novirzes ir jānoņem no atskaites kopas, jo tās rada kļūdas un/vai padara rezultātus neprecīzus vai kļūdainus, daži novirzes ir jāsaglabā. Ja, piemēram, novirze šķiet dabiski iegūta (tas nav, kļūdas rezultāts) un/vai sniedz jaunu skatījumu uz pētāmo parādību, novirzi nevajadzētu noņemt no atskaites kopas. Zinātniskie pētījumi parasti ir ļoti jutīga situācija attiecībā uz novirzēm - nepareiza noviržu noņemšana var nozīmēt informācijas izmešanu, kas norāda uz jaunu tendenci vai atklājumu.

Piemēram, pieņemsim, ka mēs izstrādājam jaunu narkotiku, lai palielinātu zivju izmēru zivju dīķī. Mēs izmantosim savu veco datu kopu ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), izņemot gadījumus, kad šoreiz katrs atskaites punkts atspoguļos zivju svaru (gramos) pēc tam, kad no dzimšanas tika ievadītas citas eksperimentālās zāles. Citiem vārdiem sakot, pirmās zāles dēļ viena zivs sver 71 gramu, otrā narkotika - 70 gramus utt. Šajā gadījumā 300 ir “joprojām” liels novirzes rādītājs, taču mums nevajadzētu atmest šo atskaites punktu, jo, pieņemot, ka tas tika iegūts bez kļūdām, tas ir panākums pētījumā. Zāles, kuru dēļ zivis var svērt 300 gramus, darbojas labāk nekā visas citas zāles, tāpēc šis atskaites punkts patiesībā ir "vissvarīgākais" mūsu datu kopā, nevis "vismazākais"

Ieteicams: