Интервали на доверие в Excel: стойност, определение, конструкция и изчисление

Anonim

Разширените функции на Excel предлагат незаменими и удобни методи за различни статистически изчисления и анализи. Една от тези характеристики е доверителният интервал, който се използва за изразяване на степента на несигурност, свързана с изследването. Интервалите на доверие на Excel са резултати от събития, комбинирани с проверка на вероятността. Те осигуряват вероятния обхват на пропорцията на извадката или средната стойност на извадката от действителния дял / средна стойност, открити в популацията, и се показват като: +/- оценка на грешката.

Функция интервал на доверие

Във всяко проучване и проучване, доверителните интервали са чудесен начин да се разбере ролята на грешките в извадката в средните проценти. За всяко изследване, тъй като изследователите винаги проучват само част от по-голямото изчисление, има несигурност в техните оценки, което ще предизвика грешки при вземането на проби.

Интервалът на доверие (CI) дава представа за това как средната стойност може да варира. Това е диапазон от стойности, които са еднакво центрирани на известен среден брой проби. Колкото по-високо е нивото на доверие (в проценти), толкова по-малък е интервалът, толкова по-точни са резултатите. Изследването на проби с по-голяма вариабилност или по-голямо стандартно отклонение генерира по-широки доверителни интервали в excel.

Има съотношение на обратния квадратен корен между DI и размера на извадката. По-малките размери генерират по-широки КИ, така че за да получите по-точни оценки или да намалите прага на грешката наполовина, трябва да увеличите размера на извадката с около четири пъти.

Изграждане на средната стойност на населението

За да се изгради доверителен интервал за средната стойност на населението, дадена вероятност и размер на извадката, трябва да използвате функцията CONFIDENCE в Excel, която използва нормалното разпределение за изчисляване на стойността на доверието. Да предположим, че изследователите случайно са избрали 100 души, измерили теглото си и задали средно 76 кг. Ако искате да знаете средния за хората в даден град, малко вероятно е за по-голяма група да има същата средна стойност като извадка от само 100 души.

Много по-вероятно е една проба средна стойност от 76 кг да бъде приблизително равна на (неизвестната) средна популация и трябва да знаете колко точна е оценката на отговора. Тази несигурност, свързана с интервална оценка, се нарича ниво на доверие, обикновено 95%. Функцията "CONFIDENCE" (алфа, сигма, n) връща стойността, използвана за конструиране на DI на средния брой на населението. Предполага се, че данните от извадката отговарят на стандартните нормални разпределения с познато стандартно отклонение сигма, а размерът на извадката е n. Преди да изчислим доверителния интервал в нивото от 95%, вземете алфа като 1 - 0.95 = 0.05.

Формати за функционалност

Функцията CONFIDENCE или CONFIDENCE се определя от лимитите на доверие - това са долната и горната граница на CI и са 95% показатели. Например, при изучаване на предпочитанията, беше установено, че 70% от хората предпочитат Боржоми, в сравнение с Pepsi с ID от 3% и ниво на доверие от 95%, тогава има 95% вероятност, че истинският дял е от 67 до 73%.

Функциите "CONFIDENCE" се показват под различни синтаксиси в различни версии на Excel. Например, Excel 2010 има две функции: „CONFIDENCE.NORM“ и „CONFIDENCE.T“, които помагат да се изчисли ширината на „DI. CONFIDENCE.NORM“, когато стандартното отклонение на измерването е известно. В противен случай се прилага „TRUST T.“, оценката се извършва съгласно данните от извадката. Доверителните интервали в excel до 2010 г. имат само функцията "CONFIDENCE". Аргументите и резултатите му са подобни на аргументите на функцията "CONFIDENCE.NORM".

Първият все още е наличен в по-късни версии на Excel за съвместимост. #NUM! Грешка - ако алфата е по-малка или равна на 0 или по-голяма или равна на 0. Това стандартно отклонение е по-малко или равно на 0. Определеният размер на аргумента е по-малък от един. # COST! Грешка - ако някой от представените аргументи не е числов.

Функция за доверителна интерполация

"Доверие". класифицирани по статистически функции и ще изчисли и върне CI за средната стойност. Интервалите на доверие на Excel могат да бъдат изключително полезни за финансов анализ. Като анализатор, "ДОВЕРИЕ". помага при прогнозиране и адаптиране за широк кръг от цели, чрез оптимизиране на вземането на финансови решения. Това се прави с помощта на графично представяне на данните в набора от променливи.

Анализаторите могат да вземат по-добри решения въз основа на статистическа информация, предоставена от нормалното разпределение. Например, те могат да намерят връзка между спечелените доходи и разходите за луксозни предмети. За изчисляване на DI за средната стойност на популацията, стойността на връщаната доверие трябва да бъде добавена и извадена от средната стойност на пробата. Например, за средната стойност на пробата x: Интервал на доверие = x ± TRUST.

Пример за изчисляване на доверителния интервал в excel - да предположим, че ни се дават следните данни:

  1. Ниво на значимост: 0.05.
  2. Стандартно отклонение на населението: 2.5.
  3. Размер на пробата: 100.

Функцията за доверителен интервал на Excel се използва за изчисляване на CI със стойност 0.05 (т.е. ниво на достоверност от 95%) за средното време на извадката за проучване на времето за превключване в офиса за 100 души. Средната стойност на пробата е 30 минути, а стандартното отклонение е 2, 5 минути. Доверителният интервал е 30 ± 0.48999, което съответства на обхвата от 29.510009 и 30.48999 (минути).

Интервали и нормално разпределение

Най-познатото използване на доверителния интервал означава "грешка на грешката". В анкетите грешката е плюс или минус 3%. ДИ са полезни в контекст, който надхвърля тази проста ситуация. Те могат да се използват с анормални разпределения, които са силно изкривени. За изчисляване на прогнозния доверителен интервал в excel са необходими следните блокове:

  1. Средна стойност
  2. Стандартно отклонение на наблюденията.
  3. Броят на анкетите в извадката.
  4. Нивото на доверие, което трябва да приложите към CI.

Преди да се изгради доверителен интервал в excel, да се изследва около средната стойност на извадката, започнете с решение какъв процент от другите инструменти за вземане на проби ще бъдат приети, ако са събрани и изчислени в този интервал. Ако случаят е такъв, тогава 95% от възможните проби ще бъдат уловени от DI с 1.96 стандартни отклонения над и под пробата.

Стандартна грешка на средната стойност

Допустимият интервал или грешка не се взема предвид грешката на измерването или отклонението от прегледа, така че действителната несигурност може да бъде по-висока от посочената. Преди изчисляването на доверителния интервал в excel, изчислението трябва да бъде осигурено с добро събиране на данни, надеждни системи за измерване и задоволителен дизайн на изследването.

Интервалите на доверие за средната стойност могат да бъдат получени по няколко начина: като се използва SigmaXL, описателна статистика, хистограми, 1-t-тест и доверителни интервали, еднопосочна ANOVA и Multi-Vari диаграми. За графично илюстриране на DI за средната стойност на Satisfaction, създайте Multi-Vari диаграма (с 95% CI Mean Options), използвайки Data Data.xls данни. Точките съответстват на индивидуалните данни. Маркерите показват максимална доверителна граница от 99% и средно 95% лимит.

Сега тестването на хипотезата ще се използва за по-точни средни оценки на удовлетвореността и за определяне на статистическата значимост на резултатите.

Изчисляване със SigmaXL

Доверителните интервали са много важни за разбирането на данните и вземането на решения за тях. За да изчислите CI за дискретни пропорции, използвайте SigmaXL> Шаблони и калкулатори> Основни статистически шаблони> 1 доверителен интервал. Преди да откриете доверителния интервал в excel, направете следното:

  1. Отворете клиентските данни.xls.
  2. Щракнете върху раздела Лист 1 или F4, за да активирате последния работен лист. Щракнете върху SigmaXL> Статистически инструменти> Дескриптивна статистика.
  3. Поставете отметка в квадратчето „Използвайте цялата таблица с данни“.
  4. Кликнете върху „Напред“.
  5. Изберете „Общо удовлетворение“, щракнете върху „Числови променливи данни“ (Y).
  6. Изберете „Тип на клиента“, щракнете върху „Категория на групата“ (X1). Нивото на доверие по подразбиране е 95%.
  7. Кликнете върху „OK“.

Имайте предвид, че 95% доверителен интервал означава: средно, истинският популационен параметър (средно, стандартно отклонение или пропорция) ще бъде в интервала 19 пъти от 20. Той ще бъде представен на потребителя: 95% доверителен интервал за всяка проба. Средна стойност (95% CI). 95% доверителен интервал за стандартно отклонение (95% CI Sigma) не смесва това с нивото на качеството на процеса Sigma.

Статистика и нива на доверие

Доверителният интервал не е число, при което истинската стойност на параметъра се намира с точност. Всъщност, случайна величина теоретично може да приеме всички възможни стойности в рамките на законите на физиката. Интервалът на доверие всъщност е областта, в която истинската (неизвестна) стойност на изследвания параметър в популацията е най-вероятно с избраната вероятност. Когато се използва, интервалът се основава на изчисляването на прага на достоверност, грешката и коефициента на безопасност.

Преди да определите доверителния интервал в excel, дефинирайте тези елементи, които зависят от параметрите:

  1. Променливост на измерените характеристики.
  2. Размер на пробата: колкото по-голяма е, толкова по-голяма е точността.
  3. Метод на вземане на проби.
  4. Ниво на доверие.

Нивото на доверие е гарантирано доверие. Например, при ниво на доверие от 90%, това означава, че рискът от 10% би бил погрешен. Като правило е добра практика да се избира доверие от 95%. По този начин максималното ниво на достоверност е по-голямо, колкото по-голям е размерът на извадката. Коефициентът на марж е показател, получен директно от прага на доверие. Таблицата показва някои примери за най-често срещаните стойности.

Ниво на доверие s

Коефициент на маржин при n> 30

80%

1.28

85%

1.44

90%

1645

95%

1.96

96%

2.05

98%

2.33

99%

2575

Индикатори за изчисление

В случай, когато трябва да се изчисли средната стойност на популацията от неговата извадка, определете доверителния интервал. Тя зависи от размера на извадката и закона на променливата. Формулата за изчисляване на доверителния интервал в excel е следната:

  1. Долната граница на интервала = среден пробег - коефициент на полето * стандартна грешка.
  2. Горна граница на обхвата = приблизителна средна стойност + коефициент на полето * стандартна грешка.
  3. Стойността на t ще зависи от размера на пробата: n> 30: коефициента на безопасност на нормалния закон, наречен z. n <30: коефициент на безопасност, наречен t за n-1.

В тази ситуация съответните единици са средни стойности. Изследователят трябва да знае стандартното отклонение не от първоначалните и индивидуалните наблюдения, а от средствата, които са изчислени въз основа на тях. Това отклонение има име - стандартна грешка на средната стойност.

Ленти за грешки

Изгледите за вариабилност на данните се използват за графики, за да посочат грешки или несигурности при измерването. Те дават обща представа за това, колко точно е измерването, или, обратно, колко далеч от отчетената истинска стойност и са подредени под формата на грешки. Те представляват едно стандартно отклонение на неопределеността, една стандартна грешка или определен доверителен интервал (например интервал от 95%). Тези стойности не съвпадат, затова избраната мярка трябва да бъде посочена в графиката или в текста.

За да се сравнят две стойности, могат да се използват ленти с грешки, ако са изпълнени статистически значими условия. Грешките показват приемливостта на съответстващата функция, т.е. колко добре тя описва данните. Научните разработки в експерименталните науки включват грешки на всички графики, въпреки че практиката е малко по-различна и всеки изследовател има свой собствен стил на грешки.

Грешките за грешки могат да се използват като интерфейс за директна манипулация за контролиране на вероятностни алгоритми за приблизително изчисление. Лентите за грешки могат да бъдат изразени в плюс или минус (±). Плюс - горната граница и минус - долната граница на грешката.

Критичен калкулатор

За правилното определение на CI има онлайн калкулатори, които значително опростяват работата. Започнете процеса на определяне с избор на данни. Тя е в основата на всички изследвания. Надеждното вземане на проби ви помага да взимате уверено бизнес решения. Първият въпрос, който трябва да бъде решен, е правилното определяне на целевата група, то е от решаващо значение. Ако изследовател проведе изследване с хора извън тази група, не е възможно успешно да се изпълни задачата. Следващата стъпка е да се реши колко хора са нужни за интервюто.

Експертите знаят, че малка представителна извадка ще отразява мненията и поведението на групата, от която е съставена. Колкото по-голяма е пробата, толкова по-точно тя представлява целевата група. Скоростта на подобрение на точността обаче намалява с увеличаването на размера на извадката. Например увеличение от 250 на 1000 удвоява точността. Вземете решение за размера на извадката въз основа на фактори като: налично време, бюджет и необходимата степен на точност.

Има три фактора, които определят размера на ПО за това ниво на доверие:

  • размер на пробата;
  • процент на вземане на проби;
  • размер на населението.

Ако 99% от респондентите са казали „Да” и 1% са отговорили с „Не”, вероятността за грешка е малка, независимо от размера на извадката. Въпреки това, ако процентите са 51 и 49%, вероятността за грешка е много по-висока. По-лесно е да бъдете уверени в крайните отговори, отколкото в средата. Когато определяте размера на пробата, необходима за дадено ниво на точност, трябва да използвате най-лошия процент (50%).

По-долу е представена формулата за изчисляване на доверителния интервал в извадката excel на онлайн калкулатор.

Изчисленията на доверителния интервал показват, че съществува реална случайна извадка от съответната популация. Ако проучването не е случайно, не можете да разчитате на интервалите. Неслучайните проби обикновено възникват от недостатъци в процедурата.

Създаване на линейни графики

Създаването на график на доверителен интервал в Excel е относително просто. Първо създайте линейна диаграма. След това с избрания ред изберете Инструменти на диаграмите> Оформление> Бар за грешки> Разширени настройки на панела. В появилото се изскачащо меню можете да изберете или положителни или отрицателни ленти за грешки, или и двете. Можете да изберете стил и да изберете сумата, която искате да покажете. Това може да бъде фиксирана стойност, процент, стандартно отклонение или регулируем диапазон.

Ако данните имат стандартно отклонение за всяка точка по подразбиране, изберете потребителски и кликнете върху бутона „Определяне на стойността“. След това се появява друго изскачащо меню и можете да изберете диапазон от клетки за позитивни и отрицателни панели.

Редът на строителните диаграми:

  1. Подгответе данните. Първо, в допълнение към средните стойности, се изисква изчисление на стандартното отклонение (или грешка).
  2. След това в ред 4 трябва да се изчисли горната граница на групата, т.е. за B4 изчислението ще бъде: = B2 + B3 В ред 5 трябва да се изчисли долната граница на обхвата, т.е. за B5 изчислението ще бъде: = B2-B4
  3. Създайте график. Изберете редовете 1, 2, 4 и 5 от таблицата и след това щракнете върху "Вмъкни"> "Графика"> "Графика на линията". Excel ще създаде линейна диаграма.
  4. Премахнете легендата и линиите на мрежата.
  5. След това щракнете с десния бутон върху горната група от диапазони и изберете Change Chart Type.
  6. Форматирайте диапазоните на доверието. За да завършите диаграмата, просто форматирайте горната серия със синьо запълване (в съответствие със синята линия), а най-долната серия с бяло запълване.

В тази диаграма е лесно да се видят границите на грешките, но ако има много данни, изгледът ще бъде непостоянен. На пръв поглед, границата на доверие е много по-очевидна, като се има предвид средната стойност на извадката, и тя ще стане все по-строга с увеличаването на броя на пробите.