Tw-city.info

IT Новости
8 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Как рассчитать доверительный интервал в excel

Функция ДОВЕРИТ

В этой статье описаны синтаксис формулы и использование достоверности . функция в Microsoft Excel.

Описание

Возвращает доверительный интервал для среднего генеральной совокупности с нормальным распределением.

Доверительный интервал — это диапазон значений. Примерное среднее значение x — это центр этого диапазона, а диапазон — x ± достоверности. Например, если x — это выборочное среднее время доставки продуктов, заказанных по почте, то ДОВЕРИТЕЛЬный интервал x ± является диапазоном Генеральной совокупности. Для любого математического ожидания Генеральной совокупности, μ0 в этом диапазоне, вероятность получения выборочного среднего из μ0, чем x, больше альфа-канала; для любого математического ожидания Генеральной совокупности, μ0, а не в этом диапазоне, вероятность получения выборочного среднего из μ0, чем x, меньше альфа-канала. Другими словами, предположим, что мы используем x, standard_dev и size для создания двустороннего теста на уровне значимости предположения о том, что среднее Генеральной совокупности является μ0. Затем мы не будем отклонять эту гипотезу, если μ0 находится в пределах доверительного интервала и отклонили эту гипотезу, если μ0 не находится в пределах доверительного интервала. Доверительный интервал не позволяет нам определить вероятность 1 – альфа-канала, после которого наш следующий пакет займет время доставки в течение доверительного интервала.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые обеспечивают более высокую точность и имеют имена, лучше отражающие их назначение. Хотя эта функция все еще используется для обеспечения обратной совместимости, она может стать недоступной в последующих версиях Excel, поэтому мы рекомендуем использовать новые функции.

Чтобы узнать больше о новых функциях, см. в разделах Функция ДОВЕРИТ.НОРМ и Функция ДОВЕРИТ.СТЬЮДЕНТ.

Синтаксис

Аргументы функции ДОВЕРИТ описаны ниже.

Альфа — обязательный аргумент. Уровень значимости, используемый для вычисления доверительного уровня. Доверительный уровень равен 100*(1 — альфа) процентам или, иными словами, значение аргумента «альфа», равное 0,05, означает 95-процентный доверительный уровень.

Стандартное_откл — обязательный аргумент. Стандартное отклонение генеральной совокупности для диапазона данных, предполагается известным.

Размер — обязательный аргумент. Размер выборки.

Замечания

Если какой-либо из аргументов не является числом, функция ДОВЕРИТ возвращает #VALUE! значение ошибки #ЗНАЧ!.

Если альфа-канал ≤ 0 или ≥ 1, то функция ДОВЕРИТ Возвращает #NUM! значение ошибки #ЗНАЧ!.

Если Standard_dev ≤ 0, то функция ДОВЕРИТ возвращает значение #NUM! значение ошибки #ЗНАЧ!.

Если значение аргумента «размер» не является целым числом, оно усекается.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Доверительные интервалы в Excel: значение, определение, построение и расчет

Расширенные функции Excel предлагают незаменимые и удобные методы для различных статистических расчетов и анализа. Одной из таких особенностей является интервал доверия, который используется для выражения степени неопределенности, связанной с исследованием. Доверительные интервалы в excel — это оценка событий в сочетании с верификацией вероятностей. Они обеспечивают вероятный диапазон выборочной пропорции или выборочного среднего от истинной доли / среднего, найденного в популяции и отображаются как: оценка +/- погрешность.

Функция доверительного интервала

В любом опросе и исследовании доверительные интервалы — отличный способ понять роль ошибок выборки в средних процентных показателях. Для любого опроса, поскольку исследователи всегда лишь изучают долю из более крупного расчета, в их оценках есть неопределенность, из-за чего будут ошибки выборки.

Доверительный интервал (ДИ) дает понимание о том, насколько средняя величина может колебаться. Он представляет собой диапазон значений, которые одинаково центрированы от известного среднего числа выборки. Чем выше уровень доверия (в процентах), тем меньше интервал, более точными будут результаты. Исследование образцов с большей изменчивостью или большим стандартным отклонением порождает более широкие доверительные интервалы в excel.

Существует соотношение обратного квадратного корня между ДИ и размерами выборки. Меньшие размеры генерируют более широкие ДИ, поэтому для получения более точных оценок или сокращения пороговой погрешности наполовину, необходимо примерно в четыре раза увеличить размер выборки.

Построение среднего значения совокупности

Чтобы построить доверительный интервал для среднего значения совокупности, предоставленной вероятности и размера выборки, нужно применить функцию «ДОВЕРИТ» в Excel, которая использует нормальное распределение для вычисления значения доверия. Предположим, исследователи случайно выбрали 100 человек, измерили их вес и установили средний в 76 кг. Если нужно узнать средний показатель для людей в конкретном городе, маловероятно, что он для более крупной группы будет иметь такое же среднее значение, как и выборка, состоящая всего из 100 человек.

Гораздо более вероятно, что выборочное среднее в 76 кг может быть приблизительно равно (неизвестному) популяционному среднему, и нужно знать, насколько точным является оценочный ответ. Эта неопределенность, связанная с оценкой интервалов, называется уровнем достоверности, обычно 95%. Функция «ДОВЕРИТ» (альфа, сигма, n) возвращает значение, используемое для построения ДИ среднего числа совокупности. Предполагается, что данные выборок соответствуют стандартным нормальным распределениям с известной сигмой стандартного отклонения, а размер выборки равен n. Перед тем как рассчитать доверительный интервал в excel 95% уровня, принимают альфу как 1 — 0,95 = 0,05.

Читать еще:  Как добавить рисунок в excel

Форматы функции CONFIDENCE

Функция CONFIDENCE или ДОВЕРИТ, определяется пределами доверия — это нижняя и верхняя границы ДИ и являются 95% показателями. Например, при изучении предпочтении, было обнаружено, что 70% людей предпочитают Боржоми , по сравнению с Пепси при ДИ в 3% и уровнем доверия 95%, тогда существует 95-процентная вероятность того, что истинная пропорция составляет от 67 до 73%.

Функции «ДОВЕРИТ» отображаются под различными синтаксисами в разных версиях Excel. Например, Excel 2010 имеет две функции: «ДОВЕРИТ.НОРМ» и «ДОВЕРИТ.T», которые помогают вычислять ширину «ДИ. ДОВЕРИТ.НОРМ» используется, когда известно стандартное отклонение измерения. В противном случае применяется «ДОВЕРИТ.T», оценка осуществляется по данным выборки. Доверительные интервалы в excel до 2010 года имели только функцию «ДОВЕРИТ». Его аргументы и результаты были аналогичными аргументам функции «ДОВЕРИТ.НОРМ».

Первый по-прежнему доступен в более поздних версиях Excel для обеспечения совместимости. #NUM! Error — происходит, если альфа меньше или равна 0, или больше или равна 0. Данное стандартное отклонение меньше или равно 0. Указанный размер аргумента меньше единицы. #СТОИМОСТЬ! Error — происходит, если любой из предоставленных аргументов не является числовым.

Функция интерполяции доверия

«ДОВЕРИТ.» классифицируется по функциям статистики и будет высчитывать и возвращать ДИ для среднего значения. Доверительные интервалы в excel могут быть чрезвычайно полезными для финансового анализа. Как аналитик, «ДОВЕРИТ.» помогает в прогнозировании и корректировке для широкого круга целей, путем оптимизации принятия финансовых решений. Это выполняется с применением графического отображения данных в наборе переменных.

Аналитики могут принимать более эффективные решения на основе статистической информации, предоставляемой нормальным распределением. Например, они могут найти связь между полученным доходом и расходами, затрачиваемыми на предметы роскоши. Чтобы вычислить ДИ для среднего значения совокупности, возвращаемое доверительное значение, должно быть добавлено и вычтено из среднего значения выборки. Например, для среднего значения выборки x: Доверительный интервал = x ± ДОВЕРИТ.

Пример расчета доверительного интервала в excel — предположим, что нам даны следующие данные:

  1. Уровень значимости: 0,05.
  2. Стандартное отклонение населения: 2,5.
  3. Размер выборки: 100.

Функция доверительного интервала Excel используется для расчета ДИ со значением 0,05 (т. е. уровень достоверности 95%) для среднего времени выборки для изучения времени коммутации в офисе на 100 человек. Среднее значение образца составляет 30 минут, а стандартное отклонение составляет 2,5 минуты. Доверительный интервал составляет 30 ± 0,48999, что соответствует диапазону 29,510009 и 30,48999 (минут).

Интервалы и нормальное распределение

Наиболее знакомое использование доверительного интервала, означает «погрешность ошибок». В опросах погрешность составляет плюс или минус 3%. ДИ полезны в контекстах, которые выходят за рамки этой простой ситуации. Они могут использоваться с ненормальными распределениями, которые сильно искажены. Для вычисления прогноза доверительного интервала в excel требуются следующие строительные блоки:

  1. Среднее значение.
  2. Стандартное отклонение наблюдений.
  3. Число опросов в выборке.
  4. Уровень доверия, который нужно применить к ДИ.

Перед тем как построить доверительный интервал в excel, изучают его вокруг среднего значения выборки, начинают с принятия решения о том, какой будет принят процент других средств выборки, если они были собраны и рассчитаны в этом интервале. Если это так , то 95% возможных образцов будут захвачены ДИ с 1,96 стандартных отклонений выше и ниже образца.

Стандартная ошибка среднего

Допустимый интервал или погрешность не принимаются с учетом ошибки измерения или смещения обзора, поэтому фактическая неопределенность может быть выше, чем указана. Перед тем как посчитать доверительный интервал в excel, расчет должен быть обеспечен хорошим сбором данных, надежными измерительными системами и удовлетворительным дизайном обследования.

Доверительные интервалы для среднего значения могут быть получены несколькими способами: с помощью SigmaXL, описательной статистики, гистограмм,1-образного t-теста и интервалов доверия, односторонних диаграмм ANOVA и Multi-Vari. Чтобы графически иллюстрировать ДИ для среднего значения «Удовлетворенность», создают диаграмму Multi-Vari (с 95% CI Mean Options) с использованием данных Customer Data.xls. Точки соответствуют отдельным данным. Маркеры показывают максимальный доверительный предел 99%, и средний 95%-ый предел.

Теперь тестирование гипотезы будут использоваться для более точных средних оценок удовлетворенности и определения статистическая значимость результатов.

Расчет с помощью SigmaXL

Доверительные интервалы очень важны для понимания полученных данных и принятия решений по ним. Чтобы рассчитать ДИ для дискретной пропорции, используют SigmaXL> Шаблоны и калькуляторы> Основные статистические шаблоны> 1 интервал доверительных отношений. Перед тем как найти доверительный интервал в excel, выполняют следующие действия:

  1. Открыть Client Data.xls.
  2. Нажать вкладку «Лист 1» или F4, чтобы активировать последний рабочий лист. Нажать SigmaXL> Статистические инструменты> Описательная статистика.
  3. Установить флажок «Использовать всю таблицу данных».
  4. Нажать «Далее».
  5. Выбрать «Общая удовлетворенность», нажать «Числовые переменные данных» (Y).
  6. Выбрать «Тип клиента», нажать «Категория группы» (X1). По умолчанию уровень доверия 95%.
  7. Нажать «ОК».

Обратить внимание, что доверительный интервал в 95% означает: в среднем истинный параметр популяции (средний, стандартное отклонение или пропорция) будет находиться в интервале 19 раз из 20. Будет представлен пользователю: 95%-ый доверительный интервал для каждого отсчета. Среднее значение (95% CI). Доверительный интервал 95% для стандартного отклонения (95% CI Sigma — не путать это с уровнем качества Sigma Process).

Читать еще:  Как узнать количество видеопамяти

Статистика и уровни доверия

Доверительный интервал не является числом, в котором истинное значение параметра найдено с точностью. Действительно, случайная величина теоретически может принимать все возможные значения в рамках законов физики. Доверительный интервал — это фактически область, в которой истинное (неизвестное) значение параметра, изучаемого в популяции, наиболее вероятно с вероятностью, которую выбирают. При его использовании интервал основан на вычислении доверительного порога, погрешности и коэффициента запаса.

Перед тем как определить доверительный интервал в excel, определяют эти элементы, которые зависят от параметров:

  1. Изменчивости измеряемых характеристик.
  2. Размера выборки: чем она больше, тем более высокая точность.
  3. Метода отбора проб.
  4. Уровень доверия — s.

Уровень доверия представляет собой гарантированную уверенность. Например, с уровнем достоверности 90%, это означает, что 10% риск будет неправильным. Как правило, хорошей практикой является выбор достоверности в 95%. Таким образом, максимальный доверительный уровень является большим, чем больше размер выборки. Маржинальный коэффициент является индикатором, выведенным непосредственно из доверительного порога. В таблице приведены некоторые примеры для наиболее распространенных значений.

Пример использования функции MS EXCEL ДОВЕРИТ для расчёта доверительный интервала единичного и среднего

Функция ДОВЕРИТ(рис. 6.1) по данным выборкиопределяет половину доверительного интервала для единичного значения xi генеральной совокупности (аргумент «Размер» = 1, см. рис. 6.1) или для среднего значения выборки (аргумент «Размер» равен объёму выборки n).

Рис. 6.1. Аргументы функции ДОВЕРИТ

Выборочное среднее является серединой этого интервала, следовательно, доверительный интервал определяется как ( ± ), где — результат расчёта с использованием функции ДОВЕРИТ. Например, если — выборочное среднее значение размера детали, то математическое ожидание генеральной совокупности размера этой детали μ (или единичное значение , см ниже) с заданной доверительной вероятностью (например, 95%, что соответствует уровню значимости α = 0,05) принадлежит интервалу ( ± ). Для любого математического ожидания μ, не принадлежащего интервалу ( ± ), вероятность того, что выборочное среднее (или единичное значение , см ниже) отличается от μ более чем на , меньше заданной доверительной вероятности (

Величина ДОВЕРИТ зависит от величины СКО, заданной вероятности и размера выборки. Зависимость от n определяется выражением:

(6.3)

где — результат расчёта функции ДОВЕРИТ для выборки размером n, — результат расчёта функции ДОВЕРИТ для единичного значения.

То есть результат расчёта функции ДОВЕРИТ для единичного значения в раз больше, чем ДОВЕРИТ для среднего значения выборки, т.к. таким же образом различаются их стандартные отклонения, см. формулу 3.7.

Пример 1.Выполнить расчёт величины доверительного интервала единичного и выборочного среднего размера детали с использованием функции MS EXCEL ДОВЕРИТ по данным примера предыдущего параграфа: σ = 0,03 мм, g = 0,95 (α =0,05), n = 36.

Подставляем в аргументы функции ДОВЕРИТ (см. рис. 6.1) σ, α и «размер»

Получаем для единичного (размер n = 1) и среднего (размер n = 36) следующие значения величины доверительного интервала:

Как рассчитать доверительный интервал в Excel

Алгоритм расчета доверительного интервала
Основной задачей данного расчета является избежать погрешностей точечной оценки. Более целесообразно находить возможный интервал данных, в которых может находиться искомая величина. То есть с помощью доверительного интервала можно сделать более точный статистический вывод о вероятности нахождения определенного параметра в определенном массиве данных.

Программа Excel предоставляет возможность определить, какой будет доверительный интервал при известной дисперсии, путем применения алгоритма функции ДОВЕРИТ. НОРМ, а также с помощью ДОВЕРИТ. СТЮДЕНТ функции вычислить доверительный интервал при неизвестной дисперсии. В этих двух вариантах и заключаются возможности Excel решать подобные задачи.
Рассмотрим вариант с известной дисперсией.

Следует сказать, что в более ранних версиях Excel существовала только одна функция под названием ДОВЕРИТ, и все ниже описанные функции являются производными от этой функции, которые стало возможно применять только в Excel версии 2010 года.
Рассматриваемая формула решения призвана решать задачи по определению доверительного интервала в условиях нормального распределения средней генеральной совокупности.

Ниже на рисунке показан синтаксис аргумента функции, а также расшифровка данных.

Если посмотреть синтаксис функции ДОВЕРИТ и сравнить его с синтаксисом ДОВЕРИТ.НОРМ, то мы увидим, что разница между ними только в названии. Основные аргументы предложенных к сравнению функций одни и те же.

Пример расчета доверительного интервала
В нашем примере количество испытаний равно 12, у всех испытаний различные данные результата. Все они отображены в табличной форме. Эти данные и есть та самая совокупность данных. Значение стандартного отклонения равно восьми.
Уровень доверия при расчете доверительного интервала берем в процентах и оно равно 97%.
Теперь переходим к манипуляциям в Excel. Нам необходимо определится с ячейкой в которой будет зафиксирован результат вычислений. Выделяем эту ячейку и делаем как показано на рисунке. В окне рядом со значком «функция» вставляем нужную функцию.

Перед нашим взором появится окно. В котором нам необходимо заполнить необходимые и обязательные данные.
На рисунке показано куда вставлять необходимые данные. В первые две строки вставляем значения Альфа=0.003, в станд_откл вставляем 8. Со следующей строкой вроде тоже все понятно – ставим число двенадцать и вроде все сделано.Однако, что бы постоянно не менять в будущих расчетах эту переменную, а она постоянно меняется, предлагаем автоматизировать установку переменного значения.

Читать еще:  Базовый видеоадаптер майкрософт скачать драйвер

Для этого в поле «Размер» вставим функцию «СЧЕТ», которая будет определять нужные нам данные автоматически.
Что бы завести «СЧЕТ» и настроить данную функцию, совершаем следующие действия.
1.Курсор мышки наводим на строку «размер» и активируем треугольник, расположенный с левой стороны от формул. После этих действий вы увидите окно с перечнем определенных функций. Нам нужны «другие»

На этом описание создания доверительного интервала с помощью функции ДОВЕРИТ.НОРМ заканчивается.
Другой способ основанный на применении фикции ДОВЕРИТ.СТЮДЕН будет описан в другой статье:
Как рассчитать доверительный интервал в Excel при не известной дисперсии

Способы расчета доверительного интервала

Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов. Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал. Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.

Способы расчета доверительного интервала

Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.

Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.

Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:

  • через медиану и среднеквадратическое отклонение;
  • через критическое значение t-статистики (коэффициент Стьюдента).

Этапы сравнительного анализа разных способов расчета ДИ:

1. формируем выборку данных;

2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;

3. рассчитываем доверительный интервал двумя способами;

4. анализируем очищенные выборки и полученные доверительные интервалы.

Этап 1. Выборка данных

Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».

Таблица 1. Исходная выборка

Цена 1 кв.м., д.е.

Рис.1. Исходная выборка


Этап 2. Обработка исходной выборки

Обработка выборки методами статистики требует вычисления следующих значений:

1. Среднее арифметическое значение

2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы

(для выборки, имеющей нечетное число значений)

3. Размах – разница между максимальным и минимальным значениями в выборке

4. Дисперсия – используется для более точного оценивания вариации данных

5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.

6. Коэффициент вариации – отражает степень разбросанности значений корректировок

7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней

Таблица 2. Статистические показатели исходной выборки

Показатель

Значение

Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.

Этап 3. Расчёт доверительного интервала

Способ 1. Расчёт через медиану и среднеквадратическое отклонение.

Доверительный интервал определяется следующим образом: минимальное значение — из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.

Формула доверительного интервала:

Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 1.


Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)

С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента. При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99. При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).

Формула доверительного интервала:

n — объем выборки;

— критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel ( →»Статистические»→ СТЬЮДРАСПОБР);

∝ — уровень значимости, принимаем ∝=0,01.

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 2.

Этап 4. Анализ разных способов расчета доверительного интервала

Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.

Таблица 3. Статистические показатели по трем выборкам.

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector