Главная страница Случайная страница Разделы сайта АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Сохранение новых переменных⇐ ПредыдущаяСтр 29 из 29
Рисунок 16-4 Диалоговое окно Линейная регрессия: Сохранить
Предсказанные значения, остатки и другие статистики, полезные для диагностики, можно сохранить. Выбор каждого из перечисленных ниже пунктов добавляет к активному файлу данных одну или несколько переменных. Предсказанные значения. Значения, которые регрессионная модель предсказывает для каждого наблюдения. ? Нестандартизованные. Значение зависимой переменной, предсказываемое в соответствии с моделью. ? Стандартизованные. Преобразование каждого предсказанного значения в стандартизованную форму. То есть, из каждого предсказанного значения вычитают среднее предсказанное значение, и полученную разность делят на стандартное отклонение предсказанного значения. Среднее стандартизованных предсказанных значений равно 0, а стандартное отклонение 1. ? Скорректированные. Предсказываемое значение для наблюдения, при условии, что это наблюдение не используется при вычислении коэффициентов регрессии. ? Стд. ошибка средних. Стандартные ошибки предсказанных значений. Оценка стандартного отклонения среднего значения зависимой переменной для наблюдений с одинаковыми значениями независимых переменных. Расстояния. Меры, выявляющие наблюдения с необычными комбинациями значений независимых переменных и наблюдения, которые могут оказать большое влияние на регрессионную модель. ? Махаланобиса. Мера того, насколько значения наблюдений для независимых переменных отклоняются от среднего по всем наблюдениям. Большое расстояние Махаланобиса означает, что наблюдение содержит экстремальные значения в одной или более независимых переменных. ? Кука. Для каждого наблюдения показывает насколько изменятся остатки всех наблюдений, если это наблюдение не использовать при вычислении коэффициентов регрессии. Большое расстояние Кука указывает на то, что исключение данного наблюдения из вычислений регрессии существенно меняет коэффициенты. ? Разбалансировка. Измеряют влияние точки на согласие регрессионной модели. Центрированные балансировки изменяются от 0 (не влияет) до (N-1)/N. Интервалы предсказания. Верхние и нижние границы интервалов предсказания для среднего и отдельного значения. ? Среднее. Нижняя и верхняя границы (две переменные) интервала предсказания для среднего предсказываемого отклика. ? Для отдельных значений. Нижняя и верхняя границы (две переменные) для интервала предсказания зависимой переменной для отдельного наблюдения. ? Доверительный интервал. Введите значение от 1 до 99, 99, чтобы задать доверительный уровень для двух интервалов предсказания. Перед вводом этого значения необходимо выбрать Среднее или Отдельное значение. Типичные значения доверительного уровня - 90, 95 и 99. Остатки. Фактическое значение зависимой переменной минус предсказанное регрессионным уравнением. ? Нестандартизованные. Разность между наблюдаемым и предсказанным моделью значением. ? Стандартизованные. Остаток, деленный на оценку его стандартного отклонения. Стандартизованные остатки, известные еще как пирсоновские, имеют среднее 0 и стандартное отклонение 1. ? Стьюдентизированные. Остаток, деленный на его оцененное стандартное отклонение, меняющееся от наблюдения к наблюдению в зависимости от расстояния значений независимых переменных для данного наблюдения от средних независимых переменных. ? Удаленные. Остаток для наблюдения, когда данное наблюдение исключается при вычислении регрессионных коэффициентов. Это разность между значением зависимой переменной и скорректированным предсказанным значением. ? Стьюдентизированные удаленные. Остаток для удаленного наблюдения, деленный на его стандартную ошибку. Разность между стьюдентизированным остатком с удалением и соответствующим ему стьюдентизированным остатком указывает, насколько сильно исключение наблюдения влияет на предсказание для него самого. Статистики влияния. Изменение в регрессионных коэффициентах (DfBeta) и предсказанных значениях (DfFit), вызванное исключением из анализа конкретного наблюдения. Доступны также стандартизованные значения DfBeta и DfFit вместе с ковариационным отношением. ? DfBeta(s). Разница в значении бета — это изменение регрессионного коэффициента в результате исключения отдельного наблюдения. Значение вычисляется для каждого компонента модели, включая свободный член. ? Стандартизованные DfBeta. Стандартизованная разность значений бета. Изменение коэффициента регрессии при исключении отдельного наблюдения. Имеет смысл исследовать наблюдения, у которых модуль этого значения, больше, чем 2/корень квадратный из (N), где N - число наблюдений. Значение вычисляется для каждого компонента модели, включая свободный член. ? DfFit. Разница в величине подгонки — это изменение предсказанного значения в результате исключения отдельного наблюдения. ? Стандартизованные DfFit. Стандартизованная разность предсказанных значений. Изменение предсказанного значения при исключении отдельного наблюдения. Имеет смысл исследовать наблюдения, у которых модуль этого значения больше, чем 2 * корень квадратный из (p/N), где p - число параметров в модели, а N - число наблюдений. ? Ковариационное отношение. Отношение определителя ковариационной матрицы, вычисленного без данного наблюдения, к определителю ковариационной матрицы, вычисленной для всей выборки. Если это отношение близко к 1, данное наблюдение не влияет на ковариационную матрицу существенно. Статистики коэффициентов Сохраняет коэффициенты регрессии в наборе данных или файле данных. Наборы данных доступны для последующего использования в том же сеансе но не сохраняются как файлы до тех пор, пока они не будут сохранены явно до окончания текущего сеанса. Имена наборов данных должны удовлетворять требованиям к именам переменных. Экспортировать модель в формате XML Оценки параметров и их ковариации (если помечено) экспортируются в специальный файл в формате XML (PMML). Этот файл модели можно использовать для применения информации о модели к другим файлам данных с целью скоринга.
|