Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Сущность и условия применения многомерных статистических моделей






Многомерные статистические модели позволяют описать геологические объекты как системы множества взаимосвязанных признаков. Эти модели в геологии обычно изучают с помощью процедур многомерного корреляционного анализа, многомерного регрессионного анализа, кластерного, факторного, дискриминантного анализов.

В качестве математической модели значений комплекса признаков рассматривается многомерная случайная величина, которая часто называется случайным вектором. Многомерные модели подразуме­вают вероятность нормального статистического распределения рас­сматриваемых случайных величин или хотя бы возможности их нормализации. Однако статистические критерии для большинства процедур многомерного анализа разработаны при очень сильных ограничениях или основываются на логических соображениях. Неко­торые многомерные модели и методы (например, метод главных компонент и многие методы распознавания образов) вообще не имеют статистического обоснования, а критерии значимости для них еще не созданы.

Вследствие сложных стохастических взаимосвязей между изуча­емыми признаками (переменными) часто не удается принять пра­вильного решения относительно каждой из них. В таких случаях очень эффективно всестороннее исследование системы с выделением наиболее важных факторов, объединяющих влияние нескольких пе­ременных.

Многомерные методы статистических исследований сложны как с теоретических, так и с методологических позиций.

В большинстве многомерных геологических задач приходится иметь дело со сложными сочетаниями действующих факторов, которые не удается выделить в чистом виде и изучить изолированно. Тем не менее многомерные методы являются весьма перспективными и многообещающими средствами геологических исследований, по­скольку они позволяют геологу одновременно работать с большим числом переменных, чем он может осознать сам. Совместное изучение комплексов взаимосвязанных переменных (признаков) способствует выявлению дополнительной, часто весьма существенной, информации об изменчивости свойств изучаемых объектов и обеспечиваег воз­можность прогнозирования их неизвестных свойств.

Для работы с многомерными математическими моделями необхо­димо знание основ линейной алгебры, поскольку записи исходных данных и математические действия над ними производятся в матрич­ной форме. Общие сведения о матрицах наблюдений и результатов вычислений можно найти в работе Дж. Дэвиса.

30. Кластерный анализ – задачи и применение в геологии

Кластерный анализ – совокупность методов классификации и разбивка объектов и многомерных наблюдений на однородные группы. Составление классификаций подчиняется следующим правилам:

- в одной классификации применяется одно и то же основание;

- объем классифицируемого класса равняется сумме объемов подклассов;

-классы и подклассы не пересекаются.

Процедура кластерного анализа предусматривает возможность классификации точек наблюдений в исследуемой выборке, а также самих признаков. В качестве меры сходства при классификациях применяют различные дистанционные коэффициенты: m -мерноеэвклидово расстояние, коэффициенты корреляции и др. Задачи классификации разделяются по типу априорной информации на три типа: 1) число классов задано априорно; 2) число классов неизвестно и его следует определить; 3) число классов неизвестно, но его определение не входит в условие задачи. Две последние ситуации приводят к построению иерархических деревьев – дендрограмм. Это графики, на которых по одной оси располагаются символические обозначения объектов исследования, а по другой оси – минимальные значения дистанционных коэффициентов, соответствующих каждому шагу классифицирующей процедуры. Таким образом, ось с дистанционными коэффициентами используется для масштабного представления иерархических уровней группирования.

31. Графические и табличные формы кластерного анализа???

Графическое представление результатов обычно осуществляется в виде дерева иерарахической кластеризации. По оси X располагаются классифицируемые объекты (на одинаковом расстоянии друг от друга); по оси Y – расстояния, на основании которых происходит объединение объектов в кластеры.
В ряде программ имеется возможность вывести в табличном виде результаты объединения объектов на каждом шаге кластеризации. В большинстве таких таблиц во избежание путаницы используется различная терминология для обозначения исходных наблюдений - монокластеров, и собственно кластеров состоящих из двух и более наблюдений. В англоязычных статистических пакетах исходные наблюдения (строки матрицы данных) обозначаются как " случай" - case.

32. Множественная регрессия и её использование для предсказания свойств геологических объектов

В отличие от двумерной регрессии в методах множественной регрессии зависимая переменная Y рассматривается как функция не одной, а нескольких независимых переменных X 1, X 2,..., Xm.

Уравнение множественной регрессии зависимой переменной Y относительно т независимых переменных X 1, 2, …, m записывается как линеаризированная функция вида

, (VI.1)

где a 0, a 1, a 2, …, am – требующие определения коэффициенты регрессии. Оно наилучшим способом (в смысле наименьших квадратов) описывает тенденцию расположения наблюденных точек в m -мерном пространстве и позволяет оценить совместное влияние всех изучаемых параметров на зависимую переменную.

Множественная регрессия строится на основе учета всех возможных взаимодействий между переменными и их сочетаниями. В ее задачи входит оценка общего вклада всех переменных (R 2) в изменчивость Y, а также определение относительного влияния каждой из них с помощью коэффициентов ai,. Таким образом, множественный регрессионный анализ сводится к вычислению значений коэффициентов регрессионной модели a 0, a 1, a 2, …, am по совокупности п наблюдений над переменными X 1, X 2,..., Xm и Y, оценке влияния каждой переменной и их общего вклада в оценку зависимой переменной Y. В матричной форме уравнение (VI.1) записывается как:

[ Σ Y ] = [ Σ X ] [ a ],

где [ Σ Y ] – вектор-столбец, состоящий из сумм квадратов и смешанных произведений переменной Y с переменными X 1, X 2,..., Xm; [ Σ X ] – матрица сумм квадратов и смешанных произведений X 1, X 2,..., Xm; [ a ] – вектор-столбец неизвестных коэффициентов регрессии. Коэффициенты регрессии ai рассчитываются как частные коэффициенты регрессии, характеризующие изменения данной независимой переменной при условии, что влияние всех остальных переменных устранено.

Для сравнительной оценки вклада каждой зависимой переменной коэффициент R2 сначала рассчитывается для пары Y и Xk с максимальным коэффициентом корреляции, а затем последовательно с тремя и более переменными (до т переменных).

Модели множественной регрессии используются для предсказаний значений зависимой переменной (например, содержаний ценного элемента, объемной массы руды и глубины формирования минерала и др.) по набору независимых переменных (например, содержаний породообразующих элементов, объемных масс тяжелых минералов в рудах, содержаний элементов-индикаторов в минералах и др.).






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.