Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 1

.pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
14.63 Mб
Скачать

пользовать нормальное приближение к биномиальному распре­ делению [40J, выражаемое формулой (4.74), и найти вероят­ ность появления заданного значения отклонения от среднего. С этой целью можно использовать таблицы стандартного нор­ мального распределения.

Z —Y п~ (2arcsin|/0 /я * — 2arcsin]/P).

(4.74)

Подставляя требуемые значения для двух последовательностей в формулу (4.74), получим

Z = У 12 (arcsin У 2/12 — 2arcsin)A),27),

или

Z = 3,46 (2 arcsin 0,41 — 2 arcsin 0,53) = — 0,97.

Сравнивая две случайные последовательности, мы можем ожи­ дать три совпадения, а наблюдаем два, что на одно стандартное отклонение отличается от ожидаемого числа совпадений. Наблю­ даемое число совпадений в этой позиции вполне может быть слу­ чайным.

В качестве примера применения этого корреляционного мето­ да рассмотрим задачу сопоставления множеств наблюдений в разрезах угольного бассейна центральной Англии. Хорошие об­ нажения пород здесь редки, а электрокаротаж не дает какойлибо информации, поэтому большая часть данных о стратигра­ фической последовательности получена из глубоких выработок, таких, как карьеры и шахты. Закодируем литологические раз­ новидности пород таким образом: 1 — песчаник; 2 — алевролит;. 3 — сланец, не содержащий фауны; 4 — подстилающая глина;. 5 —уголь; 6 — сланец, содержащий фауну; 7 — известняк. Пер­ вый разрез изучался в затопленной угольной шахте. Второй, ме­ нее мощный разрез обнажен в стене открытого угольного карье­ ра в 10 км от первого. Найдите положения наилучшего совпаде­ ния короткой и длинной последовательностей. Данные приведе­ ны в табл. 4.28.

Из предыдущего примера ясно, что метод изучения взаимо­

связей не обязательно

эквивалентен

методу

взаимной

корреля­

 

 

 

 

 

 

 

 

 

 

 

 

 

 

та б л и ц а 4.28

Два

закодированных стратиграфических разреза в центральной Англии

 

 

(Основание)

 

 

 

 

 

 

 

 

 

 

 

 

 

Разрез

шахты

2

4

5

6

3

4

5

3

1

 

4

5

3

4

5

 

 

3

4

5

4

5

3

2

4

5

 

3

4

5

3

1

 

 

4

5

4

5

6

3

4

5

6

 

3

4

5

2

1

 

 

3

4

5

3

5

3

2

4

5

 

3

5

2

 

 

 

 

(Основ:ание)

 

 

 

 

 

 

 

 

 

 

(Верх)

 

Разрез

карьера

4

5

3

4

5

4

5

3

2

 

1

2

4

5

3

Обо з н а ч е н и я:

1— песчаник, 2— алевролит. 3— сланец,

не содержащий фауны.

4 — подстилающая

глина, 5 — уголь,

6— сланец,

содержащий

Фауну,

7— известняк.

 

272

ции. Имея дело с временными рядами, мы должны предпола­ гать, что наблюдения располагаются в точках вдоль некоторой прямой: это ограничение отсутствует в анализе взаимосвязей. Наши данные могут просто состоять из последовательности со­ стояний, перечисленных в том порядке, в котором они встреча­ ются. Как и в только что приведенных стратиграфических раз­ резах, расстояния между последовательными точками в этом случае несущественны.

Аналогичным образом нечисловые последовательности мож­ но сравнивать с самими собой; этот процесс называется автоас­ социацией. Автоассоциация полезна при исследовании перио­ дичностей в порядке следования состояний и очень широко ис­ пользовалась при исследовании циклотем [47J.

В этом случае сравниваются не две последовательности, а одна последовательность сама с собой. Укажем вероятность хотя бы одного совпадения в этом случае. Биномиальная веро­ ятность получения данного числа совпадений в случайной после­ довательности при сравнении ее самой с собой составит

(4.75)

Мы предполагаем, что последовательность представляет со­ бой случайное размещение т состояний или классов, причем каждое состояние встречается Хь. раз. Общее число наблюдений

равно

т

1>Хк=п> Эту вероятность надо прямо подставлять в.

(4.72)

k=i

и использовать при вычислении х2-распределения и стан­

дартного отклонения. Критерий предназначен для проверки ну­ левой гипотезы, заключающейся в том, что число совпадений не отличается существенно от ожидаемого числа совпадений для случайной последовательности при сравнении ее с самой собой.

Для иллюстрации применения метода автоассоциаций мож­ но использовать данные из разреза шахты (см. табл. 4.27). Если в разрезе шахты будет содержаться много повторяющихся элементов, то это приведет к необыкновенно высоким значениям отношений, характеризующих совпадения, и к значительным от­ клонениям от ожидаемого среднего числа совпадений. Интер­ претация графиков, характеризующих взаимосвязи, проводится аналогично интерпретации коррелограмм. Однако коэффициент взаимосвязи вычисляется на основании номинальных данных, и в силу этого информация, содержащаяся в последовательности, значительно беднее, чем в эквивалентном временном ряду. Так как мы используем качественные данные, то не можем ожидать того же результата, который можно было бы получить при ана­ лизе настоящих временных рядов. Этот фактор необходимо учи­

тывать при интерпретации результатов по взаимосвязям и авто­ ассоциациям.

18—201

273

ПОЛУВАРИОГРАММЫ

Термин геостатистика сейчас широко применяется к специ­ альным ветвям прикладной статистики, начало развития кото­ рой было положено Г. Матероном в Центре математической морфологии в Фонтенбло, Франция. Цель геостатистикн состоя­ ла в исследовании проблем, которые возникают тогда, когда обычная статистическая теория используется в оценке измене­ ний содержания руды в рудном теле. Однако так как геостати­ стика есть абстрактная теория статистического поведения, она применима ко многим обстоятельствам в различных областях геологии и других естественных наук.

Ключевое понятие геостатистики — понятие регионалнзованнон переменной, которая имеет свойства, промежуточные между свойствами полностью случайных величин и полностью детерми­ нированных переменных. Типичные регионализованные пере­ менные являются функциями, описывающими естественные яв­ ления и имеющими географическое распределение, такие, как высота над уровнем поверхности, изменения содержаний в руд­ ном теле или спонтанный электрический потенциал, измеренный в скважине методом каротажа. В отличие от случайных, регионализованные переменные непрерывны от точки к точке, но из­ менения их настолько сложны, что они не могут быть описаны какой-либо регулярной детерминированной функцией.

Даже несмотря на то что регионализированная переменная непрерывна в пространстве, обычно невозможно знать ее значе­ ние в любой точке. Вместо этого ее значения известны только благодаря пробам, которые берутся в определенных местах. Размер, вид, ориентация и пространственное размещение этих проб составляют базу регионализованной переменной. Эта пе­ ременная при изменении хотя бы одного из этих параметров бу­ дет иметь различные характеристики. Например, предположим, что мы хотим определить изменчивость сорта вкрапленных руд в молибденовом месторождении. Вероятно, результат анализа 5-сантиметрового керна, полученного при алмазном бурении, бу­ дет отличаться от результата измельчения проб из рудных отва­ лов. В обоих случаях мы могли бы взять в точности то же самое число проб, п они могли бы быть получены из идентичных мес­

тоположений в руднике. Однако

тот факт,

что объемы проб в

одном множестве измеряются в кубических

сантиметрах, а в

другом — в кубических метрах,

неизбежно

должен влиять на

схему изменчивости сортности руды, которую мы картируем в

руднике. Главная задача

геостатистикн — связать

результаты,

полученные по одной базе

(например, образцы

керна), с ре­

зультатами, полученными для другой базы (например, эксплуа­ тационные блоки).

Геостатистнка позволяет дать оценки формы регионализиро-

274

ванных переменных в одном, двух и трех измерениях. В следую­ щей главе мы более подробно рассмотрим процедуру оценки, называемую крайгингом. Сейчас мы коснемся лишь одной из важнейших статистических характеристик геостатистикн, а имен­ но понятия полудисперсии, которое используется для выраже­ ния скорости изменения регионализованных переменных вдоль заданного направления. Оценка полудисперсии содержит про­ цедуры, аналогичные процедурам анализа временных рядов, следовательно, приводит к необходимости использования геоста­ тистики.

Полудисперсии есть мера степени пространственной зависи­ мости между пробами взоль заданной базы. Для простоты мы предположим, что пробы являются точечными измерениями не­ которого свойства, такого, как глубина подповерхностного гори­ зонта. Для облегчения вычислений мы будем далее предпола­ гать, что база регулярная, т. е. пробы равномерно расположены в пространстве вдоль прямых линий. Если расстояние между пробами по прямой линии равно некоторой величине А, то полу-

дисперсия может быть вычислена для расстояний, кратных А

п—Н

ТА= - ^ £ № - * ш ,)2.

(4-76}

;=i

В этих обозначениях Xi — значение регионализованной перемен­ ной, взятой в точке г, Xi+h — другое значение, взятое через h интервалов. Мы поэтому нашли сумму квадратов разностей между значениями регионализованной переменной в паре точек, разделенных расстоянием Ah. Число точек равно п, так что чис­ ло сравнений между парами точек есть пh.

Если мы вычислим полудисперсии для различных значений h. то мы можем нанести результаты на график в виде полувариограммы, являющейся аналогом коррелограммы. На рис. 4.41 представлена полувариограмма, соответствующая глубине сейс­ мически отражающего горизонта и построенная по измерениям вдоль сейсмического профиля, приведенного на рнс. 4.42. Заме­ тим, что когда расстояние между точками опробования равно кулю, то значение в каждой точке сравнивается с самим собой. Следовательно, все разности равны нулю, и полудисперсия для уо есть нуль. Если Ah — малое расстояние, точки при сравнении оказываются очень похожими, и полудисперсия будет мала. По мере увеличения расстояния Ah сравниваемые точки становятся слабее связанными друг с другом и расстояния между ними уве­ личиваются, что приводит к большим значениям ун. Предполо­ жим, что на некотором расстоянии сравниваемые точки нахо­ дятся так далеко, что они не связаны друг с другом, и их квад­ раты разностей будут равны по величине дисперсии относитель­ ного среднего значения. Полудисперсия более не растет и полу­ вариограмма переходит в плоскую область, называемую поро-

18*

275

Рнс. 4.41. Полувариограмма абсолют­ ных отметок кровли меловой форма­ ции, измеренной вдоль морского сейс­ мического разреза в Магеллановом проливе, Чили [38].

Линия, изображенная точками, представтгяет порог, или дисперсию, возвышений и равна 8380 м\ Ранг, указанный стрел* кой. — расстояние, ниже которого разность между дисперсиями н порогом считается

пренебрежимо малой (3.5 км)

Рис. 4.42. Подпочвенные струк­ турные абсолютные отметки кровли меловой формации, оце­ ненные по отражению сейсми­ ческих волн вдоль 21-километ­ рового морского траверса в Ма­ геллановом проливе. Сейсмиче­ ские измерения взяты в 300-

метровом интервале [38]

гом. Расстояние, на котором полудисперсия приближается к дис­ персии, называется рангом, или размахом регионализованной пе­ ременной, оно определяет окрестность, в пределах которой все положения связаны друг с другом.

Для некоторой произвольной точки в пространстве мы мо­ жем представить себе окрестность как симметричный интервал (или площадь, или объем, в зависимости от размерности) во­ круг точки. Если регионализованная переменная стационарна или всюду имеет одно и то же среднее значение, то любое по­ ложение вне этого интервала совершенно независимо от цент­ ральной точки и не может давать информацию вокруг значения регионализированной переменной в этой точке. В пределах этой окрестности, однако, регионализированная переменная во всех наблюдаемых точках связана с регионализованной переменной в центральной точке и, следовательно, может быть использова­ на для оценки ее значения. Если мы используем множество из­ мерений, сделанных в точках внутри этой окрестности для оцен­ ки значения регионализованной переменной в центральной точ­ ке, то полувариограмма обеспечит собственные веса, которые должны быть приписаны каждому измерению.

Остановимся коротко на факте, который будет нам полезен позже. Полудисперсия равна не только среднему значению квад­ ратов разностей для пар точек, расположенных на расстоянии

276

Дй друг от друга, но и дисперсии этих разностей, т. е. полудислерсия может быть определена по формуле

т

а

=

(

4

-77)

Заметим, что среднее значение регионализованной переменной Xi есть также среднее регионализованной переменной Xi+h, так как это — те же самые наблюдения, только взятые в другом по­ рядке, т. е.

( . f t

пп

Поэтому их разность должна быть равна нулю

S X f _ ъ х 1¥к = 0 i

пп

Комбинируя суммы, получаем

(IX i - 2 З Д In = [2 {Xi Xt+h)] In = 0.

Подставляя в (4.77), мы видим, что числитель второго члена ра­ вен нулю, так что это уравнение совпадает с уравнением (4.76). Заметим, что это соотношение строго справедливо только тогда, ■когда регионалнзованная переменная стационарна. Если данные не стационарны, то среднее значение последовательности изме­ няется вместе с h, и (4.77) должно быть модифицировано.

Как и следовало ожидать, имеются математические соотно­ шения между полудисперсией и другими статистиками, такими, как автоковариацня и автокорреляция. Если регионализованная переменная стационарна, то полудисперсия для расстояния ДА равна разности между дисперсией н пространственной автоко­ вариацией для того же расстояния (рис. 4.43). Если регионали­ зованная переменная не только стационарна, но и стандартизо­ вана так, чтобы среднее равнялось нулю, а дисперсия единице, то полувариограмма будет зеркальным отражением автокорре­ ляционной функции (рис. 4.44).

К сожалению, часто регионализованные переменные не ста­ ционарны, скорее они отражают изменения их средних значений от точки к точке. Если мы попытаемся построить полувариограмму для такой переменной, то обнаружим, что она может не иметь описанных выше свойств. Однако если пересмотреть опре­ деление полуднсперсин, приведенное в формуле (4.77), то мы заметим, что оно состоит из двух частей, первая соответствует разностям переменной в паре точек, а вторая — среднему этих разностей. Если регионализованная переменная стационарна, то, как мы видели, вторая часть равна нулю, а если она неста­ ционарна, то это среднее будет иметь некоторое не равное нулю значение. Действительно, регионализованная переменная может быть рассмотрена как состоящая из двух частей, называемых остатком и дрифтом. Дрифт — это математическое ожидание ре­ гионализованной переменной в точке t, или с точки зрения вы-

277

-Лаг

менной

числений, взвешенное среднее всех точек внутри окрестности вокруг точки г. Дрифт будет иметь вид кривой, аппроксимиру­ ющей регионализованную переменную. Если дрифт вычесть из регионалпзованной переменной, то остатки Ri—Xi—X,- сами да­ дут регионализованную переменную, имеющую средние значе­ ния, равные нулю. Другими словами, остатки будут стационар­ ными и можно построить их полувариограмму.

Здесь мы неожиданно приходим к проблеме цикличности. Дрифт может быть оценен, если мы знаем размер окрестности и веса, приписанные точкам внутри этой окрестности. Однако веса могут быть вычислены только в том случае, если мы знаем полудисперсии, соответствующие расстояниям между точкой /, центром окрестности и различными другими точками Вычислен­ ный однажды дрифт вычитаем из значений, полученных при на­ блюдении. Полученную стационарную переменную в свою оче­ редь можно использовать для оценки размера окрестности в ви­ де полувариограммы.

Теперь ослабим строгость наших определений и перейдем к методу проб и ошибок. Сначала нужно признать, что нельзя определить окрестность в том смысле, в котором мы использова­ ли этот термин. Вместо этого окрестность определяется как

278

удобный, но все же произвольный интервал, в пределах которо­ го мы уверенно можем утверждать, что все позиции связаны друг с другом. Предположим, что в пределах этой произвольной окрестности дрпфт можно аппроксимировать простым выраже­ нием, например

Хо = 2Ь,Х;

(линейный дрпфт) или_же

Ха = 2(biA; + ЬгХ;2)

(квадратичный дрпфт). В эти формулы входят координаты всех заданных точек внутри произвольной окрестности, так что суще­ ствуют взаимосвязи между размером окрестности, дрифтом и полувариограммой остатков. Если окрестность велика, вычисле­ ния дрнфта будут основаны на большом числе точек, и дрифт можно будет представить очень гладкой кривой. В этом случае остатки будут характеризоваться большой изменчивостью, а полувариограмма окажется сложной по форме. Следовательно, специфика размера малой окрестности будет влиять на большую изменчивость оценки дрнфта, на уменьшение остатков и на про­ стоту вариограммы.

Определение коэффициентов b дрифта требует решения не­ которого числа совместных уравнений повышенной сложности,

описание которых откладывается до

раздела, посвященного

крайгингу. Единственные переменные

в этих уравнениях — это

полудисперспи, соответствующие различным расстояниям между точкой с номером г и другими точками в рассматриваемой окре­ стности. Однако они еще не дают полувариограммы, из которой следует получить необходимые полудисперсии. Можно допус­ тить, что полувариограмма имеет какой-либо естественный для

нее вид, и использовать его

в качестве первого приближения.

К счастью, легко предвидеть

вид простой полувариограммы,

п это позволяет использовать окрестность настолько малого раз­ мера, насколько это возможно.

Экспериментальные оценки дрифта вычитаются из соответст­ вующих наблюдений, в результате чего получается множество экспериментальных остатков. По этим остаткам можно вычис­ лить полувариограмму и затем сравнить ее с той полуварио­ граммой, которая была выбрана в качестве первого приближе­ ния, Если сделанные предположения были правильными, то обе они совпадут, и можно считать, что форма дрифта и полуварнограммы определены успешно. Однако более вероятно, что они отличаются, и следует проделать вычисления еще раз.

Процесс совместного построения удовлетворительных выра­ жений для полувариограммы и дрифта является важной состав­ ной частью «структурного» анализа. В некотором смысле это — искусство, требующее опыта, терпения и иногда удачи. Этот процесс не всегда приводит к приемлемым решениям, так как

2 7 9

они неоднозначны; много комбинаций дрифта, окрестностей и мо­ делей полувариограмм могут дать примерно одинаковые резуль­ таты. Он пригоден особенно в том случае, когда регионализованные переменные неустойчивы или же мы располагаем лишь короткой последовательностью. В таких обстоятельствах трудно сказать, когда мы достигнем эффекта от комбинации оценок.

Полувариограмма отражает пространственное поведение регионализованных переменных или их остатков. Некоторые иде­ ализированные формы полувариограмм даны на рис. 4.45.

На рис. 4.45, а приведена полувариограмма параболического типа, касающаяся оси X в начале координат. Она иллюстриру­ ет очень гладкое изменение регионализованной переменной. На рис. 4.45, б представлена полувариограмма, имеющая вид пря­ мой линии; она указывает на умеренное и непрерывное измене­ ние регионализованной переменной. Истинная случайная пере­ менная не будет непрерывной, и ее полувариограмма будет го­ ризонтальной линией, ордината которой равна дисперсии (рис. 4.45, в). В некоторых случаях полувариограмма не проходит че­ рез начало координат, а имеет при абсциссе, равной нулю, нену­

левое значение. Этот случай соответствует «эффекту

самород­

ков». Он изображен на рис. 4.45, г. В теории величины

должна

быть равна нулю. Эффект самородков возникает тогда, когда ре-

гионализованная переменная настолько

ошибочно

определена

на

коротком расстоянии, что полувариограмма выходит из ну­

ля

на уровень эффекта самородков на

расстоянии,

меньшем,

чем интервал опробования.

Моделирование полувариограмм

В принципе экспериментальная полувариограмма может быть прямо использована для получения оценок, которые мы рассмотрим в следующей главе. Однако полувариограмма изве­ стна только в дискретном наборе точек, расположенных на рас­ стояниях Д/г; на практике, однако, полувариограммы могут по-

Рис. 4.45. Идеализированные по­ лувариограммы:

а — параболическая форма, показываю­

щая отличную непрерывность регионалнзованной переменной; б — линейная форма, показывающая умеренную не­ прерывность; в — горизонтальная фор­

ма уровня <То2, соответствующая слу­ чайной переменной, не имеющей про­ странственной автокорреляции; г — эф ­

фект самородков, или явное отклонение полувариограммы от начала координат» показывающее, что регионализованная переменная сильно изменчива при рас­ стояниях, меньших чем интервал опро­

бования

280

требоваться для любых расстояний независимо от того, являет­ ся ли оно кратным Д или нет. По этой причине дискретная экс­ периментальная полувариограмма должна быть представлена некоторой непрерывной функцией, которая может быть вычис­ лена для любого желаемого расстояния.

Подбор модельного уравнения к экспериментальной полувариограмме проводится обычно на глазок, методом проб и оши­

бок. Кларк [9]

описывает и дает примеры ручных вычислений,

в то время как

Олеа [38] приводит программу вычисления ли­

нейной полувариограммы, имеющей тот же угловой коэффи­ циент в начале координат, как и экспериментальная полува­ риограмма.

В идеале модель, выбранная для представления полуварио­ граммы, начинается в начале координат, гладко возрастает до некоторого верхнего предела, затем остается на одном по­ стоянном уровне. Сферическая модель, представленная на рис. 4.46, обладает этими свойствами. Она определена по формуле

(4.78)

для всех расстояний вплоть до области влияния полувариограм- ■мы а. За пределами этой границы ,р! = ао2. Сферическая модель обычно характеризуется как идеальная форма полувариограм­ мы. Иногда используется другая модель — экспоненциальная

— h

(4.79)

На рис. 4.47 сравниваются сферическая и экспоненциальная модели. Экспоненциальная кривая никогда не достигает своего предельного значения, а приближается к нему асимптотически. Значит, полудпсперсия экспоненциальной модели ниже, чем сфе­ рическая, для всех значений /г, меньших, чем размер области влияния. Линейная модель проще, чем сферическая или экспо­ ненциальная, так как она имеет только один параметр, наклон. Модель имеет вид

Yft = ah

(4.80)

и представляет собой прямую, проходящую через начало коор­ динат. Очевидно, эта модель не может иметь пика, так как она растет неограниченно. Иногда линейная модель произвольно мо­ дифицируется с помощью вставки внезапного излома в точке пи­ ка, как, например,

Чн = ah

для h < a,

4h = a02

(4.81)

для

Армстронг и Джебин [3] подвергают критике такие модели, так как использование крайгиига для получения оценок предпо­ лагает непрерывность и гладкое изменение полувариограммы. Однако для расстояний, значительно меньших границы, линей-

281

Соседние файлы в папке книги