Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
referat_informatika_Shuriberko.docx
Скачиваний:
101
Добавлен:
15.02.2016
Размер:
2.01 Mб
Скачать

Глава 1. Проблемы обработки данных в биохимии и применение информационных технологий для их решения

Накопление огромных массивов количественных данных и доступность вычислительной техники с каждым годом усиливает математизацию подавляющего большинства наук (в том числе биохимии, биологии и медицины). На современном этапе развития науки исследования не ограничиваются лишь накоплением и описанием неких фактов; на базе накопленных фактов необходимо получить количественные закономерности процессов, создать математические модели исследуемых явлений и объектов.

Бурное развитие высоких технологий в биохимии делает возможным одновременное определение содержания десятков и сотен различных веществ в небольшом образце исследуемого биологического объекта, позволяет отслеживать целый ряд показателей в динамике. Современное состояние развития вычислительной техники и доступный уровень цен на персональные компьютеры делает статистическую обработку результатов, предполагающую сложный математический аппарат и огромное количество вычислений, практически мгновенной процедурой, не требующей трудозатрат со стороны исследователя. В то же время, не следует забывать, что высокая стоимость большинства современных исследований предполагает разумное планирование эксперимента, а работа со статистическими программами требует четкого представления о возможностях и границах применимости того или иного метода. Без достоверной статистической обработки результатов просто невозможно сделать корректные выводы или сравнить их с результатами других исследователей.

В эксперименте свойства биологических объектов, их биохимические и физиологические показатели, изучаются с помощью измерений соответствующих величин. По способу получения результата выделяют прямые (непосредственные) и косвенные измерения. При прямых измерениях искомое значение величины определяют соответствующим прибором, то есть происходит непосредственное сравнение с эталоном. Если искомое значение величины находят на основании известной зависимости между этой величиной и величинами, найденными прямыми измерениями, то этот вид измерений называют косвенным.

Неотъемлемой составляющей любого экспериментального исследования является оценка измерений. Вследствие неточности измерительных приборов, несовершенства органов чувств человека, неполноты знаний, трудности учета побочных явлений при повторении одного и того же измерения получаются разные числовые значения измеряемой величины. Кроме того, в основу любого экспериментального исследования, сопряженного с измерениями, заложена модель. Модель содержит физическое описание исследуемого объекта или процесса, которое позволяет составить его математическое описание. Неверно построенная модель, в которой не нашли отражения какие-то важные процессы или факторы, влияющие на результат измерений, также приводит к несоответствиям.

При практическом использовании результатов тех или иных измерений возникает вопрос о точности измерений, то есть степени приближения результатов измерения к некоторому действительному значению. Для количественной оценки используется понятие «погрешность измерений» или «ошибка».

Измеряемые в эксперименте величины, вычисляемые по полученным из модели рабочим формулам, содержат погрешности, которые носят название модельных погрешностей.

Случайные погрешности при повторных измерениях погрешности этого типа показывают свою случайную природу. Возникают они вследствие множества причин, совместное воздействие которых на каждое отдельное измерение невозможно учесть или заранее установить. Единственно возможный способ объективного учета случайных погрешностей состоит в определении их статистических закономерностей. Рассчитанные статистические оценки вносят в окончательный результат эксперимента.

Исключить случайные ошибки при измерении нельзя, однако применение метода теории ошибок позволяет более точно установить возможную ошибку окончательного результата измерений.

Зачастую в лабораторной практике имеют дело не с генеральной совокупностью, а с небольшим количеством измерений (2≤ n≤10) где невозможно применить многие методы обсчета.

Метод вариационной статистики возник как метод борьбы с ошибками, поскольку, как уже было сказано, все измерения, как бы тщательно они не были выполнены, дают не точное, а лишь приближенное значение.

Ошибкой измерения называется разность между результатом измерения xiи истинным значениемxизмеряемой величины (xi-x). Ошибка обычно не известна, как не известно и истинное значение измеряемой величины. Поэтому основной задачей математической обработки результатов эксперимента и есть оценка наиболее вероятного значения определяемой величины, а также определение соответствующей ошибки и вероятности ее появления.

Ошибки бывают грубые, систематические и случайные.

Грубые ошибки возникают вследствие нарушения основных условий измерений или в результате небрежности экспериментатора. Они резко отличаются по величине от остальных значений, на чем и основаны некоторые критерии их исключения из рассмотрения. При обнаружении грубой ошибки результат следует отбросить, а само измерение, если это возможно, повторить.

Систематические ошибки могут зависеть от точности приборов, реактивов, применяемых методов или от индивидуальных особенностей экспериментатора. Обнаружение их требует таких специальных исследований, как измерение одной и той же величины разными методами или нескольких эталонов с помощью одного и того же прибора и т. д.

К началу математической обработки систематические ошибки должны быть обнаружены и сведены путем соответствующих поправок до ничтожно малых величин. Случайные ошибки могут быть следствием влияния большого количества разнообразных факторов на результат измерений, в том числе и биологической изменчивости, если мы изучаем биологическую систему. Эти ошибки не могут быть учтены и устранены путем введения каких-либо поправок, так как они неопределенны по величине и знаку. Однако с помощью методов теории вероятности можно учесть их влияние на оценку истинного значения измеряемой величины. Учет влияния случайных ошибок основан на знании законов их распределения, причем чаще всего принимается нормальный закон распределения – закон Гаусса. Нормальная плотность распределения случайной величины равна , где π=3,141,e=2,718, функцияp(x) – плотность вероятности, σ – среднее квадратическое отклонение, характеризующее точность измерений и разброс данных. Максимальное значение ординаты, отвечающее среднему арифметическому значению, равно 1:.

Нормальный закон распределения случайной величины отражает, с одной стороны, известное свойство симметрии случайных ошибок (случайные ошибки разных законов встречаются примерно одинаково часто), с другой – свойство концентрации (малые по абсолютной величине случайные ошибки встречаются чаще, чем большие) и является результатом аддитивного воздействия случайных факторов на измеряемую величину. При графическом изображении закона нормального распределения (Рис. 1.1) по оси абсцисс откладывают значения определяемой величины, а по оси ординат – соответствующие вероятности получения их в эксперименте. Вероятностью какого-либо события называют в математике отношение числа случаев, при которых это событие произошло, к общему числу наблюдений. Так, если из 20 определений один и тот же результат получен в четырех случаях, то вероятность получения его равна p=4:20=0,2, или 20%. Вероятностьр=1(100%) соответствует полной достоверности, ар=0 показывает невозможность данного события.

Рис. 1.1. Кривая нормального распределения

На графике кривая нормального распределения ограничивает площадь, разделенную на две симметричные половины средним арифметический М. Если всю площадь под кривой принять за единицу, то в пределахM±σ расположено 0,6827 всей площади или 68,27% всех числовых значений, в пределахM±2σ - 0,9545 площади, или 95,45% числовых значений, и в пределахM±3σ - 0,9973 всей площади, или 99,73% числовых значений.

Результаты любого количественного эксперимента всегда представлены числом, которое в статистике называют вариантой xi. Общее количество бесконечно повторяющихся значений какого-либо измерения принято называть генеральной совокупностью приn∞, а конечное число определений (набор вариант, полученный в эксперименте) называют выборочной совокупностью, или выборкой, которую обозначают (x1,x2, …xn) илиxi,=1,2, … ,п, гдеnколичество определений (объем выборки). В случае малого объёма выборки, при учете влияния случайных ошибок на оценку истинного значения определяемой величины, неприменимы обычные статистические методы и приходится пользоваться специальными методами математической статистики, разработанными для малых выборок.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]