Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / Психиатрия и наркология для детей и взрослых (доп.) / Клиническая_психофармакогенетика_Р_Ф_Насырова,_Н_Г (1)

.pdf
Скачиваний:
0
Добавлен:
24.03.2024
Размер:
10.21 Mб
Скачать

КЛИНИЧЕСКАЯ ПСИХОФАРМАКОГЕНЕТИКА

Ген

Варианты (аллели)

RR

Population

Frequency (%)

 

 

 

 

 

 

 

CHEK2

1100delC

2–5

0,7

BRIP1

Укорачивающие мутации

2–3

0,1

PALB2

Укорачивающие мутации

2–5

<0,1

Первые четыре маркера, несомненно, заслуживают практического применения и применяются. Для сравнения можно вспомнить, как на протяжении многих лет, фактически с момента открытия групп крови, исследователи увлекались поисками их связи с различными заболеваниями. Все получаемые значения RRили ORне превышали значений 1,5, и все они не получили практического применения, к тому же результаты не воспроизводились и сейчас благополучно забыты (хотя и остались в учебниках). Основная причина: исследователи в те времена не проверяли согласие распределений частот генотипов

сравновесием Харди-Вайнберга, отклонения от которого во всех случаях кажущихся ассоциаций

сболезнями при ближайшем рассмотрении оказались статистически высокозначимыми [55].

Один из примеров – масштабное когортное исследование (более миллиона пациентов)

по оценке риска рака ЖКТ и пептических язв в зависимости от генотипов системы групп крови AB0 [56]. Проверка согласия с равновесием Харди-Вайнберга показала статистически высокозначимое отклонение (рис.7). Полученному значению статистики критерия χ2 = 376 при одной степени свободы (df = 1) соответствует запредельно малое значение p = 10-83. Основной вклад в наблюдаемое отклонение внес избыток генотипов AB. Нередко причиной таких больших отклонений от равновесия Харди-Вайнберга является процедура сбора данных на основании плохо контролируемого опроса пациентов.

Бейзов фактор

Бейзов фактор BF является более адекватным, нежели p-значение, показателем для сравнения правдоподобности той или другой гипотезы. Он принципиально отличается от значения Рval. Бейзов фактор не является вероятностью сам по себе, а является отношением вероятностей (или плотностей распределений), и он может варьироваться от нуля до бесконечности:

BF01 = P(Dobs|H0) / P(Dobs|H1);

BF10 = P(Dobs|H1) / P(Dobs|H0).

Здесь Dobs – наблюдаемые данные.

Рис. 7. Проверка согласия с РХВ для частот генотипов системы групп крови AB0 по данным Edgrenetal., 2010 [56]. Использована программа S2 AB0estimator [57]

70

Глава 5. СТАТИСТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ГЕНОМИКИ

Это означает, что с помощью бейзова фактора проводится не однобокая проверка значимости лишь нулевой гипотезы, а сравниваются вероятности получить наблюдаемые данные при обеих гипотезах. Для его значений также предложены словесные интерпретации (табл. 9а и 9б).

Таблица 9а Вербальные шкалы для бейзовых факторов

BF01 и BF10

Свидетельство

 

 

Авторы

 

 

в пользу

 

 

 

 

 

 

 

 

 

 

гипотезы

Elston,

Jeffreys

Jackman

Kass,

Royall

H0 против

Johnson

Raftery

гипотезы H1

 

 

 

 

 

Едва стоит

>1–2

>1–3

>1–3

>1–3

 

упоминания

> 1–8

 

 

 

 

Умеренное

2–6

3–10

3–12

3–20

 

 

 

 

 

 

Сильное

6–20

10–30

12–150

8–32

 

 

 

 

 

 

Очень сильное

20–60

30–100

20–150

>32

 

 

 

 

 

 

 

Убедительное

60–100

>100

>150

>150

 

 

 

 

 

 

 

В настоящее время наиболее общепринята следующая шкала:

Таблица 9б

Сводная консенсусная вербальная шкала для интерпретации бейзовых факторов

BF01

Свидетельство в пользу гипотезы Н0

против гипотезы Н1

 

>100

Убедительное

 

 

30 – 100

Очень сильное

 

 

10 – 30

Сильное

 

 

3 – 10

Умеренное(слабое)

 

 

1 – 3

Пренебрежимо малое

 

 

BF10

Свидетельство в пользу гипотезы Н1 против гипотезы Н0

Программное обеспечение анализа

генетических данных

Основными программами для анализа гене- тико-популяционных данных следует признать три: GenAlEx, GENEPOP и Arlequin. Есть еще полезная программа PowerMarker, но у нее истек срок действия и приходится переустанавливать на компьютере календарную дату на май 2006 года [58]. Сравнение возможностей этих программ представлено недавно [59].

Серьезным неудобством в использовании этих и других программ является тот факт, что разные программы используют разные форматы для исходных входных файлов. Одна опечатка в использовании запятой, точки с запятой, пробела, слэша и т.п. может сделать данные нечитаемыми или неправильно классифицированными. В результате для организации данных в правильном формате часто требуется больше времени, чем для проведения самого анализа. К счастью, некоторые программы обеспечивают возможность импорта/экспорта данных из/в другие форматы, что позволяет избежать переформатирования данных вручную и облегчает, и ускоряет набор данных для разных программ. Это важно, поскольку нет универсальной программы, в разных программах – разный набор инструментов анализа и для решения разных задач приходится лавировать между программами. Поэтому анализ таких данных удобно начать с программыGenAlEx [60].

Ее небольшое неудобство состоит в том, что эта программа не воспринимает буквенные обозначения генотипов и приходится их шифровать: A = 1, С = 2, G = 3 и T = 4.

На рисунке 8 представлен образец входного (input) файла.

Рис. 8. Образец входного файла для программы GenAlEx

Обозначения: A1 – число локусов; B1 – общий объем выборки; C2 – число популяций; D1 – E1 – объем каждой из выборок. Представлен фрагмент данных по локусам STR, используемым в судебной генетике.

71

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

Таблица 10
Распределение численностей аллелей двух локусов HLA-DQA1 и HLA DQB1 в выборках здоровых детей
из шести различных российских местностей и оценка их эталонных частот [61]
Подбор референсных групп
Оценка популяционных частот аллелей, гаплотипов и генотипов – важный этап в мо- лекулярно-генетических исследованиях. Для получения надежных оценок таких частот необходимо иметь выборки большого объема, которые зачастую бывает затруднительно получить силами одной лаборатории. Однако возможно набрать данные из различных источников, и если они статистически однородны, то их можно суммировать. Примером такого подхода может служить оценка эталонных частот аллелей в локусах HLA-DQA1 и HLA DQB1, связанных с предрасположенностью к целиакии [61]. В этой работе были собраны данные о результатах HLA-
Рис. 9. Графические возможности GenAlEx
Данные в этой программе легко конвертирогенотипирования­ в выборках относительно невать во входные файлы для программ GENEPOP большого объема (от 70 до 290 человек) из шести и Arlequin и других 27 программ. GenAlEx произразличных российских местностей (Санкт-Пе- водит высококачественные диаграммы (рис. 9). тербург, Москва, Северо-Западный округ, Вологда, Западная­ Сибирь, Архангельск). Данные и результаты их статистического анализа представлены в табл. 10. Их визуализация представлена на
рисунке 10.
Результаты традиционной (частотной) проверки однородности этих данных с использованием точного критерия Фишера-Фриме- на-Холтона, казалось бы, свидетельствуют об их статистически высокозначимой неоднородности (гетерогенности): p = 8∙10-5 для локуса HLADQA1 и p = 10-9 для HLA-DQB1. Соответственно, их вроде бы нельзя объединять. Однако значения бейзовых факторов BF01 свидетельствуют о противоположном. Получить эти данные в 1017 и в 1018 раз более правдоподобно при нулевой гипотезе H0 об их статистической однородности, чем при альтернативной гипотезе H1 об их неоднородности. Одновременно эти значения BF01 показывают, во сколько раз апостериорные шансы в пользу гипотезы H0 против гипотезы H1 превышают их априорные шансы. Аp-значения не позволяют делать подобные выводы. Наблюдаемое кардинальное противоречие между выводами на основе p-значений и бейзовых факторов демонстрируют то, что называют парадоксом Джеф- фриза-Линдли, а именно: вероятность получить наблюдаемые данные при нулевой гипотезе может быть мала (на этой вероятности зиждется вычисление p-значений), но она может быть еще меньше при альтернативной гипотезе.
КЛИНИЧЕСКАЯ ПСИХОФАРМАКОГЕНЕТИКА

 

 

 

Численности аллелей в выборках

 

 

«Эталонная»

Аллель

СПб. и

Сев.-

Вологда

Моск_1

Зап.-

 

Моск_2

Арх.

Всего

частота аллели

 

Моск.

Зап.

Сиб.

 

с 99% ными ДИ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Локус HLA-DQA1*

 

 

 

 

101

39

31

68

76

35

 

37

19

305

12 14 17 %

102

41

37

90

114

44

 

52

30

408

17 19 22 %

103

14

18

42

64

23

 

16

9

186

7 9 11 %

201

26

21

72

87

35

 

38

19

298

12 14 17 %

301

19

33

84

58

19

 

37

33

283

1113 16 %

401

5

9

24

9

13

 

4

5

69

2 3 5 %

501

55

53

102

172

46

 

93

29

550

23 26 29 %

601

1

0

2

2

1

 

2

1

9

0,1 0,4 1,1%

Всего

200

202

484

582

216

 

279

145

2108

100%

p

 

 

 

8∙10-5

 

 

 

 

 

 

BF01

 

 

 

4·1017

 

 

 

 

 

 

V

 

 

 

0,04 0,08 0,12

 

 

 

 

 

 

72

Глава 5. СТАТИСТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ГЕНОМИКИ

 

 

 

Численности аллелей в выборках

 

 

«Эталонная»

Аллель

СПб. и

Сев.-

Вологда

Моск_1

Зап.-

 

Моск_2

Арх.

Всего

частота аллели

 

Моск.

Зап.

Сиб.

 

с 99% ными ДИ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Локус HLA-DQB1*

 

 

 

 

201

33

35

88

112

46

 

52

24

366

16 19 22 %

301

45

40

76

140

41

 

72

18

414

18 21 24 %

302

12

23

56

43

9

 

21

25

164

6 8 11 %

303

10

10

24

20

5

 

11

16

80

3 4 6 %

304

2

0

0

1

2

 

0

0

5

0,04 0,3 0,9 %

305

1

0

4

0

0

 

0

0

5

0,04 0,3 0,9 %

401

4

8

34

10

5

 

4

5

65

2 3 5 %

501

32

26

62

64

32

 

27

15

243

10 12 15 %

502

13

14

8

41

12

 

18

4

106

4 5 7 %

503

6

5

6

13

1

 

6

2

37

1 2 3 %

601

8

3

2

19

2

 

7

1

41

1 2 3 %

602

34

38

124

119

54

 

51

35

420

19 22 25 %

Всего

200

202

484

582

209

 

269

145

2091

100%

p

10-9

 

 

 

 

 

 

 

 

 

BF01

4·1018

 

 

 

 

 

 

 

 

 

V

0,08 0,12 0,16

 

 

 

 

 

 

 

 

 

Обозначения и примечания: ДИ – доверительный интервал;BF01 – бейзов фактор в пользу нулевой гипотезы H0 против альтернативной гипотезы H1; V– коэффициент сопряженности Крамера.

Локус HLA-DQA1

Локус HLA-DQB1

Рис.10. Мозаичные диаграммы для таблиц сопряженности из табл. 10. Визуализация взаимоотношений между строками и столбцами в таблицах сопряженности.

Использована интерактивная программа Chi-squareTest [64]

73

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

КЛИНИЧЕСКАЯ ПСИХОФАРМАКОГЕНЕТИКА

Для оценки точных p-значений (методом

99%-ных доверительных интервалов (ДИ). Ис-

Монте-Карло) и коэффициента сопряженности

пользована процедура вычисления так называе-

Крамера (V) использован признанный эталон-

мых совместных (simultaneous) ДИ, при которой

ным пакет программ для точных непараметри-

наблюдаемые численности рассматриваются

ческих методов статистики StatXact [62]. Для

как выборка из полиномиального распределе-

вычисления бейзова фактора (BF01) использован

ния.Для вычислений использована программа

пакет программ JASP [63]. Инструментом для

StatXact-8. Аналогичная ситуация наблюдается и

визуализации результатов анализа таблиц со-

в случае подбора референсной группы для частот

пряженности являются мозаичные диаграммы

генотиповпо диморфизму 308G>Aв гене TNFA на

(рис. 10).

основе 18 независимых выборок здоровых рос-

В последнем столбце табл. 10 указаны «эта-

сиян-европеоидов. Результаты представлены в

лонные» частоты аллелей с границами точных

табл. 11 (Плоткин и др., 2007 [65].

Таблица 11

Численность генотипов по диморфизму 308G>Aв гене TNFA

в 18 независимых выборках здоровых россиян-европеоидов

Местность

 

Генотипы

 

Всего

Уфа_1

GG

GA

AA

 

Сибирь

53

65

2

159

СПб

47

4

1

91

Белгород

108

8

1

289

Москва_1

125

31

3

222

Москва_2

70

19

2

258

Москва_3

217

70

2

214

Новосибирск

169

50

3

400

Омск_1

204

49

5

117

Омск_2

167

43

4

52

Томск

290

100

10

189

Уфа_2

135

47

7

120

Уфа_3

122

54

4

180

Уфа_4

177

64

5

246

Уфа_5

273

103

5

381

Уфа_6

78

21

2

101

Уфа_7

133

65

6

204

Уфа_8

13

6

1

20

p

 

8∙10–10

 

 

BF01

 

7∙1010

 

 

Всего

2381

799

63

3243

Частоты

72 73 75 %

23 25 26 %

1 2 3 %

100%

Равновесие Харди-Вайнберга, mid-p

 

0,69

 

 

Проверка согласия

с равновесием Харди-Вайнберга

Генетика – уникальная наука в том смысле, что позволяет проверить, являются ли анализируемые данные случайной выборкой из панмиктической (свободно скрещивающейся) популяции. Процедура называется проверкой согласия с равновесием Харди-Вайнберга и должна быть обязательной при анализе таких данных. Полезным введением в проблему может служить приложение к университетскому учебнику для вузов Л.З. Кайданова «Генетика популяций» [66].

Проверка того, соответствуют ли частоты генотипов контролей (субъектов без болезней) равновесию Харди-Вайнберга, дает представление

о качестве проводимых молекулярно-генетиче- ских исследований. Отклонение от равновесия Харди-Вайнберга может быть вызвано такими факторами, как инбридинг, ассортативное скрещивание, отбор или миграция. Можно ожидать, что влияние этих факторов на равновесие Хар- ди-Вайнберга будет незначительным в большинстве человеческих популяций, хотя отбор может играть важную роль при инфекционных заболеваниях. Другой причиной является популяционная стратификация, которая вызывает дефицит гетерозигот. К избытку гетерозигот могут приводить также вариации числа копий генов (CNV). Наконец, отклонение от РХВ может быть вызвано просто ошибками генотипирования.

74

Глава 5. СТАТИСТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ГЕНОМИКИ

Ошибки генотипирования

Ошибки генотипирования неизбежны и являются скорее правилом, нежели исключением, и их частота для некоторых локусов может достигать 15%. Такие ошибки, даже если они происходят с очень низкой частотой, могут исказить результаты многих генетических анализов, таких например, как оценка происхождения или родства, или изучение связей/ассоциаций.

Ошибки генотипирования могут привести к серьезным смещениям и потере точности, и, кроме того, снижается статистическая мощность обнаруживаемых эффектов. Существует целый ряд типов ошибок, которые могут произойти в процессе генотипирования, включая ошибки при отборе образцов биоматериала для генотипирования, качество образца, взаимодействие между молекулами ДНК, перебои или неисправность оборудования и реагентов. Тем не менее основная причина ошибки генотипирования связана с человеческими факторами. Оценка качества метода генотипирования позволяет избежать ошибок генотипирования, которые приводят к ложным оценкам риска и отклонениям от равновесия Харди-Вайнберга. В современных исследованиях генотипирование основано на полностью автоматизированных методах и эти методы подвержены ошибкам при определении генотипов из-за экспериментальной вариации и качества образцов ДНК, их загрязнения примесями и др. Очевидно, что анализы генотипирования чувствительны к загрязнению ДНК из планшет, пробирок, праймеров и других компонентов среды лаборатории, особенно для наиболее чувствительных новых технологий. Тем не менее другие типы систематических ошибок могут быть особенно тревожными, потому что они влияют на весь процесс исследования, и степень проблемы может отличаться в зависимости от случая и контроля. Например, весьма распространено группировать ДНК-планшеты отдельно для случаев и контролей, или кодировать образцы структурированной системой нумерации, которая позволяет непроизвольно заранее идентифицировать случаи и контроли. Члены исследовательской группы, от лаборантов до статистиков, не должны пренебрегать рандомизацией и «ослеплением» образцов из групп случаев и контролей.

В недавней рукописи, депонированной в архиве bioRxiv авторы сообщают: «Чипы ОНВ крайне ненадежны для генотипирования очень редких патогенных вариантов и не должны использоваться для принятия решений о здоровье без проверки» [67].

Если довольствоваться нахождением лишь р-значений, то вполне дружественной является интерактивная веб-страница, которая вычисля-

ет точные p-значения, как традиционные, так и mid-p с поправкой на консервативность точных критериев [68].

Результат проверки согласия с равновесием Харди-Вайнберга с использованием этой программы для «референсной» группы из табл. 11 показан на рис. 11.

Рис. 11. Результат проверки согласия с РХВ для «референсной» группы, подобранной на основе данных о численности генотипов по диморфизму 308G>Aв гене TNFA

в 18 независимых выборках здоровых россиян-европеоидов

Очевидно, что имеет место удовлетворительное согласие с равновесием Харди-Вайнберга. Об этом же свидетельствует и бейзовский подход: BF01 = 43,2. Согласно вербальной шкале (табл. 4) такое значение BF01 можно интерпретировать как весомое свидетельство в пользу согласия анализируемых данных с равновесием Харди-Вайнберга против их отклонения от равновесия Харди-Вайнберга. Вычисления можно реализовать в известной программной среде R, в библиотеке которой есть специализированный пакет НWBayes. После его инсталляции и запуска

>library(“HWEBayes”, lib.loc=”~/R/winlibrary/3.5”)

вводится команда с анализируемыми численностями генотипов:

> HWEDirichBF2(nvec=c(2381,799,63),bvec0=c (1,1),bvec1=c(1,1,1))

Результат:

[1] 43.22327

На рис. 12 представлен другой пример с результатами сравнения частот генотипов в двух сравниваемых группах школьников (контроль) и детей с артериальной гипертензией (АГ) и их согласиясРХВдлядиморфизма3123C>T(rs1191046) в гене AGTR2 (ген рецептора типа 2 для ангиотензина II) [69]).

75

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

76
Результат сохраняется в этом же файле. Программа GENEPOP уникальна тем, что позволяет проверять нулевую гипотезу о согласии с равновесием Харди-Вайнберга при трех альтернативных гипотезах: 1) отклонение от РХВ за счет дефицита гетерозигот (инбридинг); 2) из-за из-
Genepop HWFile=AGTR2_HT.txt
HWfileOptions=1,2,3,4
AGTR2_HT 2 68
19 85
Рис. 12. Результаты сравнения распределений частот генотипов с диморфизмом 3123C>T(rs1191046) в гене AGTR2 в двух группах детей – с АГ и здоровых школьников и проверка их согласия с равновесием Харди-Вайнберга
Такие же значения получаются и для контрольной группы школьников. Здесь S.E. есть стандартная ошибка для оценки p-значенияме- тодом Монте-Карло. P-value = 0не означает, чтооно равно нулю, а только, что p < 10 6.Результаты подтверждаются и бейзовским анализом. Для группы с АГ BF01 = 2∙10 25 и для контрольной группы BF01 = 6,8∙10 9. Эти значения свидетельствуют в пользу альтернативной гипотезы (отклонение от равновесия Харди-Вайнберга реально) против гипотезы о согласии с равновесием Харди-Вай-
Обозначения вида 4.8e-8 есть так называемая нберга. Кроме этого, программа GENEPOP по- экспоненциальная запись чисел в компьютере, зволяет оценить коэффициент инбридинга FIS и в обычной записи это: 4,8∙10-8; mid-p p-зна- (его более строгое название – индекс фиксации). чение с поправкой на консервативность точных В данном случае получаетсяFIS = 0,78. В кон- вероятностных критериев. трольной группе также обнаруживается инбри-
Распределения частот генотипов имеют статидинг сFIS = 0,38. Для оценки FIS можно исполь- стически высокозначимое различие (p = 4,8∙10-8), зовать также программу FPtest [71]. Есть еще однако в каждой из двух групп наблюдаются ста- уникальная полезная программа HWmet [72], тистически высокозначимые отклонения от РХВ которая вычисляет бейзовские (credible – прав- (p = 3,4∙10-27 и p = 1,6∙10-10). Более подробный доподобные) ДИ для индексов фиксации FIS, но, анализ можно провести с помощью широко из- к сожалению, для нее имеется только код, кото- вестной программы GENEPOP [70]. Для этого в рый надо самостоятельно компилировать в ис- текстовом редакторе надо создать входной файл полнительный файл [73].Скорее всего, причиной вида (для группы детей с АГ): столь невероятных отклонений от равновесия
Харди-Вайнберга в обсуждаемой работе являются ошибки генотипирования. На этот счет существует обширная литература[74-77].
Программа GENEPOP позволяет не просто проверить согласие данных с РХВ, но и выявить причину наблюдаемого отклонения. В обе-
где первая строка – произвольное название, в их группах – это инбридинг с очень высокими данном примере: AGTR2_HT вторая строка – значениям коэффициента инбридинга (индекчисло аллелей, в данном примере 3, далее – чисса фиксации) FIS= 0,78 и 0,38. Таким значениям ленность генотипов. могут удовлетворять популяции из клонов и бли- Программа запускается путем задания коман- жайших родственников, что, конечно же, исклю- ды в командной строке для директории, в кото- чено. Следовательно, сравнивать распределения рой находится исполнимый файл genepop.exe: частот генотипов в этих группах фактически неправомочно, т.е. наблюдаемое статистически
высокозначимое различие, скорее всего, является ложным.
Программа GENEPOP пригодна также и для дифференцированного анализа избытка и дефицита гетерозигот в локусах с числом аллелей больше двух. Примером могут служить данные о частотах генотипов в локусе CYP2C9 (ген цитохрома P450 2C9) с тремя аллелями (*1, *2 и *3) из работы Шнайдер и др. [78] (табл. 12).
бытка гетерозигот (аутбридинг); 3) общее отклонение от равновесия Харди-Вайнберга.
Heterozygote deficiency test:
P-value=0; S.E=0
Heterozygote excess test:
P-value=1; S.E=0
Probability test:P-value=0; S.E=0
КЛИНИЧЕСКАЯ ПСИХОФАРМАКОГЕНЕТИКА

Глава 5. СТАТИСТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ГЕНОМИКИ

Таблица 12

Частота встречаемости генотипов у наблюдаемых пациенток (N = 148)

Генотип

Численности, n

Доли с 95% ными ДИ

 

 

 

CYP2C9*1/*1

100

57 68 77 %

CYP2C9*1/*2

18

6 12 21 %

CYP2C9*2/*2

0

0,0 0,0 3,3 %

CYP2C9*1/*3

28

11 19 28 %

CYP2C9*3/*3

0

0,0 0,0 3,3 %

CYP2C9*2/*3

2

0,11,4 6,1 %

Обозначения: ДИ – доверительный интервал.

Согласно современным рекомендациям, следует указывать доверительные интервалы для всех оцениваемых показателей. Поэтому здесь в виде подстрочных индексов значения долей дополнены точными границами 95%- ных ДИ, которые можно вычислить с помощью признанного эталонным пакета статистических программ для точных непараметрических методов StatXact [62]. Вероятностной моделью этих данных является полиномиальное распределение, и эта программа является фактически единственной, которая проводит корректное вычисление точных ДИ для его параметров. Для большинства подобных оценок достаточно указывать значения долей и границ ДИ с точностью до двух значащих цифр.

Входной файл для проверки согласия с РХВ в данном случае имеет вид:

CYP2C9

3

100

18 0

28 0 2

Результат:

Heterozygote deficiency test: P-value=0.70; S.E=0.0037

Heterozygote excess test: P-value=0.32; S.E=0.0068

Probability test: P-value=0.45;

S.E=0.0060

Анализируемые данные статистически согласуются с равновесием Харди-Вайнберга: все три p-значения статистически незначимы. Программа GENEPOP позволяет оценивать не только общееFIS, но и частные (парциальные) FIS для каждой аллели по-отдельности:

Fis

 

-------

Sample count

Allele

Frequency W&C

 

1246

0.8311

-0.1036

2

18

0.0608

-0.0614

3

32

0.1081

0.0223

Tot

296

-0.0541

 

Тестирование неравновесности передачи аллелей

и/или сравнение групп случаев и контролей

Генетика есть наука о наследственности и изменчивости. Наследственность есть фундаментальное свойств живых организмов передавать свои признаки и гены в ряду поколений. Если данная аллель и генотип чаще встречаются у особей с данным признаком, и они действительно определяют до определенной степени этот признак, то это их преобладание должно проявляться также и в предыдущих и последующих поколениях. Они должны передаваться в чреде поколений неслучайно, неравновесно. Для выявления таких неравновесностей давно разработаны специальные тесты, которые так и называются ТНПА – «тесты неравновесности передачи аллели» (TDT – TransmissionDisequilibriumTest).

В любом исследовании ассоциации гено- тип-фенотип подбор контрольной группы имеет решающее значение. Как бы исследователи ни старались подобрать равноценные контроли и случаи, невозможно быть абсолютно уверенным, что ничто не упущено. Таким образом, когда обнаруживается связь генотип-фенотип, всегда возникает беспокойство, что она может быть вызвана не неравновесностью по сцеплению, а неадекватно подобранными контролями. Тест на неравновесную передачу аллелей позволяет избежать проблемы подбора группы контролей, сопоставимой с группой случаев. Один из способов полностью избежать проблемы сопоставления — это использовать внутренние контроли, данные о которых поступают от тех же людей, что и данные о случаях. ТНПА реализует эту идею. ТНПА проводят с семьями, в которых есть один или несколько пораженных потомков. При этом неважно, поражен ли кто-либо из родителей. Этот тест позволяет проверить гипотезу о том, что аллель M1 маркера М связана с интересующим признаком (например, с заболеванием).

77

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/

КЛИНИЧЕСКАЯ ПСИХОФАРМАКОГЕНЕТИКА

Для этого отбирают случаи, в которых родитель является носителем гетерозиготной комбинации аллели M1 с любой другой аллелью MX маркера M. Если аллель M1 необязательно связана с развитием болезни, то тогда пораженные потомки не обязательно унаследуют эту аллель. Однако, если аллель M1 играет какую-либо роль в предрасположенности к данной болезни, то можно ожидать, что пораженные дети в этой группе будут наследовать от родителя аллель M1 чаще, чем другую его аллель. Поэтому поступают следующим образом:

Выявляют пораженных пробандов, и их и их родителей генотипируют по маркеру М. Рассматривают данные только от тех родителей, которые гетерозиготны по маркерному аллели M1. Не имеет значения, какой является другая аллель (при условии, что это не аллель M1).

В каждом случае показан только один родитель.

ТНПА, основанная на стандартной статистике критерия χ2, предельно проста:

(a b)2 / (a + b),

где a – число случаев, когда гетерозиготный родитель передал аллель M1 пораженному потомству, а b – число случаев, когда - передается другая аллель MX.

На рисунке 13 представлена схема проведения теста неравновесности передачи аллелей на примере диабета 1-го типа. 94 семейства были исследованы на предмет наличия связи между диабетом 1-го типа и конкретной аллелью в повторяющейся последовательности перед геном инсулина. Среди этих 94 семей было 57 родителей, которые были гетерозиготными по исследуемой аллели M1 (на рисунке это I) и некоторыми другими аллелями MX (на рисунке это X). Эти 57 родителей передали 124 аллели потомству с диабетом (у некоторых было более одного больного ребенка), из них 78 были аллели M1 и 46 аллели MX.

94 семьи с одним и более детей, страдающих диабетом

37 семей, в которых ни один роди-

тель не является гетерозиготой по 57 семей, в которых один родитель является гетерозиготой по аллели M1 аллели M1

 

 

 

 

Аллель M1 перенесена от родителя

От родителя к ребенку перенесена

 

к ребенку, 78 случаев

другая аллель MX

Рис. 13. Пример данных для ТНПА [79]

При равновесной передаче аллелей M1 и MX от родителей к пораженным болезнью потомкам их число должно быть примерно одинаковым. В данном примере статистика критерия для проверки их равенства принимает значение χ2 = (78 46)2 / (78 + 46) = 8,26, чему соответствует р = 0,0041. Точный (биномиальный) критерий дает p = 0,0052. Таким образом, анализируемые данные демонстрируют статистически значимую связь между аллелью M1 и диабетом 1-го типа.

Однако значения бейзова фактора получаются малыми:BF01 = 0,42; BF10 = 2,38 (их можно вычислить с помощью интерактивной программы Bayesfactorforabinomiallydistributedobservation [80].Согласно вербальной шкале (табл. 8б) такие значения BFпринято интерпретировать как пренебрежимо малые. То есть, несмотря на статистическую значимость, эти результаты не по-

зволяют ни подтвердить, ни отклонить гипотезу о равновесности передачи аллелей M1 и MX от гетерозиготных родителей к детям, пораженным диабетом 1 типа.Подобные тесты разработаны и для более сложных сценариев, когда отсутствуют сведения об одном из родителей (общая проблема в случаях с поздними заболеваниями). Если отсутствуют сведения об обоих родителях, то можно сравнивать частоты аллелей между пораженными и непораженными сибсами и т.п. [79].

Метаанализ

Недавно Bousmanetal., 2019 [81] провели систематический обзор и метаанализ пяти проспективных рандомизированных контролируемых исследований (РКИ), в которых изучались инструменты поддержки принятия решений

78

 

Глава 5. СТАТИСТИКО-МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ГЕНОМИКИ

(ИППР) с помощью фармакогенетики, относя-

ли больше шансов достичь ремиссии симптомов

щиеся к ремиссии депрессивных симптомов при

по сравнению с лицами, получавшими лечение

большом депрессивном расстройстве (БДР). По

в обычном режиме (n = 850) (рис. 14). Авторы

мнению авторов, лица, получавшие терапию на

утверждают, что фармакогенетически управля-

основе фармакогенетического ИППР (n = 887),

емые ИППР могут улучшить ремиссию симпто-

в 1,71 раза (95% ДИ: 1,17–2,48; р = 0,005) име-

мов у пациентов с БДР.

Рис. 14. Данные пяти РКИ и результаты их метаанализа [81]

Здесь мы наблюдаем проявление «синдрома

Однако уже 99% ный ДИ для RR(от 0,71 до 4,16)

статистической снисходительности». Авторы по

накрывает безразличное значение RRindiff = 0.

инерции продолжают ориентироваться на прео-

Это означает, что уже на уровне значимости α =

доление традиционно и повсеместно используе-

0,01 эффект следует признать статистически не-

мого уровня значимости α = 0,05 и, соответствен-

значимым. Согласно современным требовани-

но, используют уровень доверия (доверительную

ям, предъявляемым к метаанализу, полагается

вероятность) (1 – α) = 95%. При этих условиях

вычислять не только доверительны интервалы

95% ный ДИ (от 1,17 до 2,48) для оценки сво-

(ДИ), но и предсказательные интервалы (ПИ).

дного значения RR(отношения рисков или от-

Авторы приводят границы 95%-ного ПИ: 0,52;

носительного риска) не накрывает безразличное

5,62, а 99%-ный ПИ, естественно, получается

значение RRindiff = 0, и формально эффект, оцени-

еще более широким: от 0,26 до 11,42 (рис. 15).

ваемый этим интервалом, можно признать ста-

Таким образом, очевидно, следует отнестись

тистически значимым,но всего лишь на самом

более скептически к излишне оптимистичным

снисходительном уровне значимости α = 0,05.

утверждениям авторов.

Метаанализ

95%

 

99%

 

 

 

 

 

RR = 1,01 1,72 2,93;ПИ = 0,55 – 5,39

 

RR = 0,71 1,72 4,16;ПИ = 0,26 – 11,42

 

Рис. 15. «Древовидные»графики (forestplot) для результатов метаанализа

пяти проспективных рандомизированных контролируемых исследований, в которых изучалось влияние фармакогенетической терапии на ремиссию при большом депрессивном расстройстве.

Обозначения: 95% и 99% — уровни доверия (доверительные вероятности) и/или предсказания, RR – относительный риск, ПИ – предсказательный интервал. Черные отрезки – ДИ, зеленые – ПИ.

Использована программа Meta-Essentials [82].

79

Рекомендовано к покупке и изучению сайтом МедУнивер - https://meduniver.com/