Оценка застенчивости создается путем добавления этих элементов, стараясь «перевернуть» элементы по мере необходимости, чтобы высокий балл означал высокую степень застенчивости. Если бы наша мера застенчивости состояла из десяти элементов, получивших 0, 1 и 2 балла, общее количество баллов могло бы варьироваться от 0 до 20. Простое добавление таких элементов рассматривает каждый элемент как одинаково полезный, но не все элементы одинаково полезны. По этой причине элементы часто добавляются после того, как они взвешиваются по какому-либо критерию их полезности для отражения конструкта застенчивости.

Точно так же создаются полигенные оценки, за исключением того, что вместо пунктов в вопроснике мы суммируем генотипы SNP. Как трехбалльная шкала оценки застенчивости, Генотипы SNP подсчитываются как 0, 1 или 2, что указывает на количество «возрастающих» аллелей, как в примере FTO SNP. Точно так же, как мы можем сложить аллели для одного SNP, чтобы получить генотипическую оценку, мы можем также сложить аллели для многих SNP, чтобы создать полигенную оценку, точно так же, как мы добавляем элементы анкеты, чтобы получить оценку застенчивости. Результаты полногеномных ассоциативных исследований используются для выбора SNP и присвоения веса каждому SNP. Например, в анализе веса GWA SNP FTO учитывает гораздо большую дисперсию, чем другие SNP, поэтому он должен учитывать гораздо больше в полигенной оценке веса .

В следующей таблице показано, как полигенная оценка одного человека создается из десяти SNP. Для первого SNP генотип этого человека - AT.

Для этого SNP аллель Т оказывается возрастающим аллелем, положительно связанным с признаком. Таким образом, индивидуальный генотипический показатель для этого SNP равен 1, потому что генотип имеет только один возрастающий Т-аллель.

По десяти SNP у индивидуума в общей сложности девять возрастающих аллелей для признака из возможных 20 баллов. Таким образом, этот индивидуум будет иметь полигенный балл чуть ниже среднего балла по популяции, равного 10 для этого признака.

Эта оценка просто добавляет количество увеличивающихся аллелей, что достаточно хорошо работает в качестве полигенной оценки. Однако мы можем повысить его точность, взвесив генотипическую оценку для каждого SNP в зависимости от того, насколько SNP коррелирует с признаком. Корреляция между каждым SNP и признаком взята из анализа GWA. Если один SNP в пять раз больше коррелирует с признаком, чем другой SNP — например, SNP 1 по сравнению с SNP 10 — он должен учитываться в пять раз больше в полигенной шкале.

Возрастающий аллель

Аллель

1

Аллель 2

Генотипическая оценка

Корреляция с чертой

Взвешенная генотипическая оценка

СНП 1

Т

А

Т

1

0,005

0,005

СНиП 2

с

г

г

0

0,004

.000

СНП 3

А

А

А

2

0,003

0,006

СНП 4

г

г

г

1

0,003

0,003

СНП 5

г

С

с

0

0,003

.000

СНП 6

Т

А

Т

1

0,002

0,002

СНП 7

С

С

г

1

0,002

0,002

СНП 8

А

А

А

2

0,002

0,004

СНП 9

А

Т

р

()

0,001

.000

СНП 10

г

С

г

1

0,001

0,001

Полигенная оценка

9

0,023

Таблица 3 Оценка полигенности для одного человека на основе десяти SNP

Взвешенные генотипические баллы в последнем столбце таблицы представляют собой произведение генотипического балла для каждого SNP и корреляции с признаком.

Сумма этих взвешенных генотипических оценок для десяти SNP равна

0,023. Это число не так поддается интерпретации, как невзвешенная генотипическая оценка 9, которая представляет собой просто сумму «возрастающих» аллелей. Однако как невзвешенная полигенная оценка 9, так и взвешенная оценка 0,023 могут быть выражены просто как процентиль в популяции. Для этого человека оба типа указывают на полигенность чуть ниже среднего.

Сколько SNP должно войти в полигенную оценку ? Первоначально полигенные оценки были созданы с использованием только значимых «попаданий» для всего генома из исследования GWA. Что касается веса, девяносто семь независимых SNP достигли общегеномной значимости. Создание полигенной оценки из этих девяноста семи SNP объясняет 1,2% дисперсии веса в независимых выборках. Это лишь немногим лучше, чем прогноз самого FTO SNP, который объясняет 0,7% дисперсии.

Использование только значимых совпадений для всего генома — это то же самое, что требовать, чтобы каждый элемент нашей шкалы застенчивости сам по себе был значительным предсказателем. Мы не делаем этого для других психологических оценок, потому что нереально ожидать, что каждый пункт будет стоять сам по себе. Цель состоит в том, чтобы максимально использовать составную шкалу.

Идея получше состоит в том, чтобы делать то, что мы делаем, когда создаем другие психологические оценки: продолжайте добавлять пункты, пока они повышают надежность и достоверность композита в независимых выборках. Для полигенных оценок ключевым критерием является предсказание. Новый подход к полигенным показателям состоит в том, чтобы продолжать добавлять SNP до тех пор, пока они увеличивают прогностическую способность полигенного показателя в независимых выборках. Это стратегия, которая за последние два года окупилась благодаря получению мощных полигенных оценок психологических черт. Некоторые ложноположительные результаты будут включены в полигенную оценку, но это приемлемо, пока сигнал увеличивается по сравнению с шумом в том смысле, что полигенная оценка предсказывает большую дисперсию.

Например, для ИМТ полигенная оценка, основанная на девяносто семи значимых для всего генома SNP, предсказывает 1 процент дисперсии, а полигенная оценка, включающая 2000 SNP, предсказывает 4 процента дисперсии ИМТ. Включение еще большего количества SNP в полигенную оценку увеличивает прогноз до 6 процентов дисперсии. Многие ложноположительные SNP проникают в эту полигенную оценку, но они не портят прогноз, они просто не помогают. Увеличение прогностической способности полигенной оценки с 1% до 6% делает это очень приемлемым компромиссом между сигналом и шумом.

Для сложных признаков и распространенных расстройств этот новый подход к полигенным показателям включает не только десять, сотню или даже тысячу SNP. Как правило, в полигенные баллы включаются десятки тысяч SNP, иногда сотни тысяч. Это эмпирический метод — продолжайте добавлять SNP до тех пор, пока они увеличивают способность прогнозировать в независимых выборках.

Сводная статистика GWA, необходимая для создания полигенных оценок, в настоящее время доступна для сотен признаков в области биологии и медицины, а также психологии. После публикации исследования GWA многие исследователи делают свои сводные статистические данные GWA общедоступными, чтобы любой мог использовать их для создания полигенных оценок. Чтобы дать представление о взрывном росте исследований GWA за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA для 173 признаков, основанную на 1,5 миллионах человек и 1,4 миллиардах ассоциаций SNP-признаков. Эти черты включают двадцать психологических черт и расстройств и переменных, имеющих отношение к психологии, таких как социальная депривация, курение, продолжительность сна, возраст наступления менархе и менопаузы и возраст смерти отца. Они также включают физиологические черты, имеющие отношение к психологии, такие как иммунологические и метаболические биомаркеры.