Genética de origem. Composição da população

Continuamos nossa série de materiais sobre genética de origem. Em um artigo anterior , falamos sobre o que são haplogrupos, como são estudados e como as rotas de migração são construídas sobre eles. Hoje, o Atlas compartilhará informações sobre populações: como elas diferem dos povos, por que é difícil estudar seu pool genético e como determinar a participação em uma população por meio de um teste genético.



Por que a genética usa o conceito de população


Em vez de nacional ou étnico, os conceitos de população e composição populacional são usados ​​na genética de origem. Isso se deve ao fato de o conceito de nacionalidade se referir mais à identificação política do que à etnia.

A etnia ou nacionalidade é determinada mais por normas culturais, do que pela genética. Portanto, uma pessoa que cresceu em um determinado ambiente cultural pode se relacionar com uma nação e a origem real de seus ancestrais pode ser diferente. Portanto, os cientistas falam sobre populações - grupos que existem há muitas gerações e nos quais mais da metade dos casamentos estavam dentro do grupo.

A população é mais fácil de identificar por características geográficas e étnicas, porque geralmente os casamentos são feitos com residentes próximos do mesmo grupo. A maioria dos povos é simultaneamente uma população. No entanto, existem povos em que mais de 50% dos casamentos são com representantes de outro grupo. Eles não podem ser atribuídos à população.


Tabela com diferenças entre pessoas e populações. Fonte .


Qual é a dificuldade de determinar populações


As diferenças genéticas entre diferentes grupos de pessoas são baixas em comparação com outros primatas. Os genomas dos chimpanzés na África Oriental e Ocidental diferem mais um do outro do que os genomas de duas outras pessoas no planeta, onde quer que morem. Essa é a dificuldade em determinar a qual população uma pessoa pertence.

Outra complicação é que, ao longo da história, as pessoas, especialmente os europeus, migraram constantemente, casaram-se com outras populações e os genes dos pais se misturaram. E quanto mais pessoas de uma população se moviam e se misturavam com outra, mais DNA diverso era obtido da próxima geração e mais difícil era encontrar o modelo de DNA para eles.



Devido à recombinação, as crianças podem não herdar algumas variantes de genes que são características de uma população específica.

O DNA humano pode transmitir informações sobre populações de ancestrais de diferentes épocas. E aqueles que viveram recentemente, e aqueles que viveram centenas de anos atrás. Para determinar o que eram essas populações, as seções dos cromossomos do usuário são comparadas com amostras de representantes de diferentes grupos.


Como as populações estudam


Para amostragem, é usada a análise de componentes principais (PCA). Esse algoritmo pesquisa independentemente padrões em dados de genotipagem e permite dividir as amostras em grupos no espaço N-dimensional, geralmente bidimensional. Um exemplo de visualização dessa análise pode ser encontrado aqui . Com ela, peneiramos amostras intermediárias e selecionamos apenas aquelas que são características de uma determinada população.



Neste exemplo, você pode ver como são formados grupos de diferentes populações. As opções intermediárias que se enquadram na zona entre diferentes clusters são eliminadas.

Assim, obtemos clusters cujos tamanhos e limites dependem da semelhança das amostras dentro do grupo. Com eles, comparamos os dados da genotipagem ou do sequenciamento em todo o genoma e os atribuímos ao cluster mais semelhante.

Nem todo o DNA é comparado, mas suas partes individuais. Para cada um deles, a amostra mais próxima da base é selecionada. Como alguns sites podem ser semelhantes em diferentes populações, os dados passam por uma verificação adicional. Verificamos todos os sites próximos. Por exemplo, se dentre vários sites pertencentes a populações do norte da Europa encontrarmos uma amostra do leste da Ásia, verificaremos novamente.



Quanto mais amostras um cluster contém, mais precisamente o algoritmo determinará as populações. Além disso, a precisão depende dos dados de origem. Com o seqüenciamento em todo o genoma, obtemos mais informações para comparação do que após a genotipagem. No entanto, é importante lembrar que mesmo o genoma completo não fornece um resultado de 100%. As amostras coletadas de diferentes populações geralmente contêm dados de genotipagem, pois são muito mais baratos. O algoritmo para determinar populações de origem se tornará mais preciso à medida que aparecerem amostras com os resultados do seqüenciamento em todo o genoma.

Existe uma opinião errônea de que apenas o cromossomo Y e o DNA mitocondrial são analisados ​​para determinar a composição da população. Ou seja, para as mulheres, a composição da população só pode ser determinada pela linha materna. Isso não é verdade. De acordo com esses dados, apenas informações sobre haplogrupos podem ser obtidas, mas elas não se aplicam a populações específicas. Por exemplo, o haplogrupo R1a, que é frequentemente encontrado entre os russos, é difundido entre os eslavos ocidentais e orientais, bem como entre as populações do norte da Índia.

Uma população não pode ser associada a um haplogrupo, porque, como regra, outros também são comuns nela. No entanto, eles ajudam a entender a história da formação da população como um todo. Leia mais sobre haplogrupos em nosso artigo anterior .


Como fica na sua conta


Na seção Geografia, o usuário vê a proporção percentual entre partes do mundo. Por exemplo, entre Europa, Ásia e África.



Quando você clica no botão Mais, o usuário acessa a página de preenchimento. Aqui está uma porcentagem detalhada de cada população. O mapa também mostra a área aproximada de cada grupo.



No próximo artigo, o Atlas lhe dirá em detalhes sobre os neandertais: que porcentagem de seus genes é encontrada em diferentes populações, como seus genes afetam a saúde do homem moderno e também o que outros povos antigos viviam na época.

All Articles