Análise de Código Genético II


Ilustração melmagazine.com ( Fonte )

Atualmente, redes públicas com canais que não estão protegidos contra o invasor são amplamente utilizadas para troca de informações. Como a proteção está organizada pode ser lidaaqui.

Na mensagem, o remetente protege a integridade, a confidencialidade, a disponibilidade da mensagem, para a qual são utilizados os resultados das teorias da codologia, criptologia e esteganologia .

No presente trabalho, continuamos a considerar apenas uma questão específica - a análise dos códigos de mensagens.

Existe um interesse crescente no estudo e no uso do código genético (HA) em conexão com o desenvolvimento da nanotecnologia. Mas as limitações do modelo GK estão longe de serem satisfatórias para todos os pesquisadores, e aqueles que estão satisfeitos ainda estão insatisfeitos com determinados detalhes.

O fato é que o modelo de GC existente não permite explicar muitos fenômenos e fatos estabelecidos experimentalmente. No entanto, isso não é surpreendente, mas provavelmente natural. A área é relativamente nova e bastante complexa, e o tempo passou desde que sua descoberta é relativamente pequena, o número de pessoas que dedicaram seu tempo a ela também é muito limitado. Os esforços de pesquisadores individuais visam melhorar o modelo GK. Para esse fim, são utilizadas as propriedades dos aminoácidos proteinogênicos (consulte a tabela 1). A classificação racional moderna de aminoácidos é baseada na polaridade dos radicais (grupos R), ou seja, na capacidade de interagir com a água em valores fisiológicos de pH (próximo a pH = 7,0).

Tabela 1 - Propriedades dos aminoácidos proteinogênicos


Descrição Corrigida Genética


A familiaridade com as descrições do Código Civil em uma variedade de fontes deixa uma sensação de confusão nos textos, definições e raciocínio. Se em um organismo vivo a ciência estabeleceu e opera um sistema de transferência de informações, e é assim que a biologia molecular interpreta os méritos dos pesquisadores pioneiros, seria bom estabelecer uma analogia desse sistema com sistemas similares em tecnologia para maior clareza da imagem.

Aparentemente, leitores e seguidores não se preocupam em pensar no conteúdo do material publicado por outros autores. Isso se reflete na manifestação da inércia do pensamento humano e na influência da pressão sobre os nomes das autoridades na consciência.

Não há descrição clara e transparente dos conceitos individuais ou do próprio código. Apresentamos breves descrições esquemáticas de tal sistema em tecnologia e em um organismo vivo.

. ( ), ( ) .
. , : . ( ) , , . , . . . () .

Abaixo, no texto, estão alguns esquemas simplificados para a transmissão de informações em tecnologia usando um sistema de codificação e em organismos vivos usando um sistema de codificação criado pela própria natureza. Nesse caso, todos os elementos obrigatórios dos sistemas e o processo de seu funcionamento são nomeados.

No esquema geral de troca de informações de assinantes em um sistema de comunicação usando códigos de bloco, os seguintes conceitos e os elementos correspondentes de um sistema de comunicação podem ser distinguidos:

  • Fonte das mensagens (informações) - textos, documentos de arquivo, imagens de áudio, vídeo, etc.
  • O remetente da mensagem em algum alfabeto;
  • Mensagem - muitas palavras de informação digitalizadas;
  • Codificador - um dispositivo ou programa de computador que implementa a conversão de uma mensagem do remetente em palavras de código;
  • , ;
  • , ;
  • , , , ;
  • , ;
  • () .

Alguns dos elementos do sistema podem ser combinados em um com as mesmas funções ou funções modificadas. O alfabeto pode ser única (binário) nos transmitir e receber os lados, a fonte eo remetente da mensagem, bem como o receptor e usuário pode ser uma pessoa, as funções do descodificador podem ser limitados a detecção de erros sem corrigi-los, mas com a remoção de palavras-código distorcidas, etc.

O que deveria ser a partir da descrição existente do código genético e do funcionamento de um organismo vivo ?

Consideramos uma célula no núcleo da qual é um conjunto de cromossomos representados por moléculas de DNA registradas na forma de uma sequência de genes separados por "vírgulas". Cada gene é formado por 3 códons de letras (trigêmeos) em um alfabeto de 4 letras.

Não há separadores (vírgulas) entre os códons (trigêmeos) dentro do gene; os trigêmeos (códons, palavras) são escritos em um fluxo contínuo e não ramificado. Os cromossomos, em geral e nos genes individuais, têm uma carga de informação chamada informação hereditária, que é transmitida às células de uma nova geração como resultado do processo de divisão das células-mãe.

O preenchimento semântico e informativo dos genes herdados dos pais são os atributos físicos de um organismo (indivíduo) de um determinado tipo não registrado explicitamente. A transmissão dos sintomas (por exemplo, cor do cabelo) é de vários estágios: tripleto-aminoácido-enzima-proteína-órgão ou tecido corporal. Esses sinais não são registrados explicitamente, mas indiretamente, através das proteínas sintetizadas. As proteínas, aminoácidos, trigêmeos envolvidos na síntese são diferentes para loiras e morenas. As proteínas para loiras (pais loiros) serão utilizadas em diferentes tecidos e órgãos, proporcionando aos descendentes a aparência de características herdadas e a cor dos cabelos.

Supõe-se que esses conjuntos de enzimas sintetizadas na célula e forneçam a formação adicional de toda a variedade de proteínas necessárias ao crescimento e desenvolvimento do corpo, garantam o surgimento do genótipo, que é determinado por hereditariedade. A lista completa de códons (trigêmeos) é limitada a 4 3 = 64, mas a composição e a sequência desses códons que formam o gene é muito grande. Cada aminoácido (enzima, proteína) requer um conjunto separado de códons ou um gene para sua síntese.

Todas as proteínas de um organismo em particular são únicas. Uma proteína alienígena que entra no corpo ou uma proteína distorcida do corpo, tomada como estranha, é rejeitada pelo corpo. Este é o sistema imunológico. É esse sistema que verifica a correção da codificação de proteínas usando o genoma. Em outras palavras, o papel das palavras de código é desempenhado por proteínas sintetizadas no corpo, e o sistema imunológico atua como um decodificador.

O destinatário de uma mensagem processada por um decodificador deve ser considerado órgãos e tecidos de um organismo vivo que utiliza proteínas específicas para crescimento e atividade vital. O usuário da mensagem é o próprio organismo.

Pode-se supor que o cromossomo e os genes originais tenham surgido originalmente da característica requerida, formada pela lista de proteínas, e através de proteínas dos aminoácidos que formaram a lista desejada de proteínas e, finalmente, dos códons que sintetizam esses aminoácidos. Assim, informações sobre a característica de um organismo podem ser inicialmente registradas em genes e cromossomos, que são armazenados neles, transmitidos durante a divisão celular para novas gerações de células e organismos. Uma característica desejável para o organismo foi fixada e preservada por muitas e muitas gerações. Embora o que foi dito aqui contradiga o dogma central da biologia molecular, a cadeia listada pode ser traçada mentalmente em ambas as direções.

Então, a que chegamos quando comparamos dois sistemas de transferência de informações (ao vivo e técnicos):

  • A fonte das mensagens (informações) é a célula e nela a fonte e transportadora de DNA.
  • , – , ;
  • – () , ;
  • , , , , « » ;
  • , — ;
  • , — , , ;
  • – , ;
  • , , – ;
  • () – , .

( )


. , « , , » . .

« , » ..
. – , . , .

Distinguir a imunidade celular e, juntamente com os produtos proteicos de sua própria atividade (imunidade humoral). O sistema atua como um todo. Inclui aproximadamente 10 12 linfócitos e 10 20 moléculas de imunoglobulina, com a tarefa de identificar antígenos.

Antígenos (Ag) são moléculas e células de animais da mesma espécie ( alogênica ), de outra espécie ( exógena ), além de artificiais ou sintéticos. Antígenos alogênicos produzidos pelo próprio corpo, mas modificados, são chamados de autólogos .

Após a identificação do antígeno, o sistema imunológico o neutraliza e o remove usando células T especiais ou anticorpos(At), que são produzidos pelas células B. Os fatores humorais chamados complemento e o sistema adequado desempenham as mesmas funções . A fagocitose e a destruição intracelular de Ag são realizadas por macrófagos .

Todos esses componentes do sistema imunológico formam a rede imunológica do corpo.
Essa rede algumas vezes tem hipersensibilidade e outras vezes imuno-tolerância ou imunodeficiência, o que é uma violação da norma.

No primeiro caso, ocorre uma resposta imune excessiva e, no segundo, é manifestada pela ausência de uma resposta imune seletiva. O caso mais difícil é quando antígenos alogênicos se tornam autólogos e o sistema imunológico do corpo começa a trabalhar contra si mesmo. Isso completa o mapeamento de sistemas.

Outra abordagem para o desenvolvimento de um GC consiste em representar seus elementos como estruturas algébricas (campo de Galois) e espaciais ( ver artigos ). De acordo com as descrições disponíveis do Código Civil, a lista de suas palavras contém 64 trigêmeos, cada um deles pode ser comparado ao topo de um único cubo.

A Figura 2 mostra um cubo tridimensional único com 2 6 = 64 vértices, de acordo com Yablonsky.

Código genético (continuação)

Em nosso mundo tridimensional (n = 3), na natureza animada e inanimada, existem fenômenos surpreendentes chamados auto-organização e auto-montagem de elementos, por exemplo, na natureza inanimada, a nucleação e crescimento de cristais. Nesse fenômeno, o efeito das leis cristalográficas da natureza se manifesta. Com o tempo, o homem descobriu essas leis, as explicou e se colocou ao serviço. Em 1848, Auguste Brave deduziu geometricamente 14 tipos de redes espaciais (translacionais) formadas por células idênticas em forma.

Em 1890, E. S. Fedorov estabeleceu a existência de 17 grupos cristalográficos algébricos planares e 230 espaciais. Essa descoberta do cientista determina, em particular, as possibilidades e limitações da natureza para construir cristais. A propriedade de ser um cristal para substâncias é bastante rara. A maioria das substâncias, mesmo em soluções, prefere permanecer (amorfa) na forma desordenada por emulsões, suspensões ou colóides e não cristaliza.

Do ponto de vista da matemática, as redes cristalográficas realizam tipos simples e complexos de simetrias. As pinturas de Escher ilustram muitos deles. Cristais em espaços de duas e três dimensões não têm simetria de rotação de 5 raios - esta é a limitação cristalográfica do nosso mundo com geometria tridimensional. Em um mundo quadridimensional, essa restrição é removida. Entre a diversidade existente da matemática, uma oportunidade de destacar e uma classe mais estreita de simetrias - polígonos regulares em um avião e poliedros regulares no espaço n-dimensional, Rosenfeld B. V. Karasev .

Tabela 2 - Poliedros regulares e suas características (caso n = 3)

p * - número de vértices na face; q * é o número de faces adjacentes ao vértice.

Tabela 3 - Poliedros regulares e suas características (caso n = 4)


Em cada vértice do poliedro q convergem p-gons idênticos.
Os valores (p, q, r) para um 4-poliedro regular são determinados por soluções inteiras da desigualdade sin (π / p) · sin (π / r)> cos (π / q). Existem apenas 6 soluções inteiras, todas elas listadas na tabela 3. A

matemática, como sempre, oferece muito mais oportunidades do que a natureza ou o homem pode imaginar. Embora seja possível que nosso conhecimento da natureza seja muito limitado. Um caso de comportamento reflexivo hereditário das abelhas é conhecido quando elas criam armazenamentos hexogonais para suas reservas de mel.

A partir da análise do HA e levando em consideração as propriedades adicionais dos elementos de código do modelo espacial da colocação de seus elementos, segue-se que esses elementos são organizados levando em consideração as várias simetrias espaciais das moléculas de aminoácidos.

Como o dodecaedro de 20 vértices está conectado (matematicamente) com a genética dos organismos vivos não está completamente claro. Mas as faces de cinco lados do dodecaedro e o resultado de limitações cristalográficas da natureza se manifestam na ausência de simetria rotacional dos cinco cincos aminoácidos nos vértices das faces.

Dentre os 5 possíveis 3-poliedros corretos para modelagem da natureza, não foi selecionado o mais simples, mas atende ao requisito quantitativo das enzimas celulares sintetizadas (20). Tantos picos que o dodecaedro tem. Os 20 aminoácidos existentes (enzimas celulares) podem ser mapeados para os vértices do dodecaedro, em uma ordem específica. De fato, foi possível colocar 20 aminoácidos no espaço (n = 3) para que suas coordenadas correspondessem aos vértices do dodecaedro, e certas propriedades do poliedro refletissem as dependências simétricas dos aminoácidos.



A figura mostra I - o plano da anti-simetria inversa; II - o avião que divide os "antípodas". A interseção dos planos é um dos eixos de rotação do dodecaedro.

As letras A e B com índices (superior e inferior) e sinais (±) denotam aminoácidos que possuem certas propriedades (Tabela 1). Portanto, no lado esquerdo da Figura 1, todos os elementos acima do plano horizontal que passa pelo centro do poliedro são marcados com e abaixo da horizontal com ⊖, que caracterizam a polaridade dos aminoácidos.

Em 1968, Rumer Yu. B. propôs e forneceu uma descrição matricial e gráfica das conformações (Tabela 4).

Tabela 4- Conformações (64) de um gráfico de 4 links e suas descrições (de acordo com Rumer) A


disposição dos elementos e gráficos na tabela é tal que os elementos adjacentes em um bloco diferem entre si por apenas um valor (1 bit de informação). Assim, assemelha-se a um código Gray.

Modelo de codificação topológica de polímeros de cadeia. O autor identifica três componentes do modelo: código topológico; algoritmo de codificação em cadeia; um sistema de operadores físicos recriando uma estrutura codificada. O modelo usa as transformadas de Rumer [7].

Por exemplo, trigêmeos AAC, AAU - Asn; AAG, AAA - Lys à esquerda são convertidas para a direita substituindo as bases C - A; G - U.

Tabela 5 - Transformação da matriz de conformações em um HA tripleto (segundo Karasev V. Luchinin V.)

Na matriz [3 × 3] do gráfico, uma aresta conectada conecta os vértices com os números i e i-4 e corresponde a um valor de 1.

De acordo com as descrições de GC disponíveis, a lista de seus códons contém 64 trigêmeos, cada um dos quais pode ser associado a um vértice de um cubo de unidade. A Figura 2 mostra um único cubo tridimensional com 2 6 = 64 vértices.

Por outro lado, um campo Galois expandido GF (2 6 ) formado por 64 elementos e um único hipercubo (n = 6) com o mesmo número de vértices pode ser associado a 64 trigêmeos .



Figura 2 - Um único cubo ([11] de acordo com Yablonsky SV) com vértices marcados ([4,7] de acordo com Karasev, Rumer) elementos GK.

Como o número de vértices e trigêmeos coincide, podemos estabelecer uma relação um-para-um entre eles - uma bijeção, que é representável por uma permutação de elementos. Os aminoácidos de HA são atribuídos a cada vértice de um único cubo, um de cada vez.


Figura 3 - Partes do

código topológico do hipercubo . Um fragmento de 4 unidades de um polímero de cadeia (4a), que é transformado em um gráfico de cadeia (4b), é selecionado como o objeto inicial. Bordas do gráfico (kc) - ligações poliméricas são incidentes nos vértices (i, i-1, i-2, ..., i-4) dos pontos finais dos elos.

Os vértices do gráfico x1, x2, ..., x6 são variáveis ​​que assumem os valores 0 ou 1.


Figura 4 - Fragmento de quatro unidades do polímero de cadeia (a), seu gráfico (b) e a matriz do gráfico (c)

Tabelas do campo de Galois. Esta é a tabela de adição e a tabela de multiplicação de campos, incluindo também a tabela dos elementos do campo de Galois, que mostra várias representações dos elementos e algumas características dos elementos;

A coluna esquerda da tabela de elementos é o grau do elemento primitivo (000010) do campo. Esses graus percorrem todos os elementos do campo. As seguintes colunas: representação dos elementos do campo por polinômio, vetor binário, número decimal, ordem dos elementos do campo, vetor inverso multiplicativo, grau de polinômio inverso, inverso na representação decimal, peso da palavra de código.

Esteganografia e proteção de informações [1, 2, 12, 13, 14]


Sabe-se que o DNA é formado por uma sequência de genes, entre os quais são chamados éxons e íntrons. Os éxons codificam uma proteína, iniciam sua síntese e os íntrons não codificam nada. Eles foram chamados de genes "silenciosos". Enzimas especiais removem íntrons do DNA antes do início da síntese protéica.

Por exemplo, em uma pessoa no genoma, quase noventa por cento dos íntrons. Para aplicações esteganográficas, são os íntrons que são de interesse. Além disso, a propriedade de degeneração do HA permite não apenas a geração de recipientes artificiais de DNA, mas também a modificação de recipientes naturais.

Os contêineres de DNA após a incorporação de mensagens neles devem ir para o destinatário da mensagem. Isso pode ser feito de várias maneiras. Por exemplo, para introduzir no genoma do organismo ao qual o modelo da molécula de DNA usada pertence. Vírus comuns nos mostram um mecanismo de distribuição de DNA bem-sucedido.
Definição . A esteganografia é a ciência dos métodos para incorporar / recuperar, transmitir (armazenar) informações ocultas, nas quais um canal oculto é organizado com base e dentro de um canal aberto, usando os recursos de percepção da informação e, para esse fim, as técnicas que podem ser usadas:

  • ocultação completa da existência de um canal de comunicação oculto,
  • criando dificuldades para detectar, recuperar ou modificar mensagens ocultas transmitidas dentro de mensagens de contêiner aberto,
  • mascarando informações ocultas no protocolo.

O conceito geral de esteganografia é a criação de um canal oculto para transmitir informações entre o remetente (A) e o receptor (B). Assim, em uma mensagem, chamada contêiner ou mensagem de cobertura de um grande fluxo de mensagens nas redes, que é enviada pelo assinante A ≠ Um assinante B ≠ B encoberto (oculto de A e B ) é colocado (assinante incorporado A) outra mensagem menor volume ( aproximadamente a patente pode ser lida aqui ).

Diferentes condições e possibilidades para as desigualdades indicadas são consideradas. O primeiro par ou o segundo par pode ser uma pessoa ou a igualdade é realizada para os dois pares de assinantes, embora o último seja indesejável.

Nos anos 50 do século passado, Richard Feynman realizou uma justificativa teórica para a possibilidade de usar moléculas de DNA para organizar cálculos.
Definição . Um algoritmo esteganográfico é um par de transformações mutuamente invertíveis: o F: M × B × K → B direto e o F -1 inverso : B × K → M, correspondendo ao recipiente de resultados triplo (M - mensagem, pB - recipiente vazio, tecla K) e o par (zB é o contêiner cheio, K é a chave) é a mensagem inicial M e F (m, b, k) = b m, k ;
F -1 (b m, k , k) = m, onde m ∊ M; b, bm , k ∊ B; k∊ K.

O sistema esteganográfico (GHS) é chamado sistema S = (M, B, K, F, F -1 ), formado por conjuntos de mensagens, contêineres, chaves e transformações que os conectam.

A implementação (ocultação) / recuperação de uma mensagem por meio do GHS refere-se ao resultado da transformação esteganográfica direta / reversa com os valores correspondentes dos argumentos.
Definição . Sequenciamento é a determinação da sequência de nucleotídeos em um fragmento de DNA.

A presença e o desenvolvimento de tecnologia computacional, tecnologias microbiológicas permitiram falar e praticamente usar os elementos estruturais das células vivas (DNA, RNA, etc.) como recipientes esteganográficos [3,4]. As propriedades desses elementos para armazenar grandes quantidades de informações e ter dimensões microscópicas atraem a atenção de especialistas, apesar de trabalhar com eles exige alto treinamento profissional e o uso de equipamentos caros especializados

Lista de literatura usada:
1. .. . . — .: , 2003. 152 .
2. . . . . – .: -, 2002. – 272 .
3. . ., . . // . 2002. . 7. . 274 — 278.
4. .. / 23.03.2004, №470-2004.
5. . . . – .: , 1966. – 648 .
6. . . – .: ,1976. – 224.
7. . . // . 1968. . 183. .225-226
8. – . . – .: ,
9. . . : . – .: , 1999. – 352 .
10. . . -. . / . . . . . . .: , 1964. . 195 – 219.
11. . .– .: , 1979.–272 .
12. Bancroft F. C. Clelland C. DNA-based steganography. United States Patent №6.312.911. November 06,2001.US Patent & Trademark Office.
13. Bancroft F. C. Clelland C. DNA-based steganography. WO0068431. November 16,2000. World Intelltctual Property Organization.
14. Pfitzmann B. Information Hiding Terminologiy, Information Hiding //First International Workshoh. Vol. 1174 of Lecture Notes in Computer Science, Isaac Newton Institute, Cambrige, England, May 1996.- Berlin: Springer-Verlag/pp 347-350.

All Articles