Analisis Kode Genetik II


Ilustrasi melmagazine.com ( Sumber )

Saat ini, jaringan publik dengan saluran yang tidak dilindungi dari penyusup banyak digunakan untuk pertukaran informasi. Bagaimana perlindungan diatur dapat dibaca disini.

Dalam pesan tersebut, pengirim melindungi integritas, kerahasiaan, ketersediaan pesan, yang digunakan hasil teori kodologi, kriptologi, steganologi .

Dalam karya ini, kami terus mempertimbangkan hanya satu masalah tertentu - analisis kode pesan.

Ada gelombang minat dalam studi dan penggunaan kode genetik (HA) sehubungan dengan pengembangan nanoteknologi. Tetapi keterbatasan model GK masih jauh dari memuaskan bagi semua peneliti, dan mereka yang puas masih tidak puas dengan keterangan tertentu.

Faktanya adalah bahwa model GC yang ada tidak memungkinkan menjelaskan banyak fenomena dan fakta yang telah ditetapkan secara eksperimental. Namun, ini tidak mengejutkan, tetapi kemungkinan besar alami. Daerah ini relatif baru dan cukup kompleks, dan waktu telah berlalu sejak penemuannya relatif kecil, jumlah orang yang telah mencurahkan waktu mereka untuk itu juga sangat terbatas. Upaya masing-masing peneliti ditujukan untuk meningkatkan model GK. Untuk tujuan ini, sifat-sifat asam amino proteinogenik digunakan (lihat tabel 1). Klasifikasi asam amino rasional modern didasarkan pada polaritas radikal (kelompok-R), yaitu kemampuan mereka untuk berinteraksi dengan air pada nilai pH fisiologis (mendekati pH = 7,0).

Tabel 1 - Sifat asam amino proteinogenik


Deskripsi Genetika Terkoreksi


Keakraban dengan deskripsi Kode Sipil dalam berbagai sumber meninggalkan rasa kebingungan dalam teks, definisi dan alasan. Jika dalam makhluk hidup sains telah menetapkan dan mengoperasikan sistem transfer informasi, dan ini adalah bagaimana biologi molekuler mengartikan manfaat dari para peneliti perintis, akan lebih baik untuk membangun analogi sistem ini dengan sistem serupa dalam teknologi untuk kejelasan gambar.

Pembaca dan pengikut, rupanya, tidak perlu repot memikirkan konten materi yang diterbitkan oleh penulis lain. Ini mencerminkan manifestasi kelembaman dari pemikiran manusia dan pengaruh tekanan pada nama-nama otoritas pada kesadaran.

Tidak ada deskripsi yang jelas dan transparan tentang konsep individu atau kode itu sendiri. Kami memberikan uraian skematis singkat tentang sistem dalam teknologi dan organisme hidup.

. ( ), ( ) .
. , : . ( ) , , . , . . . () .

Di bawah ini dalam teks adalah beberapa skema yang disederhanakan untuk mengirimkan informasi dalam teknologi menggunakan sistem pengkodean dan pada organisme hidup menggunakan sistem pengkodean yang dibuat oleh alam itu sendiri. Pada saat yang sama, semua elemen wajib sistem dan proses fungsinya dinamai.

Dalam skema umum pertukaran informasi pelanggan dalam sistem komunikasi menggunakan kode blok, konsep berikut dan elemen yang sesuai dari sistem komunikasi dapat dibedakan:

  • Sumber pesan (informasi) - teks, dokumen arsip, gambar audio, video, dll.
  • Pengirim pesan dalam beberapa alfabet;
  • Pesan - banyak kata informasi digital;
  • Encoder - perangkat atau program komputer yang mengimplementasikan konversi pesan pengirim menjadi kata-kata kode;
  • , ;
  • , ;
  • , , , ;
  • , ;
  • () .

Beberapa elemen sistem dapat digabungkan menjadi satu dengan fungsi yang sama atau yang dimodifikasi. Alfabet dapat tunggal (biner) pada sisi pengirim dan penerima, sumber dan pengirim pesan serta penerima dan pengguna dapat menjadi satu orang, fungsi dekoder dapat dibatasi untuk mendeteksi kesalahan tanpa memperbaikinya, tetapi dengan menghapus kata sandi yang terdistorsi, dll.

Apa yang seharusnya dari deskripsi kode genetik yang ada dan berfungsinya organisme hidup ?

Kami menganggap sel dalam nukleus yang merupakan satu set kromosom diwakili oleh molekul DNA yang direkam dalam bentuk urutan gen yang dipisahkan oleh "koma". Setiap gen dibentuk oleh 3 kodon surat (kembar tiga) dalam alfabet 4 huruf.

Tidak ada pemisah (koma) antara kodon (kembar tiga) dalam gen; kembar tiga (kodon, kata-kata) ditulis dalam aliran yang berkelanjutan dan tidak bercabang. Kromosom pada gen umum dan individu memiliki beban informasi yang disebut informasi herediter, yang ditransmisikan ke sel-sel generasi baru sebagai hasil dari proses pembelahan sel induk.

Pengisian semantik, informasi gen yang diwarisi dari orang tua adalah atribut fisik dari suatu organisme (individu) dari jenis tertentu yang tidak dicatat secara eksplisit. Penularan gejala (misalnya, warna rambut) adalah multi-tahap: triplet-asam amino-enzim-protein-organ atau jaringan tubuh. Tanda-tanda ini tidak dicatat secara eksplisit, tetapi secara tidak langsung, melalui protein yang disintesis. Protein, asam amino, kembar tiga yang terlibat dalam sintesis berbeda untuk pirang dan berambut cokelat. Protein untuk pirang (orang tua pirang) akan digunakan di berbagai jaringan dan organ, memberikan keturunan dengan penampilan sifat-sifat yang diwariskan dan warna rambut.

Diasumsikan bahwa set enzim yang disintesis dalam sel dan menyediakan pembentukan lebih lanjut dari seluruh variasi protein yang diperlukan untuk pertumbuhan dan perkembangan tubuh, menjamin munculnya genotipe, yang ditentukan oleh faktor keturunan. Daftar lengkap kodon (kembar tiga) terbatas pada 4 3 = 64, tetapi komposisi dan urutan kodon tersebut yang membentuk gen sangat besar. Setiap asam amino (enzim, protein) membutuhkan seperangkat kodon atau gen yang terpisah untuk sintesisnya.

Semua protein dari suatu organisme tertentu adalah unik. Protein asing yang memasuki tubuh atau protein terdistorsi dari tubuhnya, diambil sebagai orang asing, ditolak oleh tubuh. Ini adalah sistem kekebalan tubuh. Sistem inilah yang memeriksa kebenaran pengkodean protein menggunakan genom. Dengan kata lain, peran codewords dimainkan oleh protein yang disintesis dalam tubuh, dan sistem kekebalan bertindak sebagai decoder.

Penerima pesan yang diproses oleh decoder harus dipertimbangkan organ dan jaringan organisme hidup yang menggunakan protein spesifik untuk pertumbuhan dan aktivitas vital. Pengguna pesan adalah organisme itu sendiri.

Dapat diasumsikan bahwa kromosom dan gen asli berasal dari sifat yang diperlukan, dibentuk oleh daftar protein, dan melalui protein dari asam amino yang membentuk daftar protein yang diinginkan, dan, akhirnya, dari kodon yang mensintesis asam amino ini. Jadi, informasi tentang sifat suatu organisme pada awalnya dapat direkam dalam gen dan kromosom, yang disimpan di dalamnya, ditransmisikan selama pembelahan sel ke generasi sel dan organisme baru. Ciri yang diinginkan untuk organisme itu tetap dan dipertahankan selama beberapa generasi. Meskipun apa yang telah dikatakan di sini bertentangan dengan dogma sentral biologi molekuler, rantai yang terdaftar dapat ditelusuri secara mental di kedua arah.

Jadi, apa yang kita ketahui ketika membandingkan dua sistem transfer informasi (langsung dan teknis):

  • Sumber pesan (informasi) adalah sel dan di dalamnya sumber dan pembawa DNA.
  • , โ€“ , ;
  • โ€“ () , ;
  • , , , , ยซ ยป ;
  • , โ€” ;
  • , โ€” , , ;
  • โ€“ , ;
  • , , โ€“ ;
  • () โ€“ , .

( )


. , ยซ , , ยป . .

ยซ , ยป ..
. โ€“ , . , .

Bedakan kekebalan seluler, dan bersama-sama dengan produk protein dari aktivitas mereka sendiri (kekebalan humoral). Sistem bertindak secara keseluruhan. Ini mencakup sekitar 10 12 limfosit dan 10 20 molekul imunoglobulin, dengan tugas mengidentifikasi antigen.

Antigen (Ag) adalah molekul dan sel dari hewan dari spesies yang sama ( alogenik ), spesies lain ( eksogen ), serta buatan atau sintetis. Antigen alogenik yang diproduksi oleh tubuh itu sendiri, tetapi kemudian dimodifikasi, disebut autologous .

Setelah identifikasi antigen, sistem kekebalan menetralkan dan menghilangkannya menggunakan sel T khusus atau menggunakan antibodi(At), yang diproduksi oleh sel B. Faktor humoral yang disebut pelengkap dan sistem properdin melakukan fungsi yang sama . Fagositosis dan penghancuran Ag secara intraseluler dilakukan oleh makrofag .

Semua komponen sistem kekebalan ini membentuk jaringan imunologis tubuh.
Jaringan seperti itu kadang-kadang memiliki hipersensitivitas, dan kadang-kadang toleransi terhadap imuno atau defisiensi imun, yang merupakan pelanggaran norma.

Pada kasus pertama, respon imun berlebihan terjadi, dan pada kasus kedua, dimanifestasikan oleh tidak adanya respon imun selektif. Kasus yang paling sulit adalah ketika antigen alogenik berubah menjadi autologous dan sistem kekebalan tubuh mulai bekerja melawan dirinya sendiri. Ini melengkapi pemetaan sistem.

Pendekatan lain untuk pengembangan GC terdiri dalam mewakili elemen-elemennya sebagai aljabar (bidang Galois) dan struktur spasial ( lihat makalah ). Menurut deskripsi yang tersedia dari Kode Sipil, daftar kata-katanya berisi 64 kembar tiga, masing-masing dapat dibandingkan dengan bagian atas kubus tunggal.

Gambar 2 menunjukkan kubus enam dimensi tunggal dengan 2 6 = 64 simpul menurut Yablonsky.

Kode genetik (lanjutan)

Dalam dunia tiga dimensi (n = 3) kita, di alam yang hidup dan mati, ada fenomena luar biasa yang disebut pengorganisasian diri dan perakitan unsur-unsur, misalnya, di alam mati, nukleasi dan pertumbuhan kristal. Dalam fenomena ini, efek hukum kristalografi sifatnya terwujud. Seiring waktu, manusia menemukan hukum-hukum ini, menjelaskannya, dan menempatkan dirinya pada kebaktian. Pada tahun 1848, Auguste Brave secara geometris mendeduksi 14 jenis kisi spasial (translasi) yang dibentuk oleh sel-sel identik dalam bentuk.

Pada tahun 1890, E. S. Fedorov menetapkan keberadaan 17 planar dan 230 kelompok kristalografi aljabar spasial. Penemuan ilmuwan ini menentukan, khususnya, kemungkinan dan keterbatasan alam untuk membangun kristal. Sifat menjadi kristal untuk zat sangat langka. Sebagian besar zat, bahkan dalam larutan, lebih memilih untuk tetap (amorf) dalam bentuk tidak teratur oleh emulsi, suspensi atau koloid dan tidak mengkristal.

Dari sudut pandang matematika, kisi kristalografi menyadari jenis simetri yang sederhana dan kompleks. Lukisan-lukisan Escher menggambarkan banyak di antaranya. Kristal dalam ruang dua dan tiga dimensi tidak memiliki simetri rotasi 5-ray - ini adalah batasan kristalografi dunia kita dengan geometri 3 dimensi. Di dunia 4 dimensi, pembatasan ini dihilangkan. Di antara keragaman matematika yang ada, kesempatan untuk menyoroti dan kelas simetri yang lebih sempit - poligon reguler di pesawat dan polihedra biasa dalam ruang n-dimensi, Rosenfeld B. V. Karasev .

Tabel 2 - Polihedron reguler dan karakteristiknya (kasus n = 3)

p * - jumlah simpul di wajah; q * adalah jumlah wajah yang berdekatan dengan simpul.

Tabel 3 - Polihedron reguler dan karakteristiknya (kasus n = 4)


Pada setiap sudut polyhedron q identik p-gons bertemu.
Nilai (p, q, r) untuk polihedron 4-reguler ditentukan oleh solusi integer dari ketidaksetaraan dosa (ฯ€ / p) ยท dosa (ฯ€ / r)> cos (ฯ€ / q). Hanya ada 6 solusi bilangan bulat seperti itu, semuanya tercantum dalam tabel 3.

Matematika, seperti biasa, memberikan lebih banyak peluang daripada yang dapat disadari manusia atau alam. Meskipun mungkin saja pengetahuan kita tentang alam sangat terbatas. Sebuah kasus perilaku refleksif herediter dari lebah diketahui ketika mereka membangun penyimpanan heksogonal untuk cadangan madu mereka.

Dari analisis HA dan dengan mempertimbangkan sifat-sifat tambahan dari elemen kode dari model spasial penempatan elemen-elemennya, dapat disimpulkan bahwa elemen-elemen tersebut diatur dengan mempertimbangkan berbagai simetri spasial dari molekul asam amino.

Bagaimana dodecahedron 20-simpul terhubung (secara matematis) dengan genetika organisme hidup tidak sepenuhnya jelas. Tetapi wajah 5-sisi dari dodecahedron dan hasil dari keterbatasan kristalografi dimanifestasikan dalam ketiadaan simetri rotasi dari lima asam amino pada simpul-simpul wajah.

Di antara 5 kemungkinan 3-polyhedra yang tepat untuk pemodelan alam, bukan yang paling sederhana yang dipilih, tetapi memenuhi persyaratan kuantitatif dari enzim sel yang disintesis (20). Begitu banyak puncak yang dimiliki dodecahedron. 20 asam amino yang ada (enzim sel) dapat dipetakan ke simpul dodecahedron, dalam urutan tertentu. Memang, dimungkinkan untuk menempatkan 20 asam amino dalam ruang (n = 3) sehingga koordinatnya sesuai dengan simpul dodecahedron, dan sifat-sifat tertentu dari polyhedron akan mencerminkan ketergantungan simetris asam amino.



Gambar tersebut menunjukkan I - bidang antisimetri terbalik; II - pesawat membagi "antipodes". Persimpangan dari pesawat adalah salah satu sumbu rotasi dodecahedron.

Huruf A dan B dengan indeks (atas dan bawah) dan tanda (ยฑ) menunjukkan asam amino yang memiliki sifat tertentu (Tabel 1). Jadi di sisi kiri Gambar 1, semua elemen di atas bidang horizontal yang melewati pusat polyhedron ditandai dengan , dan di bawah horizontal dengan โŠ–, yang mencirikan polaritas asam amino.

Pada tahun 1968, Rumer Yu. B. mengusulkan dan memberikan matriks dan deskripsi grafik konformasi (Tabel 4).

Tabel 4- Konformasi (64) dari grafik 4-link dan deskripsinya (menurut Rumer)


Susunan elemen dan grafik dalam tabel sedemikian rupa sehingga elemen yang berdekatan dalam blok berbeda satu sama lain hanya dengan satu nilai (1 bit informasi). Dengan demikian, ini menyerupai kode Gray.

Model pengkodean topologi polimer rantai. Penulis mengidentifikasi tiga komponen model: kode topologi; algoritma kode rantai; sistem operator fisik menciptakan struktur kode. Model ini menggunakan transformasi Rumer [7].

Misalnya, kembar tiga AAC, AAU - Asn; AAG, AAA - Lys di sebelah kiri dikonversi ke kanan dengan mengganti basis C - A; G - U.

Tabel 5 - Transformasi matriks konformasi menjadi HA triplet (menurut Karasev V. Luchinin V.)

Dalam matriks [3 ร— 3] grafik, tepi yang terhubung menghubungkan simpul dengan angka i dan i-4 dan sesuai dengan nilai 1.

Menurut deskripsi GC yang tersedia, daftar kodonnya berisi 64 kembar tiga, yang masing-masing dapat dikaitkan dengan simpul dari kubus unit. Gambar 2 menunjukkan kubus enam dimensi tunggal dengan 2 6 = 64 simpul.

Di sisi lain, bidang Galois yang diperluas GF (2 6 ) yang dibentuk oleh 64 elemen dan satu hypercube (n = 6) dengan jumlah simpul yang sama dapat dikaitkan dengan 64 triplet .



Gambar 2 - Sebuah kubus tunggal ([11] menurut Yablonsky SV) dengan simpul bertanda ([4,7] sesuai dengan elemen Karasev, Rumer) GK.

Karena jumlah simpul dan triplet bertepatan, kita dapat membangun hubungan satu-ke-satu di antara mereka - sebuah koleksi, yang diwakili oleh permutasi elemen. Asam amino HA ditugaskan untuk setiap simpul dari satu kubus satu per satu.


Gambar 3 - Bagian dari

kode Topological hypercube . Sebuah fragmen 4 unit dari polimer rantai (4a), yang diubah menjadi grafik rantai (4b), dipilih sebagai objek awal. Tepi grafik (kc) - ikatan polimer adalah titik simpul (i, i-1, i-2, ..., i-4) dari titik akhir tautan.

Verteks dari grafik x1, x2, ..., x6 adalah variabel yang mengambil nilai 0 atau 1.


Gambar 4 - Empat unit fragmen dari polimer rantai (a), grafiknya (b) dan matriks grafik (c)

Tabel bidang Galois. Ini adalah tabel tambahan dan tabel perkalian lapangan, ini juga termasuk tabel elemen medan Galois, yang menunjukkan berbagai representasi elemen dan beberapa karakteristik elemen;

Kolom kiri tabel elemen adalah derajat elemen primitif (000010) dari bidang tersebut. Derajat ini dijalankan melalui semua elemen lapangan. Kolom-kolom berikut: representasi elemen-elemen medan dengan polinomial, vektor biner, angka desimal, urutan elemen-elemen medan, vektor invers multiplikasi, derajat polinomial terbalik, invers dalam representasi desimal, bobot codeword.

Steganografi dan perlindungan informasi [1, 2, 12, 13, 14]


Diketahui bahwa DNA dibentuk oleh sekuens gen, di antaranya ada yang disebut ekson dan intron. Ekson menyandikan protein, memulai sintesisnya, dan intron tidak menyandikan apa pun. Mereka bahkan disebut gen "diam". Enzim khusus menghilangkan intron dari DNA sebelum sintesis protein dimulai.

Misalnya, pada seseorang dalam genom, hampir sembilan puluh persen dari intron. Untuk aplikasi steganografi, intronlah yang menarik. Selain itu, properti degenerasi HA memungkinkan tidak hanya pembuatan wadah DNA buatan, tetapi juga modifikasi yang alami.

Wadah DNA setelah menyematkan pesan di dalamnya harus pergi ke penerima pesan. Ini bisa dilakukan dengan banyak cara. Misalnya, untuk memasukkan ke dalam genom organisme tempat model molekul DNA yang digunakan berada. Virus biasa menunjukkan kepada kita mekanisme distribusi DNA yang berhasil.
Definisi . Steganografi adalah ilmu tentang metode untuk menanamkan / mengambil, mentransmisikan (menyimpan) informasi tersembunyi, di mana saluran tersembunyi diatur berdasarkan dan di dalam saluran terbuka menggunakan fitur persepsi informasi, dan untuk tujuan ini, teknik-teknik tersebut dapat digunakan sebagai:

  • penyembunyian lengkap dari keberadaan saluran komunikasi tersembunyi,
  • membuat kesulitan untuk mendeteksi, mengambil atau memodifikasi pesan tersembunyi yang dikirim dalam pesan kontainer terbuka,
  • menutupi informasi yang tersembunyi dalam protokol.

Konsep umum steganografi adalah pembuatan saluran tersembunyi untuk mentransmisikan informasi antara pengirim (A) dan penerima (B). Jadi dalam satu pesan, disebut wadah atau pesan penutup dari aliran besar pesan dalam jaringan, yang dikirim oleh pelanggan A โ‰  A pelanggan B โ‰  B terselubung (tersembunyi dari A dan B ) diletakkan (pelanggan yang disematkan A) pesan lain volume yang lebih kecil ( sekitar patennya bisa dibaca di sini ).

Berbagai kondisi dan kemungkinan untuk ketidaksetaraan yang ditunjukkan dipertimbangkan. Baik pasangan pertama atau pasangan kedua bisa satu orang, atau kesetaraan dilakukan untuk kedua pasang pelanggan, meskipun yang terakhir tidak diinginkan.

Kembali pada 50-an abad terakhir, Richard Feynman melakukan pembenaran teoretis untuk kemungkinan menggunakan molekul DNA untuk mengatur perhitungan.
Definisi . Algoritma steganografi adalah sepasang transformasi yang saling tidak dapat dibalikkan: F langsung: M ร— B ร— K โ†’ B dan kebalikan F -1 : B ร— K โ†’ M, sesuai dengan triple (M - message, pB - wadah kosong, kunci K) kunci hasil dan pasangan (zB adalah wadah yang diisi, K adalah kuncinya) adalah pesan awal M, dan F (m, b, k) = b m, k ;
F -1 (b m, k , k) = m, di mana m โˆŠ M; b, b m, k โˆŠ B; kโˆŠ K.

Sistem steganografi (GHS) disebut sistem S = (M, B, K, F, F -1 ), dibentuk oleh set pesan, wadah, kunci, dan transformasi yang menghubungkannya.

Implementasi (penyembunyian) / pengambilan pesan melalui GHS mengacu pada hasil transformasi steganografi maju / mundur dengan nilai-nilai argumen yang sesuai.
Definisi . Sequencing adalah penentuan urutan nukleotida dalam sebuah fragmen DNA.

Kehadiran dan pengembangan teknologi komputer, teknologi mikrobiologis memungkinkan untuk berbicara dan secara praktis menggunakan elemen struktural sel hidup (DNA, RNA, dll.) Sebagai wadah steganografi [3,4]. Sifat-sifat unsur-unsur ini untuk menyimpan informasi dalam jumlah besar dan memiliki dimensi mikroskopis menarik perhatian para spesialis, meskipun bekerja bersama mereka membutuhkan pelatihan profesional yang tinggi dan penggunaan peralatan khusus yang mahal.

Daftar literatur yang digunakan:
1. .. . . โ€” .: , 2003. 152 .
2. . . . . โ€“ .: -, 2002. โ€“ 272 .
3. . ., . . // . 2002. . 7. . 274 โ€” 278.
4. .. / 23.03.2004, โ„–470-2004.
5. . . . โ€“ .: , 1966. โ€“ 648 .
6. . . โ€“ .: ,1976. โ€“ 224.
7. . . // . 1968. . 183. .225-226
8. โ€“ . . โ€“ .: ,
9. . . : . โ€“ .: , 1999. โ€“ 352 .
10. . . -. . / . . . . . . .: , 1964. . 195 โ€“ 219.
11. . .โ€“ .: , 1979.โ€“272 .
12. Bancroft F. C. Clelland C. DNA-based steganography. United States Patent โ„–6.312.911. November 06,2001.US Patent & Trademark Office.
13. Bancroft F. C. Clelland C. DNA-based steganography. WO0068431. November 16,2000. World Intelltctual Property Organization.
14. Pfitzmann B. Information Hiding Terminologiy, Information Hiding //First International Workshoh. Vol. 1174 of Lecture Notes in Computer Science, Isaac Newton Institute, Cambrige, England, May 1996.- Berlin: Springer-Verlag/pp 347-350.

All Articles