Dettagliato sulla composizione del vaccino contro il covid-19
Matej Huš: 26 dic 2020 ore 22:48; Scienza e tecnologia
Sembra semplice, specialmente se lo traduciamo in linguaggio informatico. Il vaccino contro il covid-19 contiene il codice sorgente per una parte del virus, ovvero per la proteina S, che sporge dalla sua busta. Quando inseriamo questo codice sorgente nel corpo, le nostre cellule producono copie di questa proteina. Il sistema immunitario la incontra, la riconosce come estranea e prepara una risposta, proteggendoci da tutti gli estranei che hanno tale proteina esposta in superficie - attualmente SARS-CoV-2 è rilevante. Così funzionano i vaccini basati su modRNA (mRNA messaggero modificato). Oggi guardiamo sotto il cofano, cosa contiene esattamente il vaccino dei produttori Pfizer e BioNTech, con cui domani in Slovenia inizieranno a vaccinare i gruppi più a rischio.
Il vaccino contiene il principio attivo, che è modRNA con la sequenza genetica appropriata, ed eccipienti. Guardiamo prima questi ultimi. L'Agenzia Europea per i Medicinali (EMA) nell'approvazione elenca anche gli eccipienti (pagina 9), che sono acqua, saccarosio (zucchero da tavola), cloruro di sodio (sale da cucina), fosfato idrogeno di sodio diidrato (Na2HPO4 . 2H2O), cloruro di potassio (KCl) e diidrogenofosfato di potassio (KH2PO4). Sono sali normalmente presenti nei fluidi corporei, e sono nel vaccino perché abbia la forza ionica appropriata per non causare shock osmotico nella cellula. Le membrane cellulari sono permeabili all'acqua, che passa da concentrazione più alta a più bassa, quindi acqua senza sali disciolti penetra nelle cellule facendole scoppiare. In pratica tutti sappiamo di non bere grandi quantità di acqua distillata e che le infusioni devono essere soluzione fisiologica non acqua. Inoltre il vaccino ha colesterolo, DSPC (1,2-distearoil-sn-glicero-3-fosfocholina), ALC-0159 (2-[(polietilenglicole)-2000]-N,N-ditetradecilacetammide) e ALC-0315 (((4-idrossibutil)azandiil)bis(esano-6,1-diil)bis(2-esiildecanoato)). Nonostante i nomi complicati sono molecole grasse relativamente semplici. Il colesterolo è un grasso con struttura steroidea, che nel vaccino ha poco a che fare con i complessi proteici LDL e HDL famigerati, che misuriamo di solito parlando di colesterolo. Sono particelle proteiche più grandi che trasportano più molecole di grasso nel corpo. Il compito dei grassi nel vaccino è proteggere il materiale genetico nel vaccino, poiché creano nanoparticelle grasse in cui è intrappolata la modRNA.
Il mondo e la biologia non sono così spettacolari come i film di Hollywood vorrebbero mostrarci. Se iniettassimo ingenuamente RNA o DNA estraneo nel corpo, non produrremmo nessun organismo mutato. Il sistema immunitario lo masticherebbe semplicemente in collaborazione con enzimi senza che ce ne accorgiamo. Ci succede quotidianamente. Con l'alimentazione portiamo enormi quantità di DNA e RNA estranei nel corpo, e non ce ne accorgiamo. Anche quando zanzare, zecche e altri insetti ci pungono in estate, riceviamo materiale genetico estraneo nel sangue, che lì si degrada rapidamente (più problematico se ci regalano un parassita, batterio o virus). Il materiale genetico stesso è molto fragile e instabile, quindi anche i virus, questi semi di vita estremamente semplificati (sono vivi?), mantengono ancora una busta in cui è avvolta la loro RNA o DNA. E così il materiale ereditario nel vaccino deve avere una busta grassa per essere portato alle cellule e entrarvi.
Quando il materiale genetico del vaccino entra nella cellula, rimane nel citoplasma. Non può essere trasferito nel nucleo cellulare, ma in realtà non ne abbiamo bisogno lì, poiché c'è solo il DNA cellulare principale. In ogni materiale genetico c'è un codice per la produzione di proteine, prodotte sui ribosomi. Questi leggono l'RNA messaggero, che possiamo immaginare come copie di parti rilevanti del DNA. Enzimi appropriati leggono prima il DNA nel nucleo e lo trascrivono in mRNA, che poi viaggia dal nucleo al citoplasma. I ribosomi non sono troppo schizzinosi. Ogni mRNA (con forma appropriata, vedi sotto) che trovano, la traducono volentieri in proteine. E il vaccino gli infila tale RNA, che ovviamente non viene dal DNA cellulare, ma questo non disturba affatto il ribosoma.
Vediamo ora cosa infila il vaccino (BNT162b2 o Tozinameran). La sequenza intera ha 4284 nucleotidi. Un singolo nucleotide contiene basi, zucchero ribosio e gruppo fosfato. È il mattone base dell'RNA (e anche DNA se lo zucchero è deossiribosio). Mentre ribosio e gruppo fosfato sono uguali in ogni nucleotide e formano la struttura portante a cui sono attaccate le basi, queste ultime differiscono. Nel DNA sono adenina (A), guanina (G), citosina (C) e timina (T), nell'RNA l'uracile (U) fa la funzione della timina. Nei 30 microgrammi di RNA presenti nella dose di vaccino è codificato tutto ciò di cui abbiamo bisogno per la difesa dal virus.
In questi 4284 caratteri ci sono 8568 bit di informazione (per ogni base 4 opzioni, quindi 2 bit per registrarla), circa 1 kilobyte. L'intero virus ha circa quattro volte più informazioni. Il codice genetico si legge a triplette. Il motivo è semplice - con 4 lettere vogliamo codificare almeno 20 parole diverse, quante sono le amminoacidi che costruiscono proteine. Ciò significa che possiamo permetterci qualche ridondanza. Opzioni a tre lettere sono 64 (chiamate codoni), amminoacidi 20. La natura qui non è stata equa, poiché il triptofano è codificato da una sola sequenza (UGG), quindi ogni mutazione puntiforme causa sostituzione dell'amminoacido, mentre per la leucina ce ne sono sei (UUA, UUG, CUA, CUC, CUG, CUU). Sarà importante dopo.
L'intero codice genetico nel vaccino è pubblicato, vale lo stesso per proteina S nel virus (e l'intero virus). Come nell'informatica, anche in genetica il codice contiene certe intestazioni, cartelli, dati di orientamento ecc. Inizia con nucleotidi GA, che rappresentano il cappuccio all'estremità 5' (estremità catena RNA marcate 5' e 3', perché zuccheri ciclici ribosio come struttura portante collegati in posizione 3 e 5). Questo cappuccio è essenziale perché l'mRNA sia attiva affatto, simile a come gli script in Linux hanno all'inizio la dichiarazione #!. Segue una parte non trascritta (UTR - untranslated region). È essenziale perché il ribosoma non può iniziare a leggere dall'inizio, poiché deve attaccarsi fisicamente all'mRNA, bloccando così alcuni nucleotidi iniziali da sé. La trascrizione inizia dopo codone AUG, che segna l'inizio della proteina. La prima parte più corta è il peptide segnale - è una parte più corta di poche amminoacidi non parte della proteina S, ma con funzione direzionale. Sono attaccate all'inizio della proteina risultante e contengono info su cosa la cellula deve farne: se modificarla ulteriormente (modifiche post-traduzionali), es. attaccare gruppo metilico su certe amminoacidi, dove mandarla ecc.
Quindi dopo due nucleotidi del cappuccio, 52 nucleotidi non tradotti, si traducono 48 nucleotidi in proteina segnale (con 16 amminoacidi), poi segue solo il codice per proteina S (nucleotidi 103-3879). Se confrontiamo questo codice con quello per stessa proteina nel virus reale, notiamo non poche differenze, perciò questa RNA si chiama modificata (modRNA). La prima differenza ovvia è l'assenza di uracili. Invece di lettera U c'è Ψ nel codice, che rappresenta 1-metil-3'-pseudouridil. Il motivo è piuttosto furbo. RNA estraneo nel corpo non è longevo, poiché il sistema immunitario lo distrugge. Risulta che questa sostituzione convince il sistema immunitario che l'RNA non è pericoloso, lasciandolo in pace, mentre nella traduzione RNA in proteine questa sostituzione non crea problemi, poiché i ribosomi la leggono ancora normalmente come U. Quindi nel vaccino tutti gli U sono sostituiti coerentemente con Ψ. Seconda modifica è sostituzione di certi A e Ψ/U con G e C quando non influenza l'amminoacido codificato dal codone (più codoni codificano stessa amminoacido, come visto sopra). Nel DNA a doppia elica ciò porta a maggiore stabilità, poiché tra G e C tre legami idrogeno, tra A e T due. Nell'RNA la catena è una sola, ma queste modifiche sono comunque utili perché aumentano efficienza traduzione e sintesi. Tutte queste modifiche non hanno effetto sul prodotto finale - si sintetizza ancora stessa proteina S del virus. Le chiamiamo sostituzioni sinonime.
Esame dettagliato mostra che due sostituzioni sono diverse. Due codoni sono cambiati così che invece di valina e lisina codificano prolina. È necessario perché la proteina S prodotta dalla cellula abbia stessa forma di quella sul virus. Il sistema immunitario riconosce la forma, quindi deve essere il più identica possibile. Se produciamo proteina S nella cellula e la lasciamo sola, collassa in forma diversa da quella attaccata alla busta virale. La risposta immunitaria imparerebbe così a riconoscere proteina non uguale a quella virale, inutile. Con questa sostituzione però facciamo sì che proteina S sola in soluzione abbia stessa forma virale. Non è caso che la chiave sia prolina, poiché unica amminoacido con struttura ciclica senza gruppo amminico primario ma secondario. In pratica significa molto più rigida. Se inserita nel posto giusto "blocca" la struttura proteica.
Alla fine seguono due codoni UGA, stop codoni - lì ribosoma ferma sintesi proteina. Segue parte non tradotta (3'-UTR), ma deve esserci. Funzioni sono molte, molte ancora non conosciute, ma sicuramente influenza poliadenilazione, efficienza traduzione, stabilità stessa mRNA e localizzazione dove si trova. mRNA finisce con sequenza A che protegge da degradazione. Ad ogni uso ne cadono alcune, quindi esiste valore ottimale con quanti A mRNA deve finire per espressione genica ottimale.
In sintesi: Nel vaccino soluzione acquosa di certi sali che curano pH e forza ionica appropriati perché cellule non subiscano shock, e mucchio di grassi che nascondono codice genetico mRNA perché possa penetrare cellule senza distruzione. mRNA menzionata nella cellula resta nel citoplasma, dove ribosomi ne producono stessa proteina S del virus in superficie, perché sistema immunitario impari a rispondere. Per rendere vaccino più efficace, mRNA nel vaccino non è identica a quella virale. Invece di nucleotide U (uracile) usa analogo sintetico per evitare distruzione da sistema immunitario, inoltre ha sostituzioni non influenti su amminoacidi espressi ma assicurano sintesi più efficiente. In due punti amminoacidi sostituiti perché forma proteina S isolata resti uguale a quella virale. Per queste modifiche parliamo di RNA messaggero modificato (modRNA). Stessa RNA contiene cappuccio iniziale, parte non tradotta, oligopeptide segnale, parte rilevante per traduzione in proteina, parte finale non tradotta, e protezione poliadenilica da degradazione. Nella cellula mRNA naturalmente non resta a lungo, ma si degrada rapidamente.