Fragmente moleculare, grupe R și grupe funcționale

/home/writings/diary/archive/2016/08/08/08/molecular_fragments_and_groups

Fragmente moleculare, grupe R și grupe funcționale

Pentru o schimbare de ritm, m-am gândit să fac o lecție de chimie de bază despre structurile moleculare, în loc de un blogpost mai orientat către calculator.

Chimiștii se gândesc adesea la o moleculă ca la o structură de bază (de obicei, sistemul arginal) și un set de grupe R. Fiecare grup R este atașat de un atom din structura de bază prin abond. De obicei, acea legătură este o legătură simplă și adesea „rotibilă”.

Iată un exemplu pentru a înțelege ce vreau să spun. Prima imagine de mai jos arată structura vanilinei, care este gustul principal din spatele vaniliei. În a doua imagine, am încercuit cu elipsă cele trei grupe R din structură.

structura vanilinei structura vanilinei cu trei grupe R-.grupuri identificate
Structura vanilinei
(gustul primar al vaniliei)
Vanilina cu trei grupuri R identificate

Grupurile R în acest caz sunt R1=un grup carbonil (*-CH=O2), R2=un grupametoxi (*-O-CH3) și R3=un grup hidroxil (*-OH), unde „*”inidică locul în care grupul R se atașează la structura de bază.

Conceptul de grup R este flexibil. În realitate, înseamnă doar că aveți un grup fix de atomi conectați, care sunt conectați de-a lungul unei legături la un grup variabil de atomi și în care grupul variabil este notat R. În loc să mă uit la structura de bază și la un set de grupuri R, pot inversa modul de gândire și să mă gândesc la un grup R, cum ar fi grupul carbonil, ca la „structura de bază”, iar restul vanilinei ca la grupul său R.

În acest sens, voi înlocui „*” cu „R” pentru a obține grupurile „R-CH=O2”, „R-O-CH3” și „R-OH”. („*” înseamnă că fragmentul esteconectat la un atom în acest punct, dar este de fapt doar o schemă de denumire alternativă pentru „R”.)

Toate aceste trei grupe sunt, de asemenea, grupe funcționale. Citând Wikipedia, „grupurile funcționale sunt grupe specifice (grupe) de atomi sau legături din molecule care sunt responsabile de reacțiile chimice caracteristice ale moleculelor respective. Aceeași grupare funcțională va suferi reacții chimice identice sau similare indiferent de mărimea moleculei din care face parte.”

Aceste trei grupe funcționale corespunzătoare suntR1 = aldehidă,R2 = eter. și R3 = hidroxil.

Așa cum sublinia citatul din Wikipedia, dacă aveți o reacție care acționează asupra unei aldehide, probabil că o puteți folosi asupra grupei aldehidice a vanilinei.

Grupa vanililică și capsaicina

Un grup funcțional poate conține și grupe funcționale. Am indicat cele trei grupări funcționale atașate la inelul central al avanilinei, dar cea mai mare parte a structurii vanilinei este ea însăși o altă grupare funcțională, un vanilin:
grup funcțional vanilin

Structurile care conțin o grupare vanilin se numesc vaniloide. Vaniliaeste, desigur, un vaniloid, dar, în mod surprinzător, la fel este și capsaicina, sursa „căldurii” multor alimente picante. Iată structura capsaicinei, cu grupa vanililică încercuită:
capsaicina cu grupul vanililil încercuit
>

<P>

Senzația de căldură vine pentru că capsaicina se leagă deTrpV1 (canalul de cationi cu potențial de recepție tranzitorie membru al subfamiliei V, membrul 1), cunoscut și sub numele de „receptorul de capsaicină”. Este un receptor neselectiv, ceea ce înseamnă că multe lucruri îl pot determina să se activeze. Citez din pagina Wikipedia: „Cei mai cunoscuți activatori ai TRPV1 sunt: temperatura mai mare de 43 °C (109 °F); condițiile acide; capsaicina, compusul lor iritant din ardeii iuți iuți; și izotiocianatul de alil, compusul picant din muștar și wasabi.” Același receptor detecteazătemperatura, capsaicina și un compus din muștarul iute și wasabi, motiv pentru care organismul dumneavoastră le interpretează pe toate ca fiind „fierbinți.”

Capsaicina este un membru al familiei capsaicinoidelor. Toate capsaicinoidele sunt vaniline, toate vanilinele sunt aldehide. Acest fel de relație de apartenență la o familie în chimie a dus la multe taxonomii și ontologii, inclusiv ChEBI.

Dar nu lăsați exemplul meu sau existența nomenclaturii să vă ducă la concluzia greșită că toate grupele R sunt grupe funcționale! UnR-grup, cel puțin în cazul oamenilor cu care lucrez de obicei, este un termen mai generic folosit pentru a descrie un mod de a gândi despre structurile moleculare.

Modelarea QSAR

QSAR (pronunțat „QUE-SAR”) este prescurtarea de la „quantitative structure-activityrelationship” (relație cantitativă structură-activitate), ceea ce este un cuvânt greu de spus. (Am călătorit odată în Marea Britanie pentru o întâlnire UK-QSAR. Inspectorul de frontieră m-a întrebat unde mă duceam, iar eu am spus „la reuniunea UK-QSAR; QSAR este…” și am rămas cu gura căscată în ceea ce privește expansiunea acestui termen! Mi s-a permis să trec granița, așa că nu putea fi o greșeală atât de mare.)

QSAR se ocupă cu dezvoltarea de modele care relaționează structura chimică cu activitatea sa într-un sistem biologic sau chimic. Uitându-mă la asta, îmi dau seama că tocmai am mutat puțin cuvintele, așa că voi da un exemplu simplu.

Considerăm o activitate, pe care o voi numi „greutate moleculară”. (Aceasta este mai mult o proprietate fizică decât una chimică, dar încerc să o fac simplă). Modelul meu pentru greutatea moleculară presupune că fiecare atom are propria greutate, iar greutatea moleculară totală este suma greutăților atomilorindividuali. Pot crea un set de molecule de antrenament și, pentru fiecare moleculă, pot determina structura și greutatea sa moleculară. Cu un pic de ajustare a celor mai mici pătrate, pot determina contribuția individuală a greutății atomice. Odată ce am acest model, îl pot folosi pentru a prezice greutatea moleculară a oricărei molecule care conține atomi despre care modelul știe.

Evident, acest model va fi destul de precis. Nu va fi perfect,deoarece raporturile izotopice pot varia. (O substanță chimică sintetizată din petrol fosil este puțin mai ușoară și mai puțin radioactivă decât aceeași substanță chimică derivată din surse din mediul înconjurător, deoarece 14C greu radioactiv din petrolul fosil s-a descompus). Dar pentru majoritatea utilizărilor va fi suficient de bun.

O proprietate mai orientată spre chimie este coeficientul de partiție,măsurat în unități logaritmice ca „log P”, care este o măsură a solubilitățiiîn apă în comparație cu un tip de ulei. Aceasta oferă o idee aproximativă dacă molecula va avea tendința de a sfârși în regiuni hidrofobe, cum ar fi o membrană celulară, sau în regiuni apoase, cum ar fi sângele. O modalitate de a prezice log Pis cu abordarea bazată pe atomi pe care am schițat-o pentru greutatea moleculară,în care fiecare tip de atom are o contribuție la logP măsurat global. (Aceasta se numește uneori AlogP.)

În practică, soluțiile bazate pe atomi nu sunt la fel de precise ca soluțiile bazate pe fragmente. Greutatea moleculară poate fi centrată pe atom, deoarece aproape toată masa se află în nucleul atomului, care este bine localizat în atom. Dar chimia nu se referă cu adevărat la atomi, ci la densitatea de electroni din jurul atomilor, iar electronii sunt mult mai puțin localizați decât nucleonii. Densitatea din jurul unui atom depinde de atomii vecini și de configurația atomilor în spațiu.

Ca o modalitate de a îmbunătăți acest lucru, unele metode se uită la mediul local extins (aceasta se numește uneori XlogP) sau la contribuții mai mari ale fragmentelor (de exemplu, ClogP de la BioByte). Cu cât este mai complexă, cu atât mai mulți compuși sunt necesari pentru instruire și cu atât mai lent este modelul. Dar să sperăm că rezultatul este mai precis, atâta timp cât nu supraajustați modelul.

Dacă sunteți cu adevărat interesați de subiect, Paul Beswick de la SussexDrug Discovery Centre a scris un rezumat frumos despre diferitele nuanțe în predicția log P.

Perechi moleculare potrivite

Câte o metodă majoră din mineritul de date și majoritatea metodelor minore,au fost aplicate la modelele QSAR. Istoria este, de asemenea, destul de lungă. Există lucrări de chimioinformatică încă din anii 1970 care analizează învățarea supravegheată și nesupravegheată, pornind de la lucrări chiar mai vechi privind clusteringul aplicat la sistemele biologice.

O problemă cu cele mai multe dintre acestea este natura de cutie neagră. Datele sunt zgomotoase, iar natura cuantică a chimiei nu se potrivește atât de bine cu instrumentele de extragere a datelor, astfel încât aceste predicții sunt folosite mai des pentru a ghida un chimist farmaceutic decât pentru a face predicții solide. Acest lucru înseamnă că concluziile ar trebui să fie interpretabile de către chimist. Încercați să faceți în așa fel încât rețeaua neuronală să dea o explicație rezonabilă din punct de vedere chimic de ce a prezis așa cum a făcut-o!

Analiza perechilor moleculare potrivite (MMP) este o metodă QSAR mai orientată către chimist, cu relativ puțină matematică în afară de statistici simple. Chimiștii au căutat mult timp atacuri în serii simple, cum ar fi înlocuirea unui etil (*-CH3) cu un metil (*-CH2-CH3) sau propil (*-CH2-CH2-CH2-CH3), sau înlocuirea unui fluor cu un halogen mai greu, cum ar fi un clor sau un brom. Acestea pot forma tendințe consecvente într-o gamă largă de structuri, iar chimiștii au folosit aceste observații pentru a dezvolta tehnici pentru, de exemplu, îmbunătățirea solubilității unui medicament candidat.

MMP sistematizează această analiză asupra tuturor fragmentelor luate în considerare, incluzând nu doar grupele R (care sunt conectate la restul structurii printr-o singură legătură), ci și așa-numitele structuri „de bază” cu două sau trei grupe R atașate. De exemplu, dacă structurile cunoscute pot fi descrise ca fiind „A-B-C”, „A-D-C”, „E-B-F” și „E-D-F” cu activități de 1,2, 1,5, 2,3 și, respectiv, 2,6, atunci putem face următoarea analiză:

 A-B-C transforms to A-D-C with an activity shift of 0.3. E-B-F transforms to E-D-F with an activity shift of 0.3. Both transforms can be described as R1-B-R2 to R1-D-R2. Perhaps R1-B-R2 to R1-D-R2 in general causes a shift of 0.3?

Nu este chiar atât de simplu, deoarece fragmentele moleculare nu sunt atât de ușor de identificat. O moleculă ar putea fi descrisă ca fiind „A-B-C”, precum și „E-Q-F” și „E-H” și „C-T(-P)-A”, unde „T” are trei grupe R conectate la el.

Mulțumiri

Mulțumesc celor de la EPAM LifeSciences pentru Ketchertool, pe care l-am folosit pentru reprezentările de structură care nu erau de domeniul public pe Wikipedia.

Andrew Dalke este un consultant independent care se concentrează pe dezvoltarea de software pentru chimie și biologie computațională. aveți nevoie de programare, ajutor sau instruire prin contract?Contactați-mă

.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *