Molekuláris töredékek, R-csoportok és funkcionális csoportok

/home/writings/diary/archive/2016/08/08/08/molekuláris_töredékek_és_csoportok

Molekuláris töredékek, R-csoportok és funkcionális csoportok
Vanillilcsoport és kapszaicin
QSAR modellezés
Matched molecular pairs
Köszönöm

Molekuláris töredékek, R-csoportok és funkcionális csoportok

A tempóváltás kedvéért úgy gondoltam, hogy egy alapszintű kémia leckét írok a molekulaszerkezetekről, a számítógépes blogbejegyzés helyett.

A kémikusok gyakran úgy gondolnak egy molekulára, mint egy magszerkezetre (általában aring rendszer) és egy sor R-csoportra. Minden R-csoport a magszerkezet egy atomjához kapcsolódik abonddal. Tipikusan ez a kötés egy egyszerű kötés, és gyakran “forgatható”.

Itt egy példa arra, hogy mire gondolok. Az alábbi első kép a vanillin szerkezetét mutatja, amely a vanília elsődleges íze. A második képen bekarikáztam a szerkezet három R-csoportját.

		.csoportok azonosítása
Vanillin szerkezet (a vanília elsődleges íze)		Vanillin három R-csoport azonosításával

Az R-csoportok ebben az esetben R1=karbonilcsoport (*-CH=O2), R2=amethoxi csoport (*-O-CH3) és R3=hidroxilcsoport (*-OH), ahol a “*” azt jelzi, hogy az R-csoport hol kapcsolódik a magszerkezethez.

Az R-csoport fogalma rugalmas. Valójában csak annyit jelent, hogy van egy fixen összekapcsolt atomcsoport, amely valamilyen kötés mentén kapcsolódik egy változó atomcsoporthoz, és ahol a változó csoportot R-vel jelöljük. Ahelyett, hogy a magszerkezetet és az R-csoportok halmazát nézném, megfordíthatom a gondolkodást, és egy R-csoportot, mint például a karbonilcsoportot, “magszerkezetnek”, a vanillin többi részét pedig R-csoportnak tekinthetem.

Ezt szem előtt tartva a “*”-t “R”-re cserélem, hogy megkapjam az “R-CH=O2”, “R-O-CH3” és “R-OH” csoportokat. (A “*” azt jelenti, hogy a töredék ezen a ponton egy atomhoz kapcsolódik, de ez valójában csak az “R” alternatív elnevezési sémája.)

Mindhárom csoport egyben funkciós csoport is. A Wikipédiát idézve: “A funkciós csoportok a molekulákon belüli atomok vagy kötések specifikus csoportjai (részek), amelyek felelősek a molekulákra jellemző kémiai reakciókért. Az azonos funkciós csoport azonos vagy hasonló kémiai reakció(k)n megy keresztül, függetlenül a molekula méretétől, amelynek része.”

Ez a három megfelelő funkciós csoport a következő: R1 = aldehid,R2 = éter. és R3 = hidroxil.

Amint a Wikipédia-idézet rámutatott, ha van olyan reakció, amely egy aldehidre hat, akkor azt valószínűleg a vanillin aldehidcsoportjára is alkalmazhatjuk.

Vanillilcsoport és kapszaicin

A funkciós csoport is tartalmazhat funkciós csoportokat. Utaltam az avanillin központi gyűrűjéhez kapcsolódó három funkciós csoportra, de a vanillin szerkezetének nagy része maga is egy másikfunkciós csoport, a vanillyn:
vanillyn funkciós csoport

A vanillyn csoportot tartalmazó szerkezeteket vanilloidoknak nevezzük. A vanília természetesen vanilloid, de meglepő módon a kapszaicin is, amely sok csípős étel “csípősségének” forrása. Íme a kapszaicin szerkezete,a vanillylcsoport bekarikázva:
kapszaicin a vanillyl-csoporttal bekarikázva
><P>

A hőérzet azért jön létre, mert a kapszaicin kötődik aTrpV1-hez (a tranziensreceptor potenciális kationcsatorna V. alcsalád 1. tagja), más néven a “kapszaicinreceptor”. Ez egy nem szelektív receptor, ami azt jelenti, hogy sok dolog aktiválhatja. A Wikipédia oldalát idézve: “A TRPV1 legismertebb aktivátorai a következők: 43 °C-nál (109 °F) magasabb hőmérséklet; savas körülmények; kapszaicin, a csípős chilipaprikában található csípős vegyület; és az allyl-izotiocianát, a mustárban és a wasabiban található csípős vegyület.” Ugyanaz a receptor érzékeli a hőmérsékletet, a kapszaicint, valamint a csípős mustárban és a wasabiban található vegyületet, ezért a szervezetünk mindegyiket “csípősnek” értelmezi.”

A kapszaicin a kapszaicinoidok családjába tartozik. Minden kapszaicinoid vanillyl, minden vanillyl aldehid. Ez a fajta is-a-családtagsági viszony a kémiában számos taxonómiához ésontológiához vezetett, beleértve a ChEBI-t is.

De ne hagyja, hogy példám vagy a nómenklatúra létezése arra a téves következtetésre vezessen, hogy minden R-csoport funkcionális csoport! Az R-csoport, legalábbis azoknál az embereknél, akikkel általában együtt dolgozom, egy általánosabb kifejezés, amelyet a molekulaszerkezetekről való gondolkodásmód leírására használnak.

QSAR modellezés

A QSAR (ejtsd: “QUE-SAR”) a “quantitative structure-activityrelationship” rövidítése, ami elég nagy szó. (Egyszer elutaztam az Egyesült Királyságba egy UK-QSAR találkozóra. A határellenőr megkérdezte, hová megyek, mire én azt mondtam, hogy “a UK-QSAR találkozóra; a QSAR az …”, és elfelejtettem a kifejezés bővítését! Átengedtek a határon, tehát nem lehetett olyan nagy hiba.)

A QSAR olyan modellek kidolgozásával foglalkozik, amelyek a kémiai szerkezetet a biológiai vagy kémiai rendszerben kifejtett aktivitással hozzák összefüggésbe. Ha ezt megnézem, rájövök, hogy csak egy kicsit megmozgattam a szavakat, ezért mondok egy egyszerű példát.

Tegyük fel egy aktivitást, amelyet “molekulatömegnek” fogok nevezni. (Ez inkább fizikai tulajdonság, mint kémiai, de megpróbálom leegyszerűsíteni). A molekulatömegre vonatkozó modellem feltételezi, hogy minden atomnak megvan a maga súlya, és a teljes molekulatömeg az egyes atomok súlyának összege. Létrehozhatom a molekulák gyakorlóhalmazát, és minden molekulára vonatkozóan meghatározhatom a szerkezetét és a molekulatömegét. Egy kis legkisebb négyzetek szerinti illesztéssel meg tudom határozni az egyes atomok súlyhoz való hozzájárulását. Ha megvan ez a modell, használhatom arra, hogy megjósoljam bármely olyan molekula molekulatömegét, amely olyan atomokat tartalmaz, amelyekről a modell tud.

Ez a modell nyilvánvalóan elég pontos lesz. Nem lesz tökéletes, mert az izotóparányok változhatnak. (Egy fosszilis olajból szintetizált vegyi anyag valamivel könnyebb és kevésbé radioaktív, mint ugyanez a környezeti forrásokból származó vegyi anyag, mert a fosszilis olajban lévő nehezebb radioaktív 14C elbomlott). De a legtöbb felhasználáshoz ez elég jó lesz.

Egy kémiai szempontból orientáltabb tulajdonság a megoszlási együttható, amelyet “log P”-ként, logegységben mérnek, és amely egy olajtípushoz képest a vízben való oldhatóságot méri. Ez durva képet ad arról, hogy a molekula hajlamos lesz-e hidrofób régiókban, például a sejtmembránban, vagy vizes régiókban, például a vérben kikötni. A log Pis előrejelzésének egyik módja az általam vázolt atomalapú megközelítés a molekulatömegre,ahol minden atomtípusnak van egy hozzájárulása a teljes mért logP-hez. (Ezt néha AlogP-nek nevezik.)

A gyakorlatban az atomalapú megoldások nem olyan pontosak, mint a töredékalapú megoldások. A molekulatömeg lehet atomközpontú, mivel szinte az összes tömeg az atommagban van, amely jól lokalizálódik az atomban. De a kémia valójában nem az atomokról szól, hanem az atomok körüli elektronsűrűségről, és az elektronok sokkal kevésbé lokalizáltak, mint a nukleonok. Az atom körüli sűrűség függ a szomszédos atomoktól és az atomok térbeli konfigurációjától.

Az ennek továbbfejlesztésére egyes módszerek a kiterjesztett lokális környezetet (ezt néha XlogP-nek nevezik) vagy a nagyobb fragmentumok hozzájárulását vizsgálják (például a BioByte ClogP). Minél összetettebb, annál több vegyületre van szükség a képzéshez, és annál lassabb a modell. De remélhetőleg az eredmény pontosabb lesz, mindaddig, amíg nem túlillesztjük a modellt.

Ha igazán érdekel a téma, Paul Beswick a SussexDrug Discovery Centre-től írt egy szép összefoglalót a log P előrejelzés különböző árnyalatairól.

Matched molecular pairs

Az adatbányászat minden fontosabb módszerét és a kisebb módszerek többségét alkalmazták már QSAR modellekre. A történet is meglehetősen hosszú. Már az 1970-es évektől kezdve léteznek kéminformatikai tanulmányok, amelyek a biológiai rendszerekre alkalmazott klaszterezéssel kapcsolatos még korábbi munkákra épülnek.

A legtöbbjükkel az a probléma, hogy fekete doboz jellegűek. Az adatok zajosak, és a kémia kvantumos természete nem illik annyira jól az adatbányászati eszközökhöz, így ezeket az előrejelzéseket inkább a gyógyszerészi kémikusok irányítására használják, mintsem szilárd előrejelzések készítésére. Ez azt jelenti, hogy a következtetéseknek a vegyész számára értelmezhetőnek kell lenniük. Próbálja meg rávenni a neurális hálóját, hogy kémiailag ésszerű magyarázatot adjon arra, hogy miért jósolta azt, amit jósolt!

A párosított molekulapárok (MMP) elemzése egy inkább kémia-orientált QSAR módszer, amely az egyszerű statisztikán túl viszonylag kevés matematikát tartalmaz. A kémikusok már régóta vizsgálják az egyszerű sorozatokban lévő aktivitásokat, például az etil (*-CH3) helyettesítését ametillel (*-CH2-CH3) vagy propillal (*-CH2-CH2-CH2-CH3), vagy a fluor helyettesítését nehezebb halogénnel, például klórral vagy brómmal. Ezek a szerkezetek széles skáláján konzisztens tendenciákat alkothatnak, és a kémikusok ezeket a megfigyeléseket arra használták fel, hogy technikákat dolgozzanak ki arra vonatkozóan, hogyan lehet például egy gyógyszerjelölt oldhatóságát javítani.

A MMP rendszerezi ezt az elemzést az összes figyelembe vett fragmentumra, beleértve nemcsak az R-csoportokat (amelyek egy kötéssel kapcsolódnak a szerkezet többi részéhez), hanem az úgynevezett “mag” szerkezeteket is, amelyekhez két vagy három R-csoport kapcsolódik. Például, ha az ismert szerkezetek leírhatók “A-B-C”, “A-D-C”, “E-B-F” és “E-D-F”, 1,2, 1,5, 2,3 és 2,6 aktivitással, akkor a következő elemzést végezhetjük:

 A-B-C transforms to A-D-C with an activity shift of 0.3. E-B-F transforms to E-D-F with an activity shift of 0.3. Both transforms can be described as R1-B-R2 to R1-D-R2. Perhaps R1-B-R2 to R1-D-R2 in general causes a shift of 0.3?

Ez nem ilyen egyszerű, mert a molekuláris töredékek nem olyan könnyen azonosíthatók. Egy molekula leírható “A-B-C”, valamint “E-Q-F” és “E-H” és “C-T(-P)-A”, ahol a “T”-hez háromR-csoport kapcsolódik.

Köszönöm

Köszönöm az EPAM LifeSciencesnek a Ketchertoolt, amelyet a Wikipedia nem nyilvános szerkezetábrázolásaihoz használtam.

Andrew Dalke független tanácsadó, aki a számításos kémia és biológia szoftverfejlesztésére összpontosít.Szüksége van szerződéses programozásra, segítségre vagy képzésre?Lépjen kapcsolatba velem

Molekuláris töredékek, R-csoportok és funkcionális csoportok

Vanillilcsoport és kapszaicin

QSAR modellezés

Matched molecular pairs

Köszönöm

Vélemény, hozzászólás? Kilépés a válaszból