Fragmentos moleculares, grupos R e grupos funcionais

/home/escrita/diário/arquivo/2016/08/08/fragmentos_moleculares_e_grupos

Fragmentos moleculares, grupos R e grupos funcionais

Para uma mudança de ritmo, imaginei que faria uma lição básica de química sobre estruturas moleculares, ao invés de um blog mais orientado ao computador.

Os químicos geralmente pensam em uma molécula como uma estrutura central (geralmente sistema aring) e um conjunto de grupos R. Cada grupo R é ligado a um átomo na estrutura do núcleo por abond. Tipicamente essa ligação é uma ligação única, e frequentemente “rotativa”.

Aqui está um exemplo do que eu quero dizer. A primeira imagem abaixo mostra a estrutura da vanilina, que é o principal sabor por trás da baunilha. Na segunda imagem, circundei as elipses dos três grupos R na estrutura.

Estrutura da vanilina
(o sabor primário da baunilha)

estrutura da vanilina estrutura da vanilina com três grupos R-grupos identificados
Vanilina com três grupos R identificados

Os grupos R neste caso são R1=um grupo carbonilo (*-CH=O2), R2=grupoametóxi (*-O-CH3), e R3=grupo hidroxila (*-OH), onde o “*”inidica onde o grupo R se liga à estrutura central.

O conceito de grupo R é flexível. Realmente isso significa apenas que você tem um grupo fixo de átomos conectados, que estão conectados ao longo de algum grupo variável de átomos, e onde o grupo variável é denotadoR. Em vez de olhar para a estrutura central e um conjunto de grupos R, Ican inverte o pensamento e pensa num grupo R, como o grupo carbonilo, como “a estrutura central”, e o resto da vanilina como o seu grupo R.

Com isso em mente, eu vou substituir o “*” pelo “R” para obter os grupos “R-CH=O2”, “R-O-CH3”, e “R-OH”. (O “*” significa que o fragmento está ligado a um átomo neste ponto, mas na verdade é apenas um esquema de nomenclatura analternativa para “R”.)

Todos estes três grupos também são grupos funcionais. Citando a Wikipédia, “grupos funcionais são grupos específicos (moieties) de átomos ou ligações dentro de moléculas que são responsáveis pelas reacções químicas características dessas moléculas”. O mesmo grupo funcional sofrerá a mesma ou similar reação(ões) química(s)independentemente do tamanho da molécula de que é parte”

Estes três grupos funcionais correspondentes sãoR1 = aldeído,R2 = éter. e R3 = hidroxila.

Como a citação da Wikipédia apontou, se você tem reação que age sobre um aldeído, você provavelmente pode usá-lo no grupo aldeído de vanilina.

grupo vanillyl e capsaicin

Um grupo funcional também pode conter grupos funcionais. Eu apontei para os três grupos funcionais ligados ao anel central do avanilin, mas a maior parte da estrutura do vanillyl é em si um outro grupo funcional, um vanillyn:
grupo funcional vanillyn

Estruturas que contêm um grupo vanillyl são chamadas vanilóides. Vanilianos, claro, um vanilóide, mas surpreendentemente assim é a capsaicina, a fonte do “calor” de muitos alimentos picantes. Aqui está a estrutura da capsaicina, com o grupo vanillyl em círculo:
capsaicin com o grupo vanillyl circuladobr>><P>

A sensação de calor vem porque a capsaicina se liga aTrpV1 (a subfamília V membro 1 do canal catiónico potencial do canal catiónico transiente), também conhecido pelo “receptor de capsaicina”. É um receptor não seletivo, o que significa que muitas coisas podem fazer com que ele se ative. Citando a Wikipediapage: “Os activadores mais conhecidos do TRPV1 são: temperatura superior a 43 °C (109 °F); condições ácidas; capsaicina, o composto que a torna em pimentas quentes; e allyl isothiocyanate, o composto pungente na mostarda e no wasabi.” O mesmo receptor detecta a temperatura, capsaicina, e um composto em mostarda quente e wasabi, razão pela qual o seu corpo os interpreta todos como “quentes”

Capsaicina é um membro da família dos capsaicinóides. Todos os capsaicinóides são vanillyls, todos os vanillyls são aldeídos. Este tipo de é um tipo de relação de família em química tem levado a muitas taxonomias e taxonlogias, incluindo ChEBI.

Mas não deixe o meu exemplo ou a existência da nomenclatura levá-lo à conclusão errada de que todos os grupos R são grupos funcionais! AnR-group, pelo menos com as pessoas com quem eu normalmente trabalho, é um termo moregenérico usado para descrever uma forma de pensar sobre as estruturas moleculares.

QSAR modelagem

QSAR(pronuncia-se “QUE-SAR”) é a abreviação de “quantitative structure-activity-relationship”, que é uma boca cheia. (Uma vez eu viajei para o Reino Unido para uma reunião aUK-QSAR. O inspetor de fronteira me perguntou onde eu estava indo, e eu disse “a reunião UK-QSAR; QSAR é …” e eu cancelei a expansão desse termo! Eu fui autorizado a atravessar a fronteira, então não poderia ter sido um erro tão grande.)

QSAR trata do desenvolvimento de modelos que relacionam a estrutura química com sua atividade em um sistema biológico ou químico. Olhando para isso, percebo que apenas movi um pouco as palavras, então vou dar um exemplo simples.

Considerar uma atividade, que vou chamar de “peso molecular”. (Esta é mais uma propriedade física do que química, mas eu estou tentando tomake it simples). O meu modelo de peso molecular assume que cada átomo tem o seu próprio peso, e o peso molecular total é a soma dos pesos dos átomos individuais. Posso criar um conjunto de moléculas de treinamento e para cada molécula determinar sua estrutura e peso molecular. Com o abit de encaixe dos mínimos quadrados, eu posso determinar a contribuição do peso do átomo individual. Uma vez que eu tenho esse modelo, eu posso usá-lo para prever o peso molecular de qualquer molécula que contém átomos que o modelo sabe sobre.

Obviamente este modelo será bastante preciso. Ele não será perfeito, porque as proporções isotópicas podem variar. (Um químico sintetizado a partir de fóssil é ligeiramente mais leve e menos radioativo do que o mesmo químico derivado de fontes ambientais, pois o 14C pesado no óleo fóssil se decompôs). Mas para a maioria dos usos será suficientemente bom.

Uma propriedade mais quimicamente orientada é o coeficiente de partição, medido em unidades de log como “log P”, que é uma medida da solubilidade em água comparada a um tipo de óleo. Isto dá uma idéia aproximada de se a molécula tenderá a terminar em regiões hidrofóbicas como uma membrana celular, ou em regiões aquosas como o sangue. Uma maneira de prever o log Pis com a abordagem baseada no átomo que esbocei para o peso molecular, onde cada tipo de átomo tem uma contribuição para o logP medido globalmente. (Isto é às vezes chamado AlogP.)

Na prática, as soluções baseadas em átomos não são tão precisas quanto as soluções baseadas em fragmentos. O peso molecular pode ser centrado no átomo porque quase toda a massa está no núcleo do átomo, que está bem localizado para o átomo. Mas a química não tem realmente a ver com átomos, mas com a densidade de elétrons ao redor dos átomos, e os elétrons são muito menos localizados que os núcleons. A densidade em torno de um átomo depende dos átomos vizinhos e da configuração dos átomos no espaço.

Como uma forma de melhorar isso, alguns métodos olham para o ambiente local estendido (isso é às vezes chamado de XlogP) ou para contribuições de fragmentos maiores (por exemplo, o ClogP do BioByte). Quanto mais complexo for, mais compostos você precisa para o treinamento e mais lento o modelo. Mas esperemos que o resultado seja mais preciso, desde que você não se adapte ao modelo.

Se você estiver realmente interessado no tópico, Paul Beswick do SussexDrug Discovery Centre escreveu um belo resumo sobre as diferentes nuances na previsão P de log.

Pares moleculares combinados

Todos os métodos principais de mineração de dados, e a maioria dos métodos menores, têm sido aplicados aos modelos QSAR. A história também é bastante longa. Existem artigos sobre quimioterapia desde a década de 1970, olhando para a aprendizagem supervisionada e não supervisionada, com base ainda em trabalhos anteriores sobre clustering aplicados a sistemas biológicos.

Um problema com a maioria destes é a natureza da caixa negra. Os dados são ruidosos, e a natureza quântica da química não é tão boa quanto as ferramentas de mineração de dados, então essas previsões são usadas mais frequentemente para orientar o químico farmacêutico do que para fazer previsões sólidas. Isto significa que as conclusões devem ser interpretáveis pelo químico. Tente obter sua rede neural para dar uma explicação quimicamente razoável do porquê de ter previsto como fez!

Análise de pares moleculares combinados (MMP) é um método QSAR mais orientado para a química, com relativamente pouca matemática além de estatísticas simples. Os químicos há muito tempo parecem atacantes em séries simples, como substituir um ethyl (*-CH3) por amethyl (*-CH2-CH3) ou propyl (*-CH2-CH2-CH3), ou substituir um fluorinewith com um halogênio mais pesado como um cloro ou bromo. Estas podem formar tendências consistentes numa vasta gama de estruturas, e os químicos utilizaram estas observações para desenvolver técnicas para, digamos, melhorar a solubilidade de um candidato a medicamento.

MMP sistematiza esta análise sobre todos os fragmentos considerados, incluindo não só os grupos R (que estão ligados ao resto da estrutura por uma ligação), mas também as chamadas estruturas “nucleares” com dois ou três grupos R ligados a ela. Por exemplo, se as estruturas conhecidas podem ser descritas como “A-B-C”, “A-D-C”, “E-B-F” e “E-D-F” com atividades de 1,2, 1,5, 2,3 e 2,6 respectivamente, então podemos fazer a seguinte análise:

 A-B-C transforms to A-D-C with an activity shift of 0.3. E-B-F transforms to E-D-F with an activity shift of 0.3. Both transforms can be described as R1-B-R2 to R1-D-R2. Perhaps R1-B-R2 to R1-D-R2 in general causes a shift of 0.3?

Its não tão fácil quanto isto, porque os fragmentos moleculares não são tão facilmente identificados. Uma molécula pode ser descrita como “A-B-C”, assim como “E-Q-F” e “E-H” e “C-T(-P)-A”, onde “T” tem três gruposR ligados a ela.

Thanks

Thank to the EPAM LifeSciences for their Ketchertool, que usei para as representações de estrutura que não eram de domínio público na Wikipedia.

Andrew Dalke é um consultor independente focado no desenvolvimento de software para química computacional e biologia. Precisa de programação de contrato, ajuda ou treinamento? Contate-me

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *