Pecuária E Abastecimento Comunicado 42 Técnico

3y ago
21 Views
3 Downloads
467.60 KB
6 Pages
Last View : 3d ago
Last Download : 3m ago
Upload by : Roy Essex
Transcription

Ministério da Agricultura,Pecuária e AbastecimentoComunicado 42TécnicoDezembro, 2002Campinas, SPISSN 1677-8464Estudo da Influência deSeqüências Polipeptídicas ede Códons na Determinaçãoda Estrutura Secundáriade ProteínasGoran Neshich1Jair Lage de Siqueira Neto2Acredita-se que a seqüência linear de aminoácidos queforma uma proteína é de alguma forma responsávelpela determinação de sua estrutura espacial, ainda quenão seja um processo completamente compreendido(Anfinsen & Taniuchi, 1966). As interações nãocovalentes são as forças mais importantes paraestabilidade das estruturas protéicas (Stryer, 1995).A estrutura secundária de proteínas é formada porconformações locais dos polipeptídios (Creighton,1993). Pontes de hidrogênio entre resíduos linearmentepróximos estabilizam estas conformações locais queformam padrões encontrados em todas as proteínas.Dois desses padrões de estrutura secundária mais comunssão as hélices alfa e as fitas beta (Chothia et al., 1997).Uma hélice alfa surge a partir da formação de pontesde hidrogênio entre o átomo de hidrogênio ligado aoátomo de nitrogênio eletronegativo da ligação peptídicae ao átomo de oxigênio eletronegativo da carbonila doquarto aminoácido seguinte no sentido carboxiterminal das ligações peptídicas. É uma estruturaconsideravelmente estável tendo em vista que todosos resíduos participam das pontes de hidrogênio (comexceção dos resíduos das extremidades da hélice)(Lehninger et al., 2000).Na conformação de fitas beta, a cadeia principalpolipeptídica forma uma estrutura de zig-zag em queos resíduos se arranjam lado a lado. Neste caso, aspontes de hidrogênio são formadas entre segmentosadjacentes da cadeia de polipeptídios. As cadeiasadjacentes podem ser tanto paralelas quantoantiparalelas no caso de fitas beta, dependendo daorientação amino-carboxila (Lehninger et al., 2000)Com as informações já concedidas de como seestabilizam as estruturas secundárias, pode-se entendera importância da seqüência de aminoácidos na proteínapara formação dessas conformações locais. No entanto,esta seqüência linear dos aminoácidos não é a únicadeterminante da formação da estrutura secundária.Temos alguns casos observados a partir de proteínascristalizadas e resolvidas por raios X que uma mesmaseqüência de determinada extensão de aminoácidospode dar origem a diferentes estruturas secundárias.O propósito desse trabalho foi descrever e quantificaros casos de polipeptídicos idênticos em diferentesestruturas secundárias, encontrados em banco dedados de estruturas: Protein Data Bank (PDB) (Bermanet al., 2000) ou bancos de dados derivados do PDB. Emetapa posterior, procurar-se-á entender melhor osmecanismos de formação de estruturas secundárias, a1Ph.D. em Biofísica, Pesquisador da Embrapa Informática Agropecuária, Caixa Postal 6041, Barão Geraldo - 13083-970 - Campinas,SP. (e-mail: neshich@cnptia.embrapa.br)2Estudante de Ciências Biológicas, Estagiário da Embrapa Informática Agropecuária, Caixa Postal 6041, Barão Geraldo - 13083-970- Campinas, SP. (e-mail: jair@cnptia.embrapa.br)

2Estudo da Influência de Seqüências Polipeptídicas e de Códons na Determinação da Estrutura Secundária de Proteínaspartir da hipótese de que a seqüência nucleotídica quecodifica a seqüência de aminoácidos, pode estarinfluenciando de alguma forma, a interação entreresíduos espacialmente próximos e conseqüentementecontribuindo para a determinação da estruturasecundária do polipeptídio.Material e MétodosComo primeiro passo em busca dos nossos objetivos,deveria ser selecionada uma base de dados nãoredundante contendo estruturas protéicas com baixograu de similaridade. A base de dados escolhida foiobtida no ASTRAL SCOP Genetic Domain Sequence(Brenner et al., 2000) que é derivada da base de dadosPDB SEQRES. Foram então escolhidos três bancos dedados com diferentes níveis de similaridade: ASTRALSCOP 10, ASTRAL SCOP 40 e ASTRAL SCOP 70, comvalores máximos de 10%, 40% e 70% de identidaderespectivamente. Estas bases de dados foram obtidasem http://astral.stanford.edu/scopseq-1.61.html no mêsde agosto de 2002.Em seguida, foi desenvolvido um programa queexecuta uma busca exaustiva de todos os possíveispadrões de tetrapeptídios presentes em cada uma dasbases escolhidas. O programa gera ainda um arquivocontendo o resíduo seguinte a cada padrão detetrapeptídio encontrado. Com isso, para se obter ospentapeptídios, não seria mais necessária uma buscaexaustiva, que se tornaria computacionalmente inviávelpara padrões um pouco maiores, exigindo um custode processamento incompatível com nossa atualestrutura. Os pentapeptídios seriam obtidos a partir doarquivo gerado na busca dos tetrapeptídios. E ao sefazer a busca para os pentapeptídios, já se gera umnovo arquivo que executa a busca dos hexapeptídios eassim por diante. Esse processo foi executado atéencontrar polipeptídios de tamanho 12, nas três basesde dados.A partir deste ponto, buscou-se as estruturassecundárias de cada um dos polipeptídios obtidos. Abase de dados contendo as estruturas secundárias foiobtida em ftp://ftp.rcsb.org/pub/pdb/derived data/ss.txtdisponibilizada pelo PDB. Neste arquivo, a estruturasecundária foi determinada de acordo com a descriçãoe implementação do método DSSP de Kabsch & Sander(1983). A descrição das estruturas secundárias em 7grupos (helix; residue in isolated beta bridge; extendedbeta strand; 3 10 helix; pi helix; hydrogen bonded turn;e bend) não é a mais indicada para fazer o tipo deanálise que se pretende. Por isso usou-se outraclassificação em apenas 3 grupos: Helix, Strand e Coil.Para fazer a conversão, um script interpreta como Helix:helix, 3 10 helix e pi helix; como Strand: residue inisolated beta bridge e extended beta strand; e comoCoil: hydrogen bonded turn, bend e “blank”. Com estaconversão as análises foram significativamentefacilitadas.Um estudo paralelo, ainda em fase dedesenvolvimento, é a análise de uma possível relaçãoentre as trincas de ácido nucléico (códons) e a estruturasecundária do polipeptídios por elas codificadas. Paraesse estudo, a base de dados de estrutura escolhidafoi o próprio Protein Data Bank, o maior banco de dadosde estruturas da atualidade. O download dos arquivos.pdb desta base de dados foi feito na data de 11/dez/2002 em / .A partir dos arquivos .pdb, selecionou-se somenteàqueles que se referem a polipeptídios, excluindo-seseqüências nucleotídicas, pequenas moléculas e outrasestruturas depositadas que não são proteínas. Deveriase também ter um grau de confiabilidade na estruturasecundária descrita nos arquivos .pdb, e para issoselecionou-se apenas aqueles que apresentavamresolução da estrutura maior que 2.0Å, o que acarretariaem uma maior precisão nas análises posteriores.A seqüência polipeptídica de cada cadeia dos arquivos.pdb selecionados foi então obtida no arquivopdb seqres.txt em formato pasta, disponível em ftp://ftp.rcsb.org/pub/pdb/derived data/seqres.txt. Aobtenção da seqüência nucleotídica codificadora de umdeterminado polipeptídio foi feita através do programaBlast (Altschul et al.,1990), utilizando maisespecificamente o programa TblasntN, que compara aseqüência do polipeptídios contra uma tradução nos 6frames de cada seqüência de um banco de nucleotídeosnão redundante. O banco escolhido foi o nt, constituídopor todas seqüências nucleotídicas não redundantespresentes em GenBank (NCBI Gene Data Bank) EMBL(European Molecular Biology Laboratory - NucleotideSequence Database) DDBJ (DNA Database of Japan) PDB (Protein Data Bank), excluindo-se EST (ExpressedSequence Tags), STS (Sequence Tagged Sites), GSS(Genome Survey Sequence) e HTGS (High ThroughputGenomic Sequences).Foi desenvolvido um algoritmo capaz de executar oprograma TblastN localmente de forma automáticapara todas as seqüências polipeptídicas obtidas a partirdos arquivos .pdb selecionados. Desta maneira reduziuse drasticamente o tempo de execução da atividade,viabilizando este tipo de estudo em larga escala.Em seguida, os formulários de saída do programaTblastN foram avaliados para verificar se o melhormatch teve porcentagem de identidade maior que 95%.Para os casos que não superaram esse valor, aseqüência de nucleotídica foi excluída. Para os demaiscasos, considerou-se que a seqüência nucleotídica temalta probabilidade de ter codificado o polipeptídio emquestão, portanto sendo aceita.A partir deste momento, deverá ser feito umacomparação entre as seqüências nucleotídicas eprotéicas, pareando-se cada aminoácido com seu

Estudo da Influência de Seqüências Polipeptídicas e de Códons na Determinação da Estrutura Secundária de Proteínascódon respectivo e ainda anexar a informação de qualestrutura secundária o resíduo está fazendo parte. Destaforma poderão ser então feitos cálculos para se saberem que medida os códons estão influenciando adeterminação da estrutura secundária.ResultadosOs resultados demonstrando quantitativamente ospolipeptídios idênticos e suas relações com estruturassecundárias são demonstrados nas Tabelas a seguir.Tabela 1. Resultados obtidos na base de dados ASTRAL SCOP 10.ASTRALSCOP 10Número depadrõescommínimode 2ocorrênciasNúmerodeocorrênciasdo msomente1 tipo deestr. sec.Padrõescommais de1 tipo deestr. sec.% depolipep.queapresentam1 únicopadrão .811154.0606,55Padrõescommais de1 tipo deestr. sec.TotalTabela 2. Resultados obtidos na base de dados ASTRAL SCOP 40.% depolipep.queapresentam1 únicopadrão deestr.sec.Número depadrõescommínimode 2ocorrênciasNúmerodeocorrênciasdo msomente1 tipo deestr. 137127420,57ASTRALSCOP 013,04260.6101.094.9964,2017.367243.2436,66Total3

4Estudo da Influência de Seqüências Polipeptídicas e de Códons na Determinação da Estrutura Secundária de ProteínasTabela 3. Resultados obtidos na base de dados ASTRAL SCOP 70.ASTRALSCOP 10Número depadrõescommínimode 2ocorrênciasNúmerodeocorrênciasdo msomente1 tipo deestr. sec.Padrõescommais de1 tipo deestr. sec.% depolipep.queapresentam1 únicopadrão ,35TotalTabela 4. Descrição dos parâmetros apresentados nas Tabelas 1, 2 e 3.Número de padrões commínimo de 2 ocorrênciasSe refere à quantidade de padrões polipeptídicos que se repetem pelo menos uma vez,ou seja, com no mínimo duas ocorrências na base de dados.Número de ocorrênciasdo padrão nas proteínasReferente a quantas vezes os padrões polipeptídicos foram encontrados nas bases dedados, contando-se somente casos onde o padrão se repete pelo menos 1 vezMédia (prot/padrão)É a média aritmética do número de vezes que os padrões polipeptídicos foramencontrados pela quantidade de padrões encontrados.Padrões com somente1 tipo de estr. sec.Referente à quantidade de padrões polipeptídicos que se repetem pelo menos uma veze apresentam sempre uma mesma estrutura secundária.Padrões com maisde 1 tipo de estr. sec.Se refere à quantidade de padrões polipeptídicos que se repetem pelo menos uma veze apresentam mais de uma estrutura secundária% de polipep. Queapresentam 1 únicopadrão de estr.sec.É a porcentagem (em relação ao número total de padrões polipeptídicos) do número depadrões polipeptídicos que apresentam uma única estrutura secundáriaJá na etapa posterior de obtenção de seqüênciasnucleotídicas, buscou-se a partir de 19.469 entradas dabase de dados do PDB, somente as estruturascorrespondentes a proteínas, descartando-seseqüências nucleotídicas e pequenas moléculas,reduzindo o universo dos dados.O primeiro filtro aplicado se referiu à resolução daestrutura, fixado em 2,0Å. Somente as estruturas comresolução maior que este valor estipulado fariam parteda pesquisa. Totalizaram-se 1.759 entradas de arquivos.pdb a partir do primeiro filtro, correspondendo a umtotal de 2.959 cadeias polipeptídicas, já que cadaentrada de pdb pode apresentar mais de uma cadeiaprotéica.Foi então realizado o“TblastN de todas essas 2.959cadeias. Destes, 244 formulários não apresentaramnenhuma seqüência nucleotídica correspondente,apresentando a mensagem de “No hits found”.O segundo filtro aplicado se refere a porcentagem deidentidade do melhor match . Apenas 442 cadeiasapresentaram identidade superior a 95%, sendo entãoconsideradas as seqüências nucleotídicascorrespondentes as seqüências protéicas.Será então feito, em uma próxima etapa, o alinhamentoentre as seqüências nucleotídicas e de proteínas parapareamento dos códons com os resíduos e suasestruturas secundárias. Será feita também uma análise

Estudo da Influência de Seqüências Polipeptídicas e de Códons na Determinação da Estrutura Secundária de Proteínasestatística na tentativa de concluir algo sobre aimportância das seqüências de DNA na determinaçãoda estrutura secundária das proteínasexiste uma seqüência de 32 resíduos de alanina, sendoentendidos como 24 nonapeptídios idênticos, eapresentam diferentes conformações de estruturasecundária ao longo desta seqüência.Discussão e ConclusõesComo as porcentagens de ocorrências de uma únicaestrutura secundária por um padrão polipeptídico sãobaixas, pode-se suspeitar que as seqüências dosaminoácidos dentro de uma região contínua e limitadanão determinam exclusivamente a formação daestrutura secundária. Nota-se ainda que polipeptídiosmuito pequenos, como tetra ou pentapeptídiosapresentam as menores porcentagens de uma únicaestrutura secundária por padrão. Isto pode serexplicado pelo fato de que polipeptídios de tamanhosmuito pequenos (menores que 7 resíduos) não sãosuficientes para caracterizar uma estrutura secundáriadeterminada. As maiores porcentagens de uma únicaestrutura secundária por padrão polipeptídico estãoentre os polipeptídios de tamanho 7, 8 e 9 resíduos.Este dado pode significar que as estruturas secundáriastêm comprimento médio por volta de 8 resíduos, e porisso, polipeptídios com 7, 8 ou 9 aminoácidosapresentam estrutura secundária mais conservada.Mesmo assim, essas porcentagens, apesar de seremas maiores não superam 30%, como já citadoanteriormente. Pode-se então sugerir que a seqüênciados aminoácidos dentro de uma região contínua elimitada está tendo aproximadamente 30% deinfluência na determinação da estrutura secundária.Resta então saber o que está determinando os outros70% de influência para formação da estruturasecundária.Inicialmente pode parecer estranho que haja maispentapeptídios idênticos que tetrapeptídios idênticosnas bases de dados ASTRAL SCOP 40 e 70, já que cadapentapeptídio é também ao mesmo tempo 2tetrapeptídios diferentes. É necessário então analisarestes dados obtidos antes de iniciar a discussãorealmente importante do estudo.A ocorrência de pentapeptídios idênticos maisnumerosa que a de tetrapeptídios nas bases de dadosASTRAL SCOP 40 e ASTRAL SCOP 70 se deve a doisfatores: tamanho das bases de dados e possibilidadesde combinação dos 20 aminoácidos para se formar tetrae pentapeptídios. A base de dados ASTRAL SCOP 10tem 2.915 cadeias e 517.628 resíduos; ASTRAL SCOP40 tem 4.383 cadeias e 796.111 resíduos; e ASTRALSCOP 70 tem 5.809 cadeias e 1.046.255 resíduos. Com20 aminoácidos são possíveis 160.000 tetrapeptídios e3.200.000 pentapeptídios. Fazendo-se cálculos, épossível concluir que é necessário uma base de dadosde tamanho mínimo de 320.010 resíduos para tornarpossível uma maior ocorrência de pentapeptídiosidênticos em relação a tetrapeptídios idênticos. E é fácilnotar que quanto maior for a base de dados, menorserá a possibilidade de ter-se um polipeptídio detamanho n repetido mais vezes que um polipeptídiode tamanho n-1 repetido. Melhor explicitando: énecessária uma base de dados de tamanho mínimo de6.400.012 para ter-se a possibilidade de encontrar maishexapeptídios idênticos (ou seja, repetidos pelo menosuma vez) que pentapeptídios idênticos, já que pode-seformar 64.000.000 hexapeptídios, mas apenas 3.200.000pentapeptídios. Por isso, é mais provável que o númeromaior de tetrapeptídios idênticos seja mais abundanteque o de pentapeptídios idênticos na base de dadosASTRAL SCOP 10, do que na base ASTRAL SCOP 40, jáque a primeira base é menor que a segunda. Usandoeste raciocínio, pode-se justificar a maior quantidadede pentapeptídios idênticos que de tetrapeptídiosidênticos nas bases de dados ASTRAL SCOP 40 eASTRAL SCOP 70, mas maior quantidade detetrapeptídios idênticos que de pentapeptídios idênticosna base ASTRAL SCOP 10.Em seguida tem-se para outra questão. Pode-se notarinicialmente que a porcentagem de padrões queapresentam uma única estrutura secundária e baixa,não superando os 30%, excetuando-se parapolipeptídios com comprimento superior a 9 resíduosna base de dados ASTRAL SCOP 10. Estas porcentagensdiscrepantes acontecem por causa do pdb 1GKU, queapresenta uma seqüência de polialanina. Neste arquivoPossivelmente a resposta da dúvida supracitada estánas seqüências nucleotídicas que codificam asproteínas. Pelo fato de o código genético serdegenerado a grande maioria dos aminoácidos sãocodificados por mais de um códon nucleotídica. Poroutro lado, cada códon é exclusivo de um aminoácido,e ainda há uma correlação recíproca de exclusividadeentre os códons e os RNA transportadores, quecarregam os aminoácidos. Esta pode ser a chave daquestão da determinação da estrutura secundária.No processo de tradução protéica, o ribossomo aointeragir com o RNA mensageiro na montagem daproteína, interage também com dois RNAtransportadores simultaneamente, promovendo aligação peptídica entre os dois aminoácidos carregadospelos seus respectivos RNA transportadores. E comoos RNAt são exclusivos para os códons, cada RNAtapresenta uma dinâmica de interação com o ribossomo,podendo favorecer a formação de um anglo de ligaçãoentre os aminoácidos, e assim sendo, pode tambémfavorecer a formação de uma determinada estruturasecundária.Para confirmar esta hipótese, será feito o alinhamentodas 442 cadeias polipeptídicas com resolução de raios5

6Estudo da Influência de Seqüências Polipeptídicas e de Códons na Determinação da Estrutura Secundária de ProteínasX maior que 2,0Å, juntamente com sua estruturasecundária e com as suas seqüências nucleotídicascorrespondentes. Desta maneira, será possívelrelacionar os códons e as estruturas secundárias. Umaanálise estatística quantificando o quanto os códonsestão relacionados à estrutura secundária será defundamental importância para melhorar o nossoconhecimento nesta área ainda pouco compreendida.Referências BibliográficasALTSCHUL, S. F.; GISH, W.; MILLER, W.; MYERS, E.W.; LIPMAN, D. J. Basic local alignment search tool.Journal of Molecular Biology, v. 215, n. 3, p. 403410, Oct. 1990.ANFINSEN, C. B.; TANIUCHI, H. The Amino acidsequence of an extracellular nuclease ofStaphylococcus aureus. The Journal of BiologicalChemistry, v. 241, n. 19, p. 4366-4385, Oct. 1966.BERMAN, H. M.; WESTBROOK, J.; FENG, Z.;GILLILAND, G.; BHAT, T. N.; WEISSIG, H.;SHINDYALOV, I. N.; BOURNE, P. E. The Protein DataBank. Nucleic Acids Rese

Comunicado Técnico Dezembro, 2002 Campinas, SP Ministério da Agricultura, 42 Pecuária e Abastecimento ISSN 1677-8464 . Undecapeptídios 145 311 2,14 24 121 16,55 Dodecapeptídios 92 203 2,21 12 80 13,04 Total 260.610 1.094.996 4,20 17.367 243.243 6,66 Tabela 2. Resultados obtidos na base de dados ASTRAL SCOP 40.

Related Documents:

RIA in a Bo LLC RIA in a Bo Consulting Services "Adaptability is about the powerful difference between adapting to cope and adapting to win." - Max McKeown Advisers Seek Sustainable Growth In a recent survey conducted by RIA in a Box, 89% of registered investment advisor (RIA) firms indicated growth as a priority for the coming year.

ANSI Standards Framework 4 RIA AWS S ANSI/ RIA R15.02 Design of Robot Control Pendants - inactive ANSI/ RIA R15.05 Performance Characteristics - inactive ANSI/ RIA R15.06 Safety of Robots, Integration of Robots, Robot Systems, Robot Cells ANSI/ RIA R15.07 Robot Offline Programming - i

Oticon Ria is built on the Inium platform and is our best performing hearing solution in the essential category. The audiology in Ria provides its users essential listening performance and allows to factoring in listening preferences and needs of each client. The Ria family styles range from compact In-the-Ear styles to a broad palette

WITH A PECU HOME EQUITY LOAN! 25,000- 49,999 Get up to bonus cash! 300 Our PECU Home Equity Loan promotion might just be the perfect way to help you plan the perfect day! Home values have been increasing. You can use the equity you've built up in your house to turn "some day" into today. Right now, you can even get up to 300 bonus cash.

Dezembro/2019 COMUNICADO TÉCNICO - Nº 1 ISBN: 978-85-8263-482-0 . 2 Comunicado Técnico Nº 1 . frasco de 60 mL pode custar até R 121,00. Segundo instruções do fabricante pode ser usado puro como óleo massageador ou para a veiculação de óleos essenciais, para aplicação em

CONCURSO PÚBLICO PARA PROVIMENTO DE VAGAS E FORMAÇÃO DE CADASTRO DE RESERVA EM CARGOS PÚBLICOS EFETIVOS DE NÍVEL SUPERIOR EDITAL N o 2 DO CONCURSO PÚBLICO 1/2014 - NORMATIVO Na presente data de 11 de abril de 2014, o Presidente da COMPANHIA NACIONAL DE ABASTECIMENTO (Conab), no uso de suas

organização em interação com a cadeia de abastecimento e com o ambiente externo (Waters, 2011:101)”. Mapeamento da cadeia de abastecimento (supply chain mapping) define-se como uma representação dos membros de uma cadei

Welcome to San Antonio for the 2019 ASME Pressure Vessels & Piping Conference! The PVP Conference is known as an outstanding international technical forum through which participants can exchange opinions and ideas with leading experts from industry and academia, and deepen their knowledge base through exposure to diverse topics. The conference, built with a pioneering spirit, helps disseminate .