Use este identificador para citar ou linkar para este item:
https://repositorio.unipampa.edu.br/jspui/handle/riu/2799
Tipo: | Trabalho de Conclusão de Curso |
Título: | Construção de uma plataforma para determinação in silico da alergenicidade e antigenicidade de proteínas |
Título(s) alternativo(s): | Construction of a platform for the in silico determination of protein allergenicity and antigenicity |
Autor(es): | Boeck, Anna Carolina |
Primeiro Orientador: | Boldo, Juliano Tomazzoni |
1° Membro da banca: | Pinto, Paulo Marcos |
2° Membro da banca: | Victoria, Filipe de Carvalho |
Resumo: | Com o avanço no sequenciamento de diferentes genomas, a construção de organismos geneticamente modificados (OGM), especialmente vegetais, tem aumentado. Uma das preocupações envolvendo a expressão de diferentes proteínas heterólogas é a possibilidade do desenvolvimento de reações alérgicas ou antigênicas nos consumidores finais. Assim, a WHO (World Health Organization) e a FAO (Food And Agriculture Organization Of The United Nations) propuseram testes in silico para a determinação de índices de alergenicidade e antigenicidade de proteínas passíveis de serem utilizadas na construção de OGM. Com o objetivo de congregar diversos algoritmos de predição que permitissem a análise in silico de proteínas e definissem seu potencial alergênico ou antigênico, construiu-se uma plataforma, chamada Plataforma de Análise da Alergenicidade e Antigenicidade de Proteínas (PA³P). Nesta plataforma, reuniu-se os bancos de dados PIR, SwissProt/TrEMBL e GenBank e as suites AlgPred e Allermatch. Primeiramente houve a identificação das linguagens de programação de cada banco de dados, com posterior pesquisa através dos sites visando identificar suas interfaces e a forma como as consultas são realizadas. Alguns sites têm interface através do REST, enquanto outros não oferecem nenhum tipo de informação. Identificadas as interfaces, buscou-se alternativas na linguagem de programação Hypertext Preprocessor (PHP versão 5.4.3). Tal linguagem foi escolhida por apresentar muitas bibliotecas, uma comunidade de desenvolvimento ativa, adequada documentação e por ser de livre acesso. Utilizou-se o WampServer (versão 2.2) que permite criar aplicações web com Apache2 (versão 2.2.22), PHP e um banco de dados MySQL (versão 5.5.24). Para os sites com REST utilizou-se o conjunto de operações definidas por HTTP. Para aqueles que não ofereciam nenhuma interface a maneira encontrada foi realizar o envio remoto dos formulários de consulta via cURL, respeitando as configurações originais dos sites. Para as interfaces de entrada e saída de dados foi utilizado HyperText Markup Language (HTML). As saídas foram tratadas via expressões regulares para que obtivéssemos apenas o resultado uma vez que alguns sites oferecem diferentes formatos de resposta ao web service. Para a validação de PA³P, construiu-se um banco de sequências contendo 30 proteínas sabidamente alergênicas, 30 proteínas sabidamente não alergênicas e 30 proteínas cujos índices de alergenicidade e antigenicidade eram desconhecidos. As sequências foram submetidas para análise tanto na PA³P quanto nos sites individualmente. A validação demonstrou que nossos dados são condizentes com os dados gerados quando as sequências são submetidas aos algoritmos originais, porém com tempo reduzido. Assim, pelo uso da referida plataforma, o usuário tem uma considerável economia de tempo para executar todas as análises necessárias. O uso de PA³P é considerado confiável como indicado pela validação desta ferramenta. Trabalhos futuros incluem a persistência dos dados e a construção de uma análise estatística, além da adição de novos algoritmos de análise e interface gráfica. |
Abstract: | With the advancement in sequencing of different genomes, the construction of genetically modified organisms (GMO), especially crop plants, has increased. One of the concerns involving the expression of different heterologous proteins is the possibility of development of allergic or antigenic reactions on final consumers. Thus, the WHO (World Health Organization) and the FAO (Food And Agriculture Organization Of The United Nations) proposed in silico tests to determine levels of antigenicity and allergenicity of proteins that could be used in the construction of GMO. Aiming to congregate several prediction algorithms that allow the in silico analysis of proteins and define their allergenic or antigenic potential, a platform called Platform for Analysis of Allergenicity and Antigenicity of Protein (PA³P) was built. In this platform the databases PIR, SwissProt/TrEMBL and GenBank and their AlgPred and Allermatch suites were congregated. Firstly, the identification of programming languages for each database was conducted with subsequent search through the sites aiming to identify their interfaces and how queries are performed. Some sites presented interface using REST, while others don't provide any information. Once the interfaces were identified, alternatives in the programming language Hypertext Preprocessor (PHP version 5.4.3) were sought. Such language was chosen because it has many libraries, a community of active development, adequate documentation and to be open acess. The WampServer (version 2.2) was used since it allows creating web applications with Apache2 (version 2.2.22), PHP and a MySQL database (version 5.5.24). For the sites with REST the set of operations defined by HTTP was used. For those that offered no interface, the most adequate operation was performing the remote sending of enquiry forms via cURL, respecting the original settings of the sites. For the interfaces of input and output data HyperText Markup Language (HTML) was used. The outputs were treated via regular expressions to get only the desired results, once some sites offer different answer formats to the WebService. To validate PA³P a sequence database was constructed, which contains 30 knowingly allergenic protein sequences, 30 non allergenic protein sequences, and 30 sequences from proteins whose levels of allergenicity and antigenicity were unknown. The sequences were submitted for analysis on both PA³P and sites individually. The validation process showed that our data are consistent with the data generated when the sequences were subjected to the algorithms individually, but with reduced analysis time. Thus, by using the referred platform, the user needs considerably less time when performing all necessary tests. The use of PA³P is considered reliable as indicated by the validation of this tool. Future works includes data persistence, the inclusion of statistical analysis, the addition of new algorithms of analysis, and graphical interface. |
Palavras-chave: | Alergenicidade Antigenicidade Bioinformática Allergenicity Antigenicity Bioinformatics |
CNPq: | CNPQ::CIENCIAS BIOLOGICAS |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal do Pampa |
Sigla da Instituição: | UNIPAMPA |
Campus: | Campus São Gabriel |
Citação: | BOECK, Anna Carolina. Construção de uma plataforma para determinação in silico da alergenicidade e antigenicidade de proteínas. 2013. Trabalho de conclusão de curso (bacharel em Biotecnologia). UNIPAMPA. São Gabriel. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://dspace.unipampa.edu.br:8080/jspui/handle/riu/2799 |
Data do documento: | 18-Out-2013 |
Aparece nas coleções: | Biotecnologia |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Construção De Uma Plataforma Para Determinação In Silico Da Alergenicidade E Antigenicidade De Proteínas.pdf | 1.44 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.