quinta-feira, 21 de agosto de 2008
manuscrito ACM. bytecode.
Abordando o que foi explicado nesse blog e nas apresentações em sala, o manuscrito vai documentar tudo que nós pesquisamos e aprendemos com esse traballho. ele pode ser visto aqui mesmo no blog, como também pode ser feito o download, via SlideShare.
sábado, 9 de agosto de 2008
Estudo de Caso
O Framework.Net é uma tecnologia utilizada para se construir e executar aplicações .Net (ponto Net) e possui a seguinte estrutura:
Figura1: Estrutura do Framework.Net (esta figura encontra-se na apresentação)
A partir da figura, pode-se observar que esta tecnologia faz uso de duas camadas de compiladores para implementar o mecanismo de tradução, o que revela a existência de um duplo processo de geração de código: o primeiro, composto pela camada de compiladores específicos (Compiler) de cada linguagem de programação, visto que, cada compilador só consegue traduzir um conjunto específico de regras de sintaxe, é responsável por receber o código fonte escrito em uma dada linguagem de programação e convertê-lo para um código intermediário que, no caso em questão, será padronizado; o segundo, composto por um compilador chamado JIT (Just in Time Compiler), tem por finalidade traduzir o código intermediário vindo da camada de compiladores específicos em código objeto, representado pela camada Native Code, que estará pronto para ser executado pelo sistema operacional (Operating System Services).
Um bom exemplo de utilização desse modelo é encontrado no Asp.Net. Asp.Net é um ambiente de desenvolvimento para aplicações .Net. Este ambiente possui uma característica muito importante, o suporte a diversas linguagens de programação, ou seja, um programador poderá escolher a linguagem de programação em que o mesmo usará para codificar um site. Isso é possível devido à utilização do Framework.Net por parte do Asp.Net, pois a capacidade de suportar diversas linguagens e conseguir executar um site após ser construído está relacionada ao duplo processo de geração de código existente no Framework.Net, que já foi exposto anteriormente.
Perspectivas sobre o futuro dos tradutores...
No entanto, pelo contexto atual, verifica-se a utilização em expansão de um tipo de tradutor, a máquina virtual, para suprir um ponto negativo do processo de geração de código encontrado nos compiladores, que é a dependência do código objeto em relação ao sistema operacional. Um bom exemplo desse ponto é a máquina virtual Java.
O interpretador continuará sendo usado pela internet, que é um grande exemplo de utilização desse tradutor, e poderá se desenvolver ainda mais.
Além disso, está ocorrendo uma maior utilização dos compiladores, principalmente no que se refere ao duplo processo de geração de código, ou seja, uso de vários compiladores para a obtenção do código objeto, fato encontrado no Framework.Net que possui diversos compiladores (apenas um é usado para a escrita de um programa) para se produzir o código intermediário e um compilador geral responsável pela geração do código objeto final.
Diante do que foi exposto, percebe-se que os tipos de tradutores atuais (compiladores, interpretadores e máquina virtual) continuarão sendo utilizados, o que poderá ocorrer é o que já foi mencionado: a expansão, diminuição de alguns e até a criação de novas formas de tradução.
Diferenças entre compiladores e interpretadores (vantagens e desvantagens)
Vantagens e Desvantagens
Compiladores
- Vantagens:
1) A execução do programa é mais rápida.
2) Estruturas de dados mais completas;
3) Permitem a otimização de código fonte.
- Desvantagens:
1) Várias etapas de tradução;
2) Processo de correção de erro e de depuração é mais demorado;
3) Programação final é maior, o que gera a necessidade de mais memória;
Interpretadores
- Vantagens:
1) Depuração é mais simples;
2) Consomem menos memória;
3) Resultado imediato do programa ou rotina desenvolvida.
- Desvantagem:
1) A execução do programa é mais lenta.
2) Estrutura de dados demasiadamente simples;
3) Necessário fornecer o programa fonte ao utilizador;
Referência
[1] Como Funcionam os Compiladores e Interpretadores. Disponível em:
http://www.mat.ua.pt/lap/Teoricas/CompvsInterp.ppt. Acessado em: 20 mai 2008.
sábado, 2 de agosto de 2008
Apresentação Final - Compiladores vs Interpretadores
segunda-feira, 21 de julho de 2008
Alguns Compiladores...
Agora, eu vou colocar aqui no bytecode uma lista com alguns deles. Como as linguagens mais usadas atualmente são C e C++, vamos colocar alguns dos compiladores mais usados para traduzir essas linguagens.
Compilador | Autor | Windows | UNIX | Outros SOs | Tipo de Licensa |
---|---|---|---|---|---|
AMPC | Axiomatic Solutions Sdn Bhd | Sim | Sim | Sim | Proprietário |
C++ Builder | CodeGear (Borland) | Sim | Não | DOS | Proprietário |
C++ Compiler | CodeGear (Borland) | Sim | Não | Não | Freeware |
Comeau C/C++ | Comeau Computing | Sim | Sim | Sim | Proprietário |
CoSy compiler development system | ACE Associated Compiler Experts | Sim | Sim | Não | Proprietário |
Digital Mars | Digital Mars | Sim | Não | DOS | Proprietário |
EDGE ARM C/C++ | Mentor Graphics | Sim | Sim | Sim | Proprietário |
MinGW | MinGW | Sim | Sim | Sim | Open source |
GCC | GNU | Sim | Sim | Sim | Open source |
HP aC++ | Hewlett-Packard | Não | Sim | Não | Proprietário |
Intel C++ Compiler | Intel | Sim | Sim | Sim | Proprietário |
LabWindows/CVI | National Instruments | Sim | Sim | Sim | Proprietário |
Local C compiler | Chris Fraser eDaviHanson | Sim | Sim | Sim | Open source |
Microtec | Mentor Graphics | Sim | Sim | Sim | Proprietário |
MULTI | Green Hills Software | Sim | Sim | Sim | Proprietário |
Nwcc | Nils Weller | Sim | Sim | Sim | Open source |
Open Watcom | Sybase | Sim | Não | Sim | Open source |
Esses são alguns compiladores mais usados para traduzir C e C++. Claro que há muitos outros compiladores, inclusive para outra linguagens, mas esses são os principais.
tabela retirada e adapata da Wikipédia. Para conferir a lista completa clique aqui.
quarta-feira, 11 de junho de 2008
E Máquina Virtual?
No caso, o programador escreve o códiogo fonte, numa linguagem de alto nível, e executa um programa (compilador) que irá traduzir o texto para um código binário, de baixo nível. A diferença, nesse caso, está no fato de que esse código binário gerado ainda não é um código que pode ser entendido pela máquina, ele é um código intermediário, e para que o computador possa executá-lo é necessário uma Máquina Virtual. É a Máquina Virtual que vai traduzir esse código intermediário para um código que o computador consegue entender.
Pra quem está começando agora na área de programação,a utilização de Máquinas Virtuais pode parecer estranho, mas essa técnica trouxe grandes avanços e é cada vez mais comum a sua utilização. A principal vantagem é que com a utilização da Máquina Virtual fica muito fácil executar um mesmo aplicativo em sistemas diferentes. Um código binário criado pelo método tradicional da compilação só pode ser executado no Sistema Operacional onde foi criado. Já um código gerado por uma Máquina Virtual pode ser executado em diversos Sistemas Operacionais diferentes. Java é um bom exemplo: mesmo que um programa em Java seja criado no Windows, ele pode ser rodado também no Linux, Solaris, MacOSX, FreeBSD, sem fazer nenhuma alteração no seu programa. Por outro lado, como já dá pra imaginar, esta outra camada de tradução da Máquina Virtual acaba tornando a execução do programa mais lenta, se comparada com o método tradicional de compilação.
quinta-feira, 5 de junho de 2008
Trabalho: Primeira Parte
Introdução: Tradutores
Tradutores são programas que têm por finalidade principal realizar a tradução de uma linguagem de programação em outra: a primeira é a linguagem fonte e a segunda é a linguagem objeto, sendo que o resultado do processo de conversão (linguagem objeto) deve ser equivalente, ou seja, apresentar o mesmo propósito do conteúdo da linguagem inicial (linguagem fonte). Dessa forma, verifica-se que o objetivo geral dos tradutores é fazer a comunicação entre o Software – programa escrito em uma linguagem de programação – e o Hardware – equipamento responsável pela execução física das instruções lógicas. Entre os tradutores, os mais conhecidos são os seguintes: Compiladores, Interpretadores, Montadores (“Assemblers”) e Máquina Virtual.
Esquematicamente, tem-se:
Figura 1 (Esquema geral de funcionamento de um Tradutor)
Definição
Compiladores
Compiladores são tipos de tradutores que possuem uma forma específica de conversão, pois atuam na transformação de uma linguagem de alto nível (próxima do entendimento humano) para uma linguagem de baixo nível – linguagem de máquina (reconhecida pelo hardware do computador).
Os compiladores podem ser assim esquematizados:
A figura já foi colocada por Kelly!
Figura 2 (Esquema específico de um Compilador)
Além de realizar o processo de conversão, os compiladores também são responsáveis, na maioria das vezes, pela execução de outras tarefas que mantém relação com a principal, tais como: detecção de erros e a permissão para a inclusão de comentários. A detecção de erros é implantada através de mecanismos que além de identificar, recupera e elabora relatório de todas as incorreções encontradas no programa, eliminando com isso a necessidade de o mesmo ser submetido ao compilador toda vez que um novo erro ocorrer. A permissão de inclusão de comentários à linguagem fonte, seja por meio da estrutura da sintaxe desta ou recursos do próprio compilador, é uma ferramenta que contribui para uma melhor documentação do programa.
Estrutura dos Compiladores
Os compiladores no que diz respeito a sua estrutura estão divididos em três grandes partes ou módulos funcionais descritos da seguinte forma: Análise Léxica, Análise Sintática e Análise Semântica.
Análise Léxica
É o módulo do compilador que faz a comunicação entre a linguagem fonte e a Análise Sintática. Para isso, tem como tarefa principal a fragmentação do conteúdo fonte, a identificação e a classificação das partes componentes do mesmo (átomos ou tokens). A Análise Léxica utiliza-se de um conjunto de operações, ou melhor, funções para atingir o propósito pelo qual foi elaborada. A seguir são descritas as principais funções da Análise Léxica: Extração e Classificação de Átomos, Eliminação de Delimitadores e Comentários, Conversão Numérica, Tratamento de Identificadores, Tratamento de Palavras Reservadas, Recuperação de Erros e as Funções Auxiliares (Geração de Tabelas de Referências Cruzadas, Definição e Expansão de Macros, Interação com o Sistema Operacional, Controle de Compilação Condicional e Geração e Controle de Listagem).
Extração e Classificação de Átomos
É responsável por mapear o texto fonte em outro formato de texto que será constituído pelos átomos extraídos e classificados a partir daquele. Entre os átomos dessa etapa, encontram-se os seguintes: identificadores, números inteiros sem sinal, números reais, palavras reservadas, cadeias de caracteres (“strings”), operadores, sinais de pontuação, comentários, símbolos compostos e caracteres especiais.
Eliminação de Delimitadores e Comentários
Operação que remove os delimitadores, ou seja, os espaços em branco ou símbolos especiais e os comentários, visto que, não são necessários para a geração de código, embora sejam muito úteis na legibilidade do texto fonte.
Conversão Numérica
Esta função tem como finalidade pegar as cadeias de caracteres que representam números e os números que estão em diversas notações e convertê-los para uma forma em que possam ser manipulados pelas outras operações do compilador.
Tratamento de Identificadores
É a operação que cria uma tabela de identificadores na qual são armazenados, de forma padronizada, os identificadores (em geral, com tamanhos variáveis) e associa os mesmos a índices únicos para que possam ser referenciados de maneira mais simples.
Tratamento de Palavras Reservadas
As palavras reservadas são inicialmente tratadas como identificadores pela maioria dos analisadores léxicos. Em seguida, tais identificadores são comparados ao conjunto de palavras reservadas da linguagem em que o compilador fará a conversão, se os mesmos estiverem neste conjunto, recebem a classificação de palavras reservadas e vão para uma tabela que, em geral, é a mesma em que estão os identificadores.
Recuperação de Erros
Caracteres não identificados e cadeias de caracteres que não obedecem à classificação dada as classes de átomos reconhecidas pelo analisador léxico são identificados como erros léxicos.
Funções Auxiliares
Geração de Tabelas de Referências Cruzadas
Função que armazena em uma tabela os átomos encontrados e a localização destes no texto fonte.
Definição e Expansão de Macros
É a substituição das abreviaturas, que algumas linguagens possibilitam como recurso, pelo texto expandido e livre de definições e chamadas de macro.
Interação com o Sistema Operacional
É a interação entre o analisador léxico e o Sistema Operacional no que se refere ao acesso de arquivos necessários para a análise.
Controle de Compilação Condicional
É o mecanismo que possibilita, através de alguns parâmetros de compilação, a compilação de partes do texto fonte, omitindo-se as demais partes.
Geração e Controle de Listagem
Função que permite ao programador ativar e desativar opções de listagem, de coleta de símbolos em tabelas de referências cruzadas, de geração e impressão de tais tabelas, de impressão de tabelas e símbolos do programa compilador, de tabulação e formatação das saídas impressas do programa fonte.
Análise Sintática
A Análise Sintática tem como objetivo fazer a análise do texto fonte oriundo da Análise Léxica e que está em forma de átomos. Esta etapa atua de forma interativa, pois se comunica com o Analisador Léxico, os processos de geração de código e a Análise Semântica.
Para cumprir sua tarefa, a Análise Sintática possui algumas funções, como as descritas a seguir: Falta fazer o resumo!
Análise Semântica
A última parte ou módulo funcional de um compilador refere-se ao ato final de converter o programa fonte em programa objeto. No entanto, para que o código objeto esteja pronto se faz necessária à participação das ações semânticas. Assim como os outros módulos do compilador (Análise Léxica e Análise Sintática), a Análise Semântica também se subdivide em funções internas e integradas que ao serem realizadas contribuem para resolver as tarefas dessa fase. As principais são: Falta fazer o resumo!
terça-feira, 3 de junho de 2008
Apresentação bytecode. - Compiladores vs Interpretadores
domingo, 1 de junho de 2008
Mostrando o pensamento lógico de um compilador
Sendo um programa, o tradutor(compilador) deverá ser expresso em alguma linguagem de programçaõ disponível, para que seja possível implamtá-lo em alguma máquina existente e portanto algum compilador pode ser suposto existente para permitir a primeira tradução de um compilador para a linguagem que esta sendo desenvolvida. Este deverá, portanto, ser escrito na linguagem de programação que o compilador disponível seja capaz de traduzir.
Tem-se duas questões a solucionar: para qual máquina o compilador final deverá gerar código, e em que linguagem tal compilador deverá ser redigido.
Seja L a linguagem a ser compilada para a máquina M, ou seja, deseja-se construir um compilador da linguagem L que gere um código-objeto que seja executável na máquina M.
Com estas hipóteses, descreve-se a seguir a técnica de obtenção de compiladores ditos 'auto-compiláveis' através do método de 'bootstrapping'. Sendo que um compilador é chamado 'auto-compilável' quando a linguagem em que for desenvolvido (L') é a própria linguagem L que o compilador deve ser capaz de traduzir.
O método de 'bootstrapping' permite obter a partir de praticamente nenhuma infraestrutura uma primeira versão de um compilador auto-compilável a ser utilizado posteriormente para melhorar e aperfeiçoar, em versão subsequente, o compilador original. A técnica mencionada pode ser detalhada como segue:
- Escreve-se na linguagem L' um compilador capaz de traduzir a linguagem L para linguagem de máquina M' (nesta primeira versão, pode-se implementar apenas os recursos de L que sejam indispensáveis a construção deste primeiro compilador). Obtém-se assim na máquina M' um compilador auto-resistente para a linguagem L, que gera código para a própria máquina M'. Caso as linguagens L e M sejam a mesma, então o compilador obtido no passo 1 estaria disponível a priori, sendo assim desnecessário refazê-lo.
- De posse do compilador da linguagem L para a máquina M', reescreve-se o mesmo na própria linguagem M, eliminando-se deste modo linguagens L' diferentes, e de modo que o código-objeto que o novo compilador deve produzir se apresente na linguagem da máquina M. Utilizando-se o compilador L disponível, compila-se o novo programa obtido, obtendo-se desta maneira, para ser executado na máquina M', um compilador cruzado para a linguagem L, auto-compilável e que gera código para a máquina M. Se o compilador cruzado é o objewtivo final do desenvolvimento, eventuais aperfeiçoamentos do compilador podem ser efetuados, repetindo-se este passo até que se obtenha a versão definitiva do mesmo.
- Desejamos um compilador auto-residente, e considerando-se que o compilador obtido no passo 2 foi escrito na própria linguagem que é capaz de traduzir, ou seja, que é auto-compilável, pode-se utilizá-lo na máquina M', para compilar seu próprio texto-fonte. O programa-objeto assim obtido será executável na máquina M', e será um programa equivalente ao compilador que o produziu. Em outras palavras, o programa obtido será de linguagem L, capaz de traduzi-lo para a linguagem da máquina M, e que pode ser executado diretamente na máquina M, ou seja, produziu-se em M' um compilador auto-residente e auto-compilável da linguagem L para a máquina M.
- Transporta-se o compilador obtido para a máquina M, onde se pode, se assim for conviniente prosseguir o desenvolvimento do compilador e da linguagem, aperfeiçoando-se o programa obtido até que apresente todas as características desejadas.
Se a máquina M não comporta tal desenvolvimento, pode-se alterar o programa obtido, retornando-se ao terceiro passo tantas vezes forem necessárias , até que se obtenha o compilador desejado que é então transportado definitivamente para a máquina M. A figura abaixo mostra uma notação 'bootstrapping':
Um texto, denominado texto-fonte, é submetido ao programa representado no polígono, pela extremidade esquerda da figura.
No braço esquerdo do polígono esta indicada a linguagem em que X está escrito( linguagem fonte). O programa compilador, escrito na linguagem de desenvolvimento endicada na extremidade inferior do polígono, traduz o texto-fonte para a linguagem-objeto, indicada na extremidade direita do polígono, gerando um texto Y equivalente, denotado na linguagem-objeto.
Agora vejamos o processo de 'bootstrapping' que foi descrito anteriormente através da figura abaixo:
Assim depois do processamento chegamos no código objeto através do pensamento lógico que o compilador utiliza.