quarta-feira, 11 de junho de 2008

E Máquina Virtual?

Máquina Virtual, como foi dito na nossa última apresentação, é um tipo de tradutor auxiliar que fica entre o Compilador e o Interpretador.
No caso, o programador escreve o códiogo fonte, numa linguagem de alto nível, e executa um programa (compilador) que irá traduzir o texto para um código binário, de baixo nível. A diferença, nesse caso, está no fato de que esse código binário gerado ainda não é um código que pode ser entendido pela máquina, ele é um código intermediário, e para que o computador possa executá-lo é necessário uma
Máquina Virtual. É a Máquina Virtual que vai traduzir esse código intermediário para um código que o computador consegue entender.
Pra quem está começando agora na área de programação,a utilização de Máquinas Virtuais pode parecer estranho, mas essa técnica trouxe grandes avanços e é cada vez mais comum a sua utilização. A principal vantagem é que com a utilização da Máquina Virtual fica muito fácil executar um mesmo aplicativo em sistemas diferentes. Um código binário criado pelo método tradicional da compilação só pode ser executado no Sistema Operacional onde foi criado. Já um código gerado por uma Máquina Virtual pode ser executado em diversos Sistemas Operacionais diferentes. Java é um bom exemplo: mesmo que um programa em Java seja criado no Windows, ele pode ser rodado também no Linux, Solaris, MacOSX, FreeBSD, sem fazer nenhuma alteração no seu programa. Por outro lado, como já dá pra imaginar, esta outra camada de tradução da Máquina Virtual acaba tornando a execução do programa mais lenta, se comparada com o método tradicional de compilação.

quinta-feira, 5 de junho de 2008

Trabalho: Primeira Parte

Tradutores: Compiladores e Interpretadores

Introdução: Tradutores

Tradutores são programas que têm por finalidade principal realizar a tradução de uma linguagem de programação em outra: a primeira é a linguagem fonte e a segunda é a linguagem objeto, sendo que o resultado do processo de conversão (linguagem objeto) deve ser equivalente, ou seja, apresentar o mesmo propósito do conteúdo da linguagem inicial (linguagem fonte). Dessa forma, verifica-se que o objetivo geral dos tradutores é fazer a comunicação entre o Software – programa escrito em uma linguagem de programação – e o Hardware – equipamento responsável pela execução física das instruções lógicas. Entre os tradutores, os mais conhecidos são os seguintes: Compiladores, Interpretadores, Montadores (“Assemblers”) e Máquina Virtual.

Esquematicamente, tem-se:
A figura já foi colocada por Kelly!

Figura 1 (Esquema geral de funcionamento de um Tradutor)

Definição

Compiladores

Compiladores são tipos de tradutores que possuem uma forma específica de conversão, pois atuam na transformação de uma linguagem de alto nível (próxima do entendimento humano) para uma linguagem de baixo nível – linguagem de máquina (reconhecida pelo hardware do computador).

Os compiladores podem ser assim esquematizados:

A figura já foi colocada por Kelly!

Figura 2 (Esquema específico de um Compilador)

Além de realizar o processo de conversão, os compiladores também são responsáveis, na maioria das vezes, pela execução de outras tarefas que mantém relação com a principal, tais como: detecção de erros e a permissão para a inclusão de comentários. A detecção de erros é implantada através de mecanismos que além de identificar, recupera e elabora relatório de todas as incorreções encontradas no programa, eliminando com isso a necessidade de o mesmo ser submetido ao compilador toda vez que um novo erro ocorrer. A permissão de inclusão de comentários à linguagem fonte, seja por meio da estrutura da sintaxe desta ou recursos do próprio compilador, é uma ferramenta que contribui para uma melhor documentação do programa.

Estrutura dos Compiladores

Os compiladores no que diz respeito a sua estrutura estão divididos em três grandes partes ou módulos funcionais descritos da seguinte forma: Análise Léxica, Análise Sintática e Análise Semântica.

Análise Léxica

É o módulo do compilador que faz a comunicação entre a linguagem fonte e a Análise Sintática. Para isso, tem como tarefa principal a fragmentação do conteúdo fonte, a identificação e a classificação das partes componentes do mesmo (átomos ou tokens). A Análise Léxica utiliza-se de um conjunto de operações, ou melhor, funções para atingir o propósito pelo qual foi elaborada. A seguir são descritas as principais funções da Análise Léxica: Extração e Classificação de Átomos, Eliminação de Delimitadores e Comentários, Conversão Numérica, Tratamento de Identificadores, Tratamento de Palavras Reservadas, Recuperação de Erros e as Funções Auxiliares (Geração de Tabelas de Referências Cruzadas, Definição e Expansão de Macros, Interação com o Sistema Operacional, Controle de Compilação Condicional e Geração e Controle de Listagem).

Extração e Classificação de Átomos

É responsável por mapear o texto fonte em outro formato de texto que será constituído pelos átomos extraídos e classificados a partir daquele. Entre os átomos dessa etapa, encontram-se os seguintes: identificadores, números inteiros sem sinal, números reais, palavras reservadas, cadeias de caracteres (“strings”), operadores, sinais de pontuação, comentários, símbolos compostos e caracteres especiais.

Eliminação de Delimitadores e Comentários

Operação que remove os delimitadores, ou seja, os espaços em branco ou símbolos especiais e os comentários, visto que, não são necessários para a geração de código, embora sejam muito úteis na legibilidade do texto fonte.

Conversão Numérica

Esta função tem como finalidade pegar as cadeias de caracteres que representam números e os números que estão em diversas notações e convertê-los para uma forma em que possam ser manipulados pelas outras operações do compilador.

Tratamento de Identificadores

É a operação que cria uma tabela de identificadores na qual são armazenados, de forma padronizada, os identificadores (em geral, com tamanhos variáveis) e associa os mesmos a índices únicos para que possam ser referenciados de maneira mais simples.

Tratamento de Palavras Reservadas

As palavras reservadas são inicialmente tratadas como identificadores pela maioria dos analisadores léxicos. Em seguida, tais identificadores são comparados ao conjunto de palavras reservadas da linguagem em que o compilador fará a conversão, se os mesmos estiverem neste conjunto, recebem a classificação de palavras reservadas e vão para uma tabela que, em geral, é a mesma em que estão os identificadores.

Recuperação de Erros

Caracteres não identificados e cadeias de caracteres que não obedecem à classificação dada as classes de átomos reconhecidas pelo analisador léxico são identificados como erros léxicos.

Funções Auxiliares

Geração de Tabelas de Referências Cruzadas

Função que armazena em uma tabela os átomos encontrados e a localização destes no texto fonte.

Definição e Expansão de Macros

É a substituição das abreviaturas, que algumas linguagens possibilitam como recurso, pelo texto expandido e livre de definições e chamadas de macro.

Interação com o Sistema Operacional

É a interação entre o analisador léxico e o Sistema Operacional no que se refere ao acesso de arquivos necessários para a análise.

Controle de Compilação Condicional

É o mecanismo que possibilita, através de alguns parâmetros de compilação, a compilação de partes do texto fonte, omitindo-se as demais partes.

Geração e Controle de Listagem

Função que permite ao programador ativar e desativar opções de listagem, de coleta de símbolos em tabelas de referências cruzadas, de geração e impressão de tais tabelas, de impressão de tabelas e símbolos do programa compilador, de tabulação e formatação das saídas impressas do programa fonte.

Análise Sintática

A Análise Sintática tem como objetivo fazer a análise do texto fonte oriundo da Análise Léxica e que está em forma de átomos. Esta etapa atua de forma interativa, pois se comunica com o Analisador Léxico, os processos de geração de código e a Análise Semântica.
Para cumprir sua tarefa, a Análise Sintática possui algumas funções, como as descritas a seguir: Falta fazer o resumo!

Análise Semântica

A última parte ou módulo funcional de um compilador refere-se ao ato final de converter o programa fonte em programa objeto. No entanto, para que o código objeto esteja pronto se faz necessária à participação das ações semânticas. Assim como os outros módulos do compilador (Análise Léxica e Análise Sintática), a Análise Semântica também se subdivide em funções internas e integradas que ao serem realizadas contribuem para resolver as tarefas dessa fase. As principais são: Falta fazer o resumo!

Referência Bibliográfica
NETO, João José. Introdução à compilação. Rio de Janeiro: Livros Técnicos e Científicos, 1987.

terça-feira, 3 de junho de 2008

Apresentação bytecode. - Compiladores vs Interpretadores

E aqui estão os nossos slides que foram usados na apresentação provisória da última quinta-feira, dia 29 de Maio, pra quem quiser olhar com mais calma. Nós estamos pensando em adicionar mais coisas pra apresentação final. Aguardem! :)

domingo, 1 de junho de 2008

Mostrando o pensamento lógico de um compilador

Através do uso de metalinguagens é possível obter-se, de modo suficientemente rigoroso uma boa definição da linguagem de programação cujo compilador se deseja construir. Seja qual for a técnica empregada para tal finalidade, o resultado é sempre um programa a ser executado no computador.

Sendo um programa, o tradutor(compilador) deverá ser expresso em alguma linguagem de programçaõ disponível, para que seja possível implamtá-lo em alguma máquina existente e portanto algum compilador pode ser suposto existente para permitir a primeira tradução de um compilador para a linguagem que esta sendo desenvolvida. Este deverá, portanto, ser escrito na linguagem de programação que o compilador disponível seja capaz de traduzir.

Tem-se duas questões a solucionar: para qual máquina o compilador final deverá gerar código, e em que linguagem tal compilador deverá ser redigido.

Seja L a linguagem a ser compilada para a máquina M, ou seja, deseja-se construir um compilador da linguagem L que gere um código-objeto que seja executável na máquina M.

Com estas hipóteses, descreve-se a seguir a técnica de obtenção de compiladores ditos 'auto-compiláveis' através do método de 'bootstrapping'. Sendo que um compilador é chamado 'auto-compilável' quando a linguagem em que for desenvolvido (L') é a própria linguagem L que o compilador deve ser capaz de traduzir.

O método de 'bootstrapping' permite obter a partir de praticamente nenhuma infraestrutura uma primeira versão de um compilador auto-compilável a ser utilizado posteriormente para melhorar e aperfeiçoar, em versão subsequente, o compilador original. A técnica mencionada pode ser detalhada como segue:

  1. Escreve-se na linguagem L' um compilador capaz de traduzir a linguagem L para linguagem de máquina M' (nesta primeira versão, pode-se implementar apenas os recursos de L que sejam indispensáveis a construção deste primeiro compilador). Obtém-se assim na máquina M' um compilador auto-resistente para a linguagem L, que gera código para a própria máquina M'. Caso as linguagens L e M sejam a mesma, então o compilador obtido no passo 1 estaria disponível a priori, sendo assim desnecessário refazê-lo.
  2. De posse do compilador da linguagem L para a máquina M', reescreve-se o mesmo na própria linguagem M, eliminando-se deste modo linguagens L' diferentes, e de modo que o código-objeto que o novo compilador deve produzir se apresente na linguagem da máquina M. Utilizando-se o compilador L disponível, compila-se o novo programa obtido, obtendo-se desta maneira, para ser executado na máquina M', um compilador cruzado para a linguagem L, auto-compilável e que gera código para a máquina M. Se o compilador cruzado é o objewtivo final do desenvolvimento, eventuais aperfeiçoamentos do compilador podem ser efetuados, repetindo-se este passo até que se obtenha a versão definitiva do mesmo.
  3. Desejamos um compilador auto-residente, e considerando-se que o compilador obtido no passo 2 foi escrito na própria linguagem que é capaz de traduzir, ou seja, que é auto-compilável, pode-se utilizá-lo na máquina M', para compilar seu próprio texto-fonte. O programa-objeto assim obtido será executável na máquina M', e será um programa equivalente ao compilador que o produziu. Em outras palavras, o programa obtido será de linguagem L, capaz de traduzi-lo para a linguagem da máquina M, e que pode ser executado diretamente na máquina M, ou seja, produziu-se em M' um compilador auto-residente e auto-compilável da linguagem L para a máquina M.
  4. Transporta-se o compilador obtido para a máquina M, onde se pode, se assim for conviniente prosseguir o desenvolvimento do compilador e da linguagem, aperfeiçoando-se o programa obtido até que apresente todas as características desejadas.

Se a máquina M não comporta tal desenvolvimento, pode-se alterar o programa obtido, retornando-se ao terceiro passo tantas vezes forem necessárias , até que se obtenha o compilador desejado que é então transportado definitivamente para a máquina M. A figura abaixo mostra uma notação 'bootstrapping':

Um texto, denominado texto-fonte, é submetido ao programa representado no polígono, pela extremidade esquerda da figura.

No braço esquerdo do polígono esta indicada a linguagem em que X está escrito( linguagem fonte). O programa compilador, escrito na linguagem de desenvolvimento endicada na extremidade inferior do polígono, traduz o texto-fonte para a linguagem-objeto, indicada na extremidade direita do polígono, gerando um texto Y equivalente, denotado na linguagem-objeto.

Agora vejamos o processo de 'bootstrapping' que foi descrito anteriormente através da figura abaixo:


Assim depois do processamento chegamos no código objeto através do pensamento lógico que o compilador utiliza.

Diferenças de nomenclatura

Um tradutor efetua a conversão entre duas linguagens, sendo o primeiro texto chamado de 'código fonte' e o transformado em 'código objeto' . O tradutor pode converter por exemplo a linguagem do algoritmo 'pascal' em linguagem binária, java, fortran entre outros. Veja a figura abaixo:

De maneira geral, os tradutores efetuam portanto a conversão de textos redigidos em uma linguagem para formas equivalentes redigidas em outra linguagem. Se a primeira linguagem for uma linguagem de alto nível, o tradutor receberá o nome de compilador. Veja a figura:

Do ponto de vista da linguagem-objeto, esta também pode ser ou não uma linguagem de alto nível. É possível, por exemplo, que o texto-fonte esteja redigido em 'FORTRAN', e que um tradutor aceite tal texto e o converta para alguma linguagem de baixo nível (linguagem de montagem, ou linguagem de máquina) ou então para alguma outra linguagem de alto nível, tal como 'PASCAL' ou 'BASIC'. Um tradutor que efetue conversões entre duas linguagens de alto nível é denominado 'filtro', se a linguagem objeto for muito semelhante à linguagem fonte. Veja a figura a seguir:


Muitas vezes, programas que efetuam traduções entre dois dialetos de mesma linguagem, ou que permitem converter para uma forma padronizada um texto que inclua extensões de uma linguagem disponível, são denominados 'pré-processadores'. Basicamente, a função dos pr-e-processadores, neste caso, consiste na eliminação de construções de nível mais alto que o da linguagem-base, e na correspondente inserção de textos equivalentes, compostos exclusivamente de construções da linguagem-base. Veja a figura abaixo:



Outro exemplo de aplicação de pré-processadores é no processamento da definição e utilização de macros em linguagem de alto nível. Em muitos casos, os compiladores destas linguagens não oferecem ao usuário tais recursos, sendo as macros manipuladas externamente, por um pré-processador encarregado de manipular e eliminar tais construções do texto-fonte, para que possa ser traduzido pelo compilador.