Linguagem livre de contexto
Na teoria de linguagens formais, uma linguagem livre de contexto (LLC) é uma linguagem gerada por alguma gramática livre de contexto (GLC). Diferentes gramáticas livres de contexto podem gerar a mesma linguagem livre de contexto, ou, inversamente, uma dada linguagem livre de contexto pode ser gerada por diferentes gramáticas livres de contexto. É importante distinguir as propriedades da linguagem (propriedades intrínsecas) de propriedades de uma gramática específica (propriedades extrínsecas).
O conjunto de todas as linguagens livres de contexto é idêntico ao conjunto de linguagens aceitas por um autômato de pilha,[1] o que faz com que essas linguagens sejam passíveis de análise. Na verdade, dada uma GLC, há uma maneira direta para produzir um autômato com pilha para a gramática (e linguagem correspondente), mas indo para o outro lado (produzindo uma gramática dado um autômato) não é tão direta.
Aplicações
editarTais linguagens são importantes para definir linguagens de programação.[1] Por exemplo, as linguagens que requerem o balanceamento de parênteses são geradas pela gramática . Da mesma forma, a maioria das expressões aritméticas é gerada por gramáticas livres de contexto.
Exemplos
editarUma linguagem livre de contexto é , a linguagem de todas as cadeias de caracteres não vazias de tamanho par, a primeira metade sempre preenchida com " "s e a segunda metade sempre preenchida com " "s. é gerada pela gramática , e é aceita pelo autômato de pilha , em que é definido da seguinte forma:
Onde z é o símbolo inicial da pilha e x significa desempilhar.
LLCs não ambíguas são um subconjunto próprio de todos os LLCs: há LLCs inerentemente ambíguas. Um exemplo de uma LLC inerentemente ambígua é a união de com . Este conjunto é livre de contexto, uma vez que a união de duas linguagens livres de contexto é sempre livre de contexto. Mas não há nenhuma maneira de transformar de forma não ambígua cadeias no subconjunto (não-livre-contexto) que é a interseção dessas duas linguagens.[2]
Linguagens não livres de contexto
editarO conjunto é uma Linguagem sensível ao contexto, mas não existe uma gramática livre de contexto gerando essa linguagem. [2] Então existem linguagens sensíveis ao contexto que não são livres de contexto. Para provar que uma determinada linguagem não é livre de contexto, pode-se empregar o Lema do bombeamento para linguagens livres de contexto ou uma série de outros métodos, como o Lema de Ogden ou Teorema de Parikh.[3]
Propriedades de fechamento
editarLinguagens livres de contexto são fechadas nas seguintes operações. Se L e P são linguagens livres de contexto e D é uma linguagem regular, as seguintes linguagens também são livres de contexto:[4] OI
- o fecho de Kleene de L[5]
- a imagem φ(L) de L sob um homomorfismo φ
- a concatenação de L e P[5]
- a união de L e P[5]
- a interseção (com uma linguagem regular) de L e D
Linguagens livres de contexto não são fechadas sob complemento, interseção ou diferença. No entanto, se L é uma linguagem livre de contexto e D é uma linguagem regular, então tanto a sua interseção e sua diferença são linguagens livres de contexto.
Não fechamento dentro de interseção e complemento
editarAs linguagens livres de contexto não são fechadas sob interseção. Isto pode ser visto tomando as linguagens e , que são ambos livre de contexto.[6] A interseção é , que pode ser mostrado como sendo não livre do contexto pelo Lema do bombeamento para linguagens livres de contexto.
Linguagens livres de contexto também não estão fechadas sob complementação, como para qualquer linguagem de A e B: .
Propriedades de decisão
editarOs seguintes problemas são indecidíveis para quaisquer gramáticas livres de contexto A e B:
- Equivalência: Dadas duas gramáticas livres de contexto A e B, é ?
- Intersecção vazia: Dadas duas gramáticas livres de contexto A e B, é ? No entanto, a intersecção entre uma linguagem livre de contexto e uma linguagem regular é livre de contexto, e a variante do problema onde B é uma gramática regular, é decidível.
- Contenção: Dada uma gramática livre de contexto A, é ? Mais uma vez, a variante do problema em que B é uma gramática regular é decidível.
- Universalidade: Dada uma gramática livre de contexto A, é ?
Os seguintes problemas são decidíveis para quaisquer linguagens livres de contexto:
- Vacuidade: Dada uma gramática livre de contexto A, é ?
- Finitude: Dada uma gramática livre de contexto A, é finito?
- Composição: Dada uma gramática livre de contexto G, e uma palavra , então ? Algoritmos eficientes em tempo polinomial para o problema de composição são o Algoritmo CYK e Algoritmo Earley.
Análise sintática
editarDeterminar uma instância do problema da composição, ou seja, dada uma cadeia , determinar se onde é a linguagem gerada por alguma gramática , também é conhecido como Análise sintática (computação).
Formalmente, o conjunto de todas as linguagens livres de contexto é idêntico ao conjunto de linguagens aceitas por autômato com pilha (AP). Algoritmos de análise sintática para linguagens livres de contexto incluem o Algoritmo CYK e o Algoritmo Earley.
Uma subclasse especial de linguagens livres de contexto é a Linguagem livre de contexto determinística, que é definida como o conjunto de linguagens aceitas por um Autômato com pilha determinístico e pode ser analisado por um Analisador sintático LR.[7]
Decidindo se uma linguagem é ou não livre de contexto
editarTeorema da iteração para linguagens livre de contexto
editarSe L é uma linguagem livre de contexto, então existe um n tal que para todo s ∈ L tal que |s| ≥ n, s pode ser reescrito da forma uvxyz, |vxy| > 0 e |vxy| ≤ n, tal que ∀ i, i ≥ 0 ∈ L
Teoria da computação
editar
Ver também
editarReferências
- ↑ a b David Déharbe (2003). «Gramáticas livres de contexto» (PDF). Universidade Federal do Rio Grande do Norte. Consultado em 23 de agosto de 2008. Arquivado do original (PDF) em 23 de março de 2005
- ↑ a b Hopcroft & Ullman 1979.
- ↑ How to prove that a language is not context-free?
- ↑ «CS 273: Closure Properties for Context-Free Languages» (em inglês). Universidade de Illinois em Urbana-Champaign. Consultado em 23 de agosto de 2008
- ↑ a b c «Context-Free Grammar» (em inglês). Old Dominion University. Consultado em 23 de agosto de 2008
- ↑ Uma gramática livre de contexto para a linguagem de A é dado pelas seguintes regras de produção, tendo S como o símbolo de início: S → Sc | aTb | ε; T → aTb | ε. A gramática para B é análoga.
- ↑ Knuth, Donald E. (1 de dezembro de 1965). «On the translation of languages from left to right». Information and Control. 8 (6): 607-639. doi:10.1016/S0019-9958(65)90426-2