IP (complexidade)
Em Teoria da complexidade computacional, a classe IP (abreviação de Interactive Polynomial Time (Tempo Polinomial Interativo)) é a classe de problemas solúveis em tempo polinomial por um sistema de prova interativa. O conceito de sistemas de provas interativas foi introduzido pela primeira vez por Shafi Goldwasser, Silvio Micali, e Charles Rackoff em 1985. Um sistema de prova interativa consiste em duas máquinas, uma provadora (P) a qual apresenta a prova que uma dada string n é um membro de uma certa linguagem e um verificador (V) o qual verifica se a prova apresentada é correta. Assumindo que a provadora é infinita em armazenamento e computação, enquanto o verificador é uma máquina com tempo polinomial probabilístico com acesso a uma string de bits aleatórios cujo tamanho é polinomial no tamanho n. Essas duas máquinas trocam um número polinomial, p(n), de mensagens e uma vez que a interação é concluída, o verificador deve decidir se n está ou não na linguagem, com apenas 1/3 de chance de erro. (Então, qualquer linguagem em BPP está em IP, sendo assim o verificador poderia simplesmente ignorar o provador e fazer a decisão por conta própria).
Definição
editarA linguagem L pertence a IP se existe um V, P para todo Q, w:
O Protocolo de Arthur-Merlin, introduzido por Laszlo Babai, é similar em natureza, exceto que o número de rodadas de interação é limitado por uma constante ao invés de um polinômio.
Goldwasser et al. mostraram que protocolos de "moeda pública", onde os números randômicos usados por um verificador são providos ao provador juntamente com os desafios, não são menos poderosos do que protocolos de moeda privada. No máximo duas rodadas adicionais de interação são necessárias para replicar o efeito de um protocolo de moeda privada. A inclusão oposta é direta, porque o verificador sempre pode mandar para o provador os resultados dos seus lançamentos de moeda privada, que prova que os dois tipos de protocolos são equivalentes.
Na seção seguinte iremos provar que IP = PSPACE, um teorema importante em complexidade computacional, que demonstra que um sistema de prova interativa pode ser usado para decidir se uma string é um membro de uma linguagem em tempo polinomial, mesmo que a prova PSPACE tradicional seja exponencialmente longa.
Prova que IP = PSPACE
editarA prova pode ser dividida em duas partes, mostramos que IP ⊆ PSPACE e PSPACE ⊆ IP. A intuição nesta prova é que polinômios formam bons códigos para corretores de erros. Meir mostrou que [1] isso pode ser feito com alta precisão: com algum trabalho extra a prova pode ser modificada para provar coisas mais abstratas e indiscutivelmente mais naturais, como configurações de códigos corretores de erro.
IP ⊆ PSPACE
editarA fim de demonstrar que IP ⊆ PSPACE, nós apresentamos a simulação de um sistema de prova interativa via uma máquina que usa espaço polinomial. Agora vamos as devidas definições:
e para todo 0 ≤ j ≤ p e toda história de mensagens Mj, definimos indutivamente a função NMj:
onde:
onde Prr é a probabilidade tomada sobre a cadeia aleatória r de tamanho p. Essa expressão é a média de NMj+1, com peso determinado pela probabilidade que o verificador mande a mensagem mj+1.
Suponha que M0 seja a mensagem de sequência vazia, aqui vamos mostrar que NM0 = Pr[V aceita w]. Primeiro, para computar NM0, um algoritmo pode recursivamente calcular os valores NMj para todo j e Mj. Uma vez que a pilha da recursão é de tamanho p, onde espaço polinomial é necessário. O segundo requisito é que precisamos NM0 = Pr[V aceita w], o valor necessário para determinar se w pertence a A. Usamos indução para provar isso.
Temos que mostrar que para todo 0 ≤ j ≤ p e todo Mj NMj = Pr[V aceita w começando em Mj], e vamos fazer isso usando indução em j. O caso base é provar para j = p. Então vamos usar indução para ir de p até chegar no 0.
O caso base j = p é bem simples. Uma vez que mp é ou aceito ou é rejeitado, se mp é aceito, NMp é definido como sendo 1 e Pr[V aceita w começando em Mj] = 1 uma vez que a cadeia de mensagens indica aceitação, então a afirmação é verdadeira. Usamos o argumento similar a esse para o caso de mp ser rejeitado.
Para a hipótese de indução assumimos que para j+1 ≤ p e uma sequência de mensagens Mj+1, NMj = Pr[V aceita w começando em j+1] e então provamos a hipótese para j e para a sequência de mensagens Mj.
Se j é par, mj+1 é uma mensagem de V para P. Pela definição de NMj,
Então, pela hipótese indutiva, podemos dizer que é igual a
Finalmente, pela definição, nós podemos ver que isso é igual a Pr[V aceita w começando em Mj].
Se j é impar, mj+1 é uma mensagem de P para V. Pela definição, temos:
Então, pela hipótese indutiva, é igual a:
Isso é igual a Pr[V accepts w começando em Mj], uma vez que:
por que a provadora do lado esquerdo poderia mandar a mensagem mj+1 para maximizar a expressão no lado esquerdo. E:
Uma vez que a mesma Máquina Provadora não pode fazer nada mais do que mandar a mesma mensagem. Então isso assegura que é válido independentemente se i é par ou ímpar. A prova de que IP ⊆ PSPACE está completa.
Construímos uma máquina de espaço polinomial que usa a melhor provadora P para uma string w em uma linguagem A. Usamos essa melhor Provadora em lugar de uma provadora com entrada de bits aleatórios pois isso nos possibilita tentar todos os conjuntos de entradas de bits aleatórios com uma máquina de espaço polinomial, mostramos que IP ⊆ PSPACE, como desejado.
PSPACE ⊆ IP
editarPara ilustrar a técnica que vai ser usada para provar IP ⊆ PSPACE, primeiro vamos provar um teorema mais fraco, que foi provado por Lund, et al.: #SAT ∈ IP. Daí então, usando os conceitos dessa prova, podemos estendê-la para mostrar que TQBF ∈ IP. Uma vez que TQBF ∈ PSPACE-completo, e TQBF ∈ IP então PSPACE ⊆ IP.
#SAT é um membro de IP
editarComeçamos mostrando que #SAT está em IP, aonde:
Perceba que isso é diferente da definição normal de #SAT, aqui é uma problema de decisão ao invés de uma função.
Primeiro mostramos o uso da aritmetização para mapear a fórmula booleana com n variáveis, φ(b1, ..., bn) para uma fórmula polinomial pφ(x1, ..., xn), onde pφ imita φ em pφ é 1 se φ é verdadeiro e 0 caso contrário, mostrado isso, temos que às variáveis de pφ são atribuídos valores booleanos. As operações booleanas ∨, ∧ e ¬ usadas em φ são simuladas em pφ atráves da substituição dos operadores em φ como mostrado na tabela abaixo.
a ∧ b | ab |
a ∨ b | a ∗ b := 1 − (1 − a)(1 − b) |
¬a | 1 − a |
Como um exemplo, φ = a ∧ b ∨ ¬c pode ser convertido em uma formula booleana da seguinte forma:
As operações ab e a ∗ b cada uma resulta em um polinômio com um grau limitado pela soma dos graus dos polinômios para a and b e a partir daí, o grau de qualquer variável é no máximo o tamanho de φ.
Seja F um número finito de ordem q > 2n; com q maior que 1000. Para cada 0 ≤ i ≤ n,defina uma função fi em F, tendo como parâmetros , e um variável ai em F: Para 0 ≤ i ≤ n e para seja
Note que o valor de f f0 é o número que satisfaz o valor de φ. f0 é uma função void, sem variáveis.
Agora, o protodolo para #SAT funciona como segue:
- Fase 0: A provadora P escolhe q > 2n e computa f, e então aplica o prilitivoq e f0 ao verificador V. V checa que q é um primitivo max(1000, 2n) e que f0() = k.
- Fase 1: P envias os coeficientes de f1(z) como um polinomial de z. V verifica que o grau de f1 é menor que n e que f0 = f1(0) + f1(1). (Se não, V rejeita). V então manda um número randômico r1 de F para P.
- Fase i: P envia os coeficientes de como um polinômio de z. V verifica que o grau de fi é menor que n e que . (Se não, V rejeita). V então manda um número randômico ri de F para P.
- Fase n+1: V valora para comparar com valor . Se eles forem iguais V aceita, rejeita caso contrário.
Note que isso é um algoritmo de moeda pública.
Se φ tem k valorações que satisfazem, é claro que V irá aceitá-la. Se φ não possui k valorações que a satisfazem, existe uma prova que tenta convencer V que φ não possui k valorações que satisfazem. Mostramos que isso só pode ser feito com baixa probabilidade.
De forma a impedir V de rejeitar na fase 0, tem que mandar valores incorretos para P. Então, na fase 1, deve mandar um polinomial incorreto com a propriedade de . Quando V escolhe o número aleatório r1 para mandar para P,
Isso acontece porque um polinômio com uma só variável de grau no máximo d não pode ter mais que d raizes (a não ser que sempre gere o valor 0). Então, qualquer dois polinômios em uma váriavel de grau no máximo d podem ser iguais em no máximo d vezes. Uma vez que |F| > 2n a chance de r1 ser um desses valores é de se n > 10, ou no máximo (n/1000) ≤ (n/n3) se n ≤ 10.
Generalizando essa ideia para outras fases temos que para cada 1 ≤ i ≤ n se
então para ri escolhido aleatoriamente em F,
Existem n fases, então a probabilidade que é sortudo por que V seleciona em algum estágio um ri conveniente é no maximo 1/n. Então, nenhum provador pode fazer o verificador aceitar com probabilidade maior que 1/n. Podemos perceber também dessa definição que o verificador V opera em tempo polinomial probabilístico. Logo, #SAT ∈ IP.
TQBF é um membro de IP
editarPara mostrar que PSPACE é um subconjunto de IP precisamos mostrar um problema PSPACE-completo e mostrar que ele está em IP. Uma vez que nós mostrarmos isso, fica evidente que PSPACE ⊆ IP. Os créditos da técnica demonstrada aqui são atribuídos a Adi Shamir.
Sabemos que TQBF está em PSPACE-Complete. Seja ψ uma expressão booleana quantificada:
onde φ está na forma CNF. Então Qi é o quantificador, que pode ser tanto ∃ ou ∀. Agora fi é o mesmo que na prova anterior, mas agora ele também inclui quantificadores.
Aqui, φ(a1, ..., ai) é φ com a1 para ai substituido por x1 para xi. Então f0 é valor verdade de ψ. Com o objetivo de fazer a aritmetização ψ devemos usar as regras seguintes:
que como anteriormente, definimos x ∗ y = 1 − (1 − x)(1 − y).
Usando o método definido em #SAT, devemos enfrentar o problema que para qualquer fi o grau do polinômio resultante pode dobrar com cada quantificador. Para impedir isso, devemos introduzir um novo operador de redução R no qual vai reduzir os graus dos polinômios sem trocar seu comportamento em entradas booleanas.
Então, agora antes da aritmetização introduzimos uma nova expressão:
onde r:
Agora para cada i ≤ k nós definimos a função fi. nós também definimos para ser o polinômio p(x1, ..., xm) que é obtido através da aritmetização de φ. Para manter o grau dos polinômios baixos, definimos fi em termos de fi+1:
Agora podemos ver que a operação de redução R, não muda o grau do polinômio. Também é importante perceber que a operação Rx não muda o valor da função nas entradas booleanas. Então, f0 ainda é o valor verdade de ψ, mas o valor de Rx produz um resultado que é linearmente em x. Também, sobre qualquer Qixi nós adicionamos em ψ′ a fim de reduzir o grau para 1 depois da aritmetização Qi
Agora vamos descrever o protocolo. Se n é o tamanho de ψ, toda operação aritmética no protocolo é sobre o tamanho no mínimo n4 aonde n é o tamanho de ψ.
- Fase 0: P → V: P envia f0 para V. V checa se f0= 1 e rejeita se não for.
- Fase 1: P → V: P manda f1(z) para V. V usa coeficientes para valorar f1(0) e f1(1). Então ele checa se os graus de polinomios é no máximo n e que a seguinte identidade é verdadeira:
- Se algum falha, entao rejeite
- Phase i: P → V: P envia como um polinômio em z. r1 mostra que o anterior passou valores aleatórios para
V usa coeficientes para valorar e . Entâo ele checa se o grau do polinômio é no máximo n e a seguinte identidade é verdadeira:
- Se alguma delas falha, entao rejeite.
V → P: V escolhe um r aleatório em F e manda para P. (Se S=R então o valor de r substitiu o valor anterior de r).
Vá para a fase i + 1 aonde P deve induzir V que é correto.
- Fase k + 1: V valora . Então ele checa se Se eles são iguais, então V aceita, V rejeita, caso contrário.
Esse é o fim da descrição do protocolo.
Se ψ é verdade, então V vai aceitar quanto P segue o protocolo. Assim como se é um provador malicioso no qual ele mente, e se ψ é falso, então vai precisar mentir na fase 0 e enviar algum valor para f0. Se na fase i, V tem um valor incorreto para então e naturalmente, também vai ser incorreto , e assim por diante. A probabilidade para de ser sortudo o suficiente para o valor randômico de r é no máximo o grau do polinômio dividido pelo tamanho: . O protocolo roda sobre O(n2) fases, então a probabilidade que é sortudo em alguma fase é ≤ 1/n. Se nunca for sortudo, então V vai rejeitar na fase k+1.
Uma vez que nós mostramos IP ⊆ PSPACE ePSPACE ⊆ IP, nós podemos concluir que IP = PSPACE, como desejado. Além disso, nós mostramos que qualquer algoritmo IP pode ser de moeda-pública, uma vez que a redução de PSPACE para IP tem essa propriedade.
Referências
Bibliografia
editar- Babai, L. Trading group theory for randomness. In Proceedings of the 17th ACM Symposium on the Theory of Computation . ACM, New York, 1985, pp. 421–429.
- Shafi Goldwasser, Silvio Micali, and Charles Rackoff. The Knowledge complexity of interactive proof-systems. Proceedings of 17th ACM Symposium on the Theory of Computation, Providence, Rhode Island. 1985, pp. 291–304. Extended abstract
- Shafi Goldwasser and Michael Sipser. Private coins versus public coins in interactive proof systems. Proceedings of the 18th Annual ACM Symposium on Theory of Computation. ACM, New York, 1986, pp. 59–68.
- Rahul Jain, Zhengfeng Ji, Sarvagya Upadhyay, John Watrous. QIP = PSPACE. [1]
- Lund, C., Fortnow, L., Karloff, H., Nisan, N. Algebraic methods for interactive proof systems. In Proceedings of 31st Symposium on the Foundations of Computer Science. IEEE, New York, 1990, pp. 2–90.
- Adi Shamir. IP = PSPACE. Journal of the ACM, volume 39, issue 4, p. 869–877. October 1992.
- Alexander Shen. IP=PSpace: Simplified Proof. J.ACM, v. 39(4), pp. 878–880, 1992.
- MIP, IPP, QIP, QIP(2), compIP, frIP