-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathcomplexidade.tex
672 lines (518 loc) · 35.1 KB
/
complexidade.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
\chapter{Complexidade Computacional}
\label{cha:complexidade}
Até aqui nos ocupamos principalmente do problema da expressivdade de modelos de computação.
Ou seja, o que é possível computar com cada modelo.
Terminamos o último capítulo com um modelo bastante expressivo das Máquinas de Turing.
Vimos que mesmo nesse modelo há problemas que não são computáveis, como o problema da parada.
Neste último capítulo nos voltaremos para outra questão: que problemas computacionais são resolvíveis de maneira eficiente?
Por efeciente entendemo que há algum recurso escasso consumido pelo algoritmo que resolve o problema, por exemplo tempo ou espaço de memória.
\section{Complexidade de Tempo}
\label{sec:tempo}
O {\em tempo de execução} de uma MT $M$ é uma função $f: \mathbb{N} \to \mathbb{N}$ em que $f(n)$ é o número máximo de passos de derivação para uma entrada $\omega$ qualquer de tamanho $n$.
\begin{displaymath}
TIME(t(n)) = \{A \subseteq \Sigma^* : \textrm{$\exists$ MT simples que decide $A$ em tempo $O(t(n))$}\}
\end{displaymath}
\begin{example}
$TIME(n)$ é a classe dos problemas resolvíveis em tempos {\em linear} no pior caso.
$TIME(n^2)$ é a classe dos problemas resolvíveis em tempo {\em quadrático} no pior caso.
\end{example}
\begin{theorem}
Se $t(n) \geq n$ então toda MT multifita que consome tempo $t(n)$ é equivalente a uma MT simples que consome tempo $O(t^2(n))$.
\end{theorem}
\begin{proof}
Considere a simulação de uma MT com $k$ fitas que vimos no Teorema \ref{}.
$M$ varre a fita em tempo $O(n)$ para obter as informação necessárias para o próximo passo.
Para executar um passo $M$ no pior precisamos abrir um espaço em branco na fita e para isso deslocamos todo conteúdo uma posição para a direita.
Nesse caso como o tamanho máximo da fita é $O(t(n))$, precisaríamos de $O(t(n))$ passos para esse deslocamento.
Assim, o tempo total de excecução é $t(n).O(t(n)) + O(n)$.
Se $t(n) \geq n$ então $t(n).O(t(n)) + O(n) = O(t^2(n))$.
\end{proof}
O tempo de execução de uma MT não-determinística $N$ é uma função $f: \mathbb{N} \to \mathbb{N}$ em que $f(n)$ é o número máximo de passos de {\em alguma} derivação de $N$ para a entrada $\omega$ de tamanho $n$.
\begin{multicols}{2}
\centering
Determinístico
\vspace{1cm}
\begin{tikzpicture}[node distance=2cm,auto,>=latex,initial text=]
\draw [|-|] (-2,0) -- node[left]{$f(n)$} (-2,-8);
\node[circle, draw] (q0) {};
\node[circle, draw] (q1) at (0, -2) {};
\node[circle, draw] (q2) at (0, -4) {};
\node[circle, draw] (qn) at (0, -8) {};
\path[->] (q0) edge (q1);
\path[->] (q1) edge (q2);
\path[-, dashed] (q2) edge (qn);
\end{tikzpicture}
\columnbreak
\centering
Não Determinístico
\vspace{1cm}
\begin{tikzpicture}[node distance=2cm,auto,>=latex,initial text=]
\node[circle, draw] (q0) {};
\node[circle, draw] (q11) at (-2, -2) {};
\node[circle, draw] (q12) at (0, -2) {};
\node[circle, draw] (q13) at (2, -2) {};
\node[circle, draw] (q21) at (-4, -4) {};
\node[circle, draw] (q22) at (-2, -4) {};
\node[circle, draw] (q23) at (0, -4) {};
\node[circle, draw] (q24) at (2, -4) {};
\node[circle, draw] (q25) at (4, -4) {};
\node[circle, draw] (qn1) at (-4, -8) {};
\node[circle, draw] (qn2) at (-2, -8) {};
\node[circle, draw] (qn3) at (0, -8) {};
\node[circle, draw] (qn4) at (2, -8) {};
\node[circle, draw] (qn5) at (4, -8) {};
\path[->] (q0) edge (q11);
\path[->] (q0) edge (q12);
\path[->] (q0) edge (q13);
\path[->] (q11) edge (q21);
\path[->] (q11) edge (q22);
\path[->] (q12) edge (q23);
\path[->] (q13) edge (q24);
\path[->] (q13) edge (q25);
\path[-, dashed] (q21) edge (qn1);
\path[-, dashed] (q22) edge (qn2);
\path[-, dashed] (q23) edge (qn3);
\path[-, dashed] (q24) edge (qn4);
\path[-, dashed] (q25) edge (qn5);
\end{tikzpicture}
\end{multicols}
\begin{theorem}
Se $t(n) \geq n$ então toda MT não-determinística que consome tempo $t(n)$ é equivalente a uma MT simples que consome tempo $2^{O(t(n))}$.
\end{theorem}
\begin{proof}
Vimos no Teorema \ref{} como simular uma MT não-determinística $N$ usando uma MT com 3 fitas usando uma busca em largura.
Seja $b$ o número máximo de ramificações de na excecuçaõ $N$.
O número total de nós da árvore é $O(b^{t(n)})$ e a excecução de cada nó toma tempo $O(t(n))$ no pior caso.
Assim, o tempo total de excecução dessa simulação é $O(t(n).b^{t(n)}) = 2^{O(t(n))}$ se $t(n) > n$.
Por fim, essa MT de três fitas pode ser simulada por uma MT simples que consome tempo $2^{O(t^2(n))} = 2^{2O(t(n))} = 2^{O(t(n))}$.
\end{proof}
\begin{displaymath}
NTIME(t(n)) = \{A \subseteq \Sigma^* : \textrm{$\exists$ MT não-det. que decide $A$ em tempo $O(t(n))$}\}
\end{displaymath}
Vamos definir duas classes de complexidade de tempo.
A classe $P$ contém todas as linguagens decidíveis por MT simples em tempo polinomial e a classe $NP$ que contém todas as linguágens decidíveis por MTs não-determinísticas em tempo polinomial:
\begin{displaymath}
P = \bigcup_k TIME(n^k)
\end{displaymath}
\begin{displaymath}
NP = \bigcup_k NTIME(n^k)
\end{displaymath}
É evidente que toda linguagem em $P$ pertence a $NP$.
Ou seja, $P \subseteq NP$.
Não sabemos, porém, se é verdade que $NP \subseteq P$.
Em outra palavras, se existem soluções polinomiais em MTs simples para os problemas em que possuem solução em MTs não-determinísticas.
Esse é o principal problema em aberto na computação.
Uma forma alternativa de apresentar a classe de problemas NP é por meio de um {\em oráculo}.
Um {\em oráculo} (ou verificador) para uma linguagem $A$ é um algotimo $V$ tal que:
\begin{displaymath}
A = \{\omega : V \textrm{ aceita $\langle \omega, o \rangle$ para alguma string $o$}\}
\end{displaymath}
A string $o$ na descrição acima é chamada de {\em certificado}.
\begin{example}
Seja $L = \{p_1, \dots, p_n, \bar{p_1} \dots \bar{p_n}\}$ uma alfabeto.
Uma {\em cláusula} sobre $L$ é uma string $c \in L^*$ e uma {\em fórmula} é uma string $f \in (L\cup\{;\})^*$.
Uma {\em valoração} é uma função $v : L \to \{0,1\}$ tal que $v(p) = 1$ sse $v(\bar{p}) = 0$.
Uma valoração $v$ {\em satisfaz uma cláusula} $c$ se $v(l) = 1$ para {\em algum} $l$ em $c$ e $v$ {\em satisfaz uma fórmula} $f = c_1;c_2;\dots;c_m$ se ele satisfaz {\em todas} as cláusulas $c_1, \dots, c_n$.
Definimos o {\em problema da satisfatibilidade} da seguinte forma:
\begin{displaymath}
SAT = \{f \in (L \cup \{;\})^*: \textrm{existe $v$ que satisfaz $f$}\}
\end{displaymath}
Uma valoração pode ser descrita como uma string $o \in \{0,1\}^*$.
(Por exemplo, a string $101$ indica que $v(p_1) = 1$, $v(p_2) = 0$ e $v(p_3) = 1$).
É fácil construir uma MT $V$ que recebe uma fórmula $f \in (L \cup \{;\})^*$ e um string $o \in \{0,1\}^*$ e aceita se a valoração $v$ representada por $o$ satisfaz $f$ e rejeita caso contrário.
Essa verificação pode ser feita em tempo polinomial em relação a $|f|$.
Note que podemos descrever o problema SAT da seguinte forma:
\begin{displaymath}
SAT = \{f \in (L \cup \{;\})^*: \textrm{$V$ aceita $\langle f, o \rangle$ para algum $o \in \{0,1\}^*$}\}
\end{displaymath}
Dizemos, portanto, que $V$ é um {\em verificador polinomial} para SAT.
\end{example}
\begin{theorem}
Uma linguagem $A \in NP$ sse exsite um verificador polinomial para $A$.
\end{theorem}
\begin{proof}
Se $A \in NP$ então, por definição, existe uma MT não-determinística $N$ que decide $A$ em tempo polinomial.
Considere uma string $\omega$ qualquer.
Se $\omega \in A$ então $N$ aceita, senão rejeita.
De qualquer forma existe um ramo da excecução de $N$ que termina em menos de $O(n^k)$ passos.
Seja $o$ a codificação desse ramo (a string que indica a cada passo qual o caminho que foi seguido).
Simulando $N$ como uma MT com três fitas, e colocando $o$ na terceira, decidimos se $\omega$ é aceito ou não em tempo polinomial.
Agora considere o outro lado.
Seja $V$ ium verificador para $A$ que decide se a entrada é aceita em tempo $O(n^k)$.
Escolhemos não deterministicamente uma string $o$ com tamanho máximo $n^k$.
Em cada ramo e excecutamos $V$ sobre $\langle \omega, o \rangle$ para um $o$ distinto e aceitamos $\omega$ se $V$ aceitar $\langle \omega, o \rangle$ para algum $o$.
Se nenhum ramo $V$ aceitar a entrada então rejeitamos $\omega$.
\end{proof}
Temos, portanto, que um problema está na classe NP se existe um verificador polinomial para ele.
Tal verificador estabelece com auxílio de um certificado, se a entrada é aceita.
Podemos definir uma outra classe de problemas que possuem um verificador que decide em tempo polinomial se a entrada é {\em rejeitada} com auxílio e uma string chamda de {\em desqualificador}.
Esse classe é chamada coNP.
\begin{example}
Uma fórmula proposicional $f$ na Forma Normal Conjuntiva é {\em válida} ou uma {\em tautologia} se para toda valoração $v$ temos que $v(f) = 1$.
\begin{displaymath}
TAUT = \{f \in (L \cup \{;\})^*: \textrm{$V$ rejeita $\langle f, o \rangle$ para algum $o \in \{0,1\}^*$}\}
\end{displaymath}
O problema TAUT é, portanto, um problema CoNP.
\end{example}
\section{NP-completude}
\label{sec:np-completude}
Na última seção definimos as classes $P$ e $NP$ e mencionamos que a pergunta se $P \stackrel{?}{=} NP$ é um problema em aberto na computação.
O que faremos então será tentar classificar que problemas são mais ``fáceis'' ou mais ``difíceis'' do que outros.
Dizemos que uma função $f : \Sigma^* \to \Sigma^*$ é {\em computável em tempo polinomial} se existe um polinômio $p$ e uma MT que ao receber $\omega \in \Sigma^*$ para depois de $p(|\omega|)$ passos e devolve $f(\omega)$.
Uma linguagem $A$ é {\em polinomialmente redutível} a $B$ (escrevemos $A \leq_p B$) se existe $f: \Sigma^* \to \Sigma^*$ que seja computável em tempo polinomial e tal que $\omega \in A$ sse $f(\omega) \in B$.
O teorema a seguir mostra que a redutibilidade polinonimal preserva o pertencimento na classe $P$:
\begin{theorem}
Se $A \leq_P B$ e $B \in P$ então $A \in P$.
\end{theorem}
\begin{proof}
Seja $M$ uma MT que decide $B$ em tempo polinomial e seja $f$ a redução polinomial de $A$ em $B$.
Construímos uma MT $N$ da seguinte forma: $N$ recebe $\omega$ e computa $f(\omega)$ então roda $M$ sobre $f(\omega)$.
Pela definição de $f$, $M$ aceita $f(\omega)$ sse $\omega \in A$ e, portanto, $N$ aceita $\omega$.
Além disso, $N$ é polinomial pois cada passo é polinomial e polinômios são fechados por composição.
\end{proof}
\begin{example}
Considere o seguinte problema de decisão, uma restrição do problema SAT.
\begin{displaymath}
3SAT = \{f \in SAT : \textrm{cada clásula de $f$ tem tamanho exatamente 3}\}
\end{displaymath}
Vamos mostrar que $SAT \leq_P 3SAT$.
A transformação vai substituir cada cláusula $c_i = l_1 \dots l_n$ de cada fórmula $f = c_1;c_2; \dots; c_m$ pela seguinte sequência de cláusulas: $l_1l_2m_1;\overline{m_1}l_3m_2;\overline{m_2}l_4m_3; \dots ; \overline{m_{n-3}}l_{n-1}l_n$.
Essa transformação é claramente polinomial e é possível mostrar que $f \in SAT$ sse essa nova fórmula também for satisfatível.
% exemplo da transformação
\end{example}
Uma linguagem $A$ é {\em NP-completa} se:
\begin{itemize}
\item $A \in NP$ e
\item para todo $B \in NP$ temos que $B \leq_P A$
\end{itemize}
Os seguintes são corolários da definição de NP-completude:
\begin{corollary}
Seja $A$ uma linguagem NP-completa, se $A \in P$ então $P = NP$.
\end{corollary}
\begin{corollary}
Se $A$ é NP-completa e $A \leq_P B$ então $B$ também é NP-completa.
\end{corollary}
Ou seja, intuitivamente as linguagens NP-completas são as mais difíceis dentro da classe NP.
Além disso, se conhecemos uma linguagem NP-completa, então podemos inferir que outras linguagens também o são por redução polinomail.
Resta mostrar que pelo menos uma linguagem é NP-completa.
\begin{theorem}[Cook-Levin]
A linguagem SAT é NP-completa.
\end{theorem}
\begin{proof}
% Explicar isso melhor
Mostramos na última seção que $SAT \in NP$.
Temos que mostrar que $B \leq_P SAT$ para todo $B \in NP$.
Partimos da constatação de que se $B \in NP$, então existe uma MT não-determinística $N$ que decide $B$ em tempo polinomial $n^k$.
Um {\em tableau} para $N$ sobre a entrada $\omega$ é uma tabela $n^k \times n^k$ cujas linhas são configurações de um ramo de $N$ com entrada $\omega$.
Assim, a primeira linha contém a configuração inicial e deve haver um tableau que contém uma configuração de aceitação para cada $\omega \in B$.
% diagrama
Vamos representar o tableuau como um fórmula $f$ que é satisfatível sse existe um tableau que aceita $\omega$.
Seja $C = Q \cup \Gamma \cup \{\#\}$, temos uma variável $x_{i,j,s}$ para cada $i,j \in \{1, \dots, n^k\}$ e cada $s \in C$.
A ideia é que uma valoração $v$ satisfaz $x_{i,j,s}$ se a célula $\langle i, j \rangle$ no tableau contém o símbolo $s$.
Projetaremos a fórmula $f$ de modo que uma valoração que satisfaz $f$ corresponde a um tableau que reconhece $\omega$.
\begin{displaymath}
f_c = x_{1,1,s_1}x_{1,1,s_2} \dots x_{1,1,s_n}; \overline{x_{1,1,s_1}x_{1,1,s_2}}; \overline{x_{1,1,s_1}x_{1,1,s_3}} \dots; x_{1,2,s_1}x_{1,2,s_2} \dots
\end{displaymath}
A fórmula $f_c \in SAT$ sse cada célula contém exatamente um símbolo.
Escrevemos a fórmula $f_i$ de forma que $f_i \in SAT$ sse a primeira linha do tableau contém a configuração inicial de $N$.
\begin{displaymath}
f_a = x_{1,1,q_a}x_{1,2,q_a} \dots x_{n^k,n^k, q_a}
\end{displaymath}
A fórmula $f_a \in SAT$ sse alguma linha é uma configuração de aceitação.
Uma {\em janela} $2 \times 3$ no tableua é {\em legal} se não viola as ações especificadas pela função de transição de $N$ (Exemplo \ref{ex:janela}).
Escrevemos $f_m$ como a conjunção de todas as janelas legais.
Ou seja, $f_m$ é tal que $f_m \in SAT$ sse a configuração da linha $i$ segue da configurção da linha $i-1$ em $N$.
Assim, a fórmula $f = f_c;f_i;f_a;f_m \in SAT$ sse $\omega \in B$ para algum $B \in NP$.
\end{proof}
\begin{example}
\label{ex:janela}
Considere que $\Delta(q_1, b) = \{\langle q_2, c, E\rangle, \langle q_2, a, D \rangle\}$, as seguintes janelas são legais:
\begin{displaymath}
\begin{array}{|c|c|c|}
\hline
a & q_1 & b \\
\hline
a & a & q_2 \\
\hline
\end{array}
\end{displaymath}
\begin{displaymath}
\begin{array}{|c|c|c|}
\hline
a & q_1 & b \\
\hline
q_2 & a & c \\
\hline
\end{array}
\end{displaymath}
\end{example}
\begin{corollary}
3SAT é NP-completa
\end{corollary}
\section{Problemas NP-completos}
\label{sec:problemas}
Na seção anterior vimos que há uma conjunto de problemas chamados NP-completos.
Qualquer problema NP pode ser reduzido a um problema NP-completo.
Assim, esses são os mais difíceis entre os problemas em NP.
Vimos também que para provar que um problema é NP-completo podemos usar a técnica da redução polinomial.
Se mostrarmos que é possível reduzir um problema NP-completo $A$ a nosso problema $B$, então $B$ e deve ser pelo menos tão difícil quanto $A$.
Portanto, $B$ deve também ser um problema NP-completo.
Mostrar que um problema é NP-completo não é uma prova de que ele não pode ser resolvido em tempo polinomial, mas indica que a dificuldade em encontrar uma solução polinomial não é uma incapacidade do programador, mas uma questão em aberto na ciência.
Os problemas NP-completos ocorrem em diversas áreas distintas da computação.
Nesta seção apresentaremos sem as provas de redução uma lista de problemas NP-completos.
\begin{example}
O primeiro problema que trataremos é as vezes chamado de {\em problema do caixeiro viajante}.
Um caixeiro viagente, ou um mascate, é um vendedor que viaja de cidade em cidade levando suas mercadorias.
Imagino um caixeiro que precisa passar por um conjunto de cidades ligadas por uma malha de estradas.
Ele precisa passar por todas as cidades, mas quer evitar de passar duas vezes por uma mesma cidade, visto que isso seria ineficiente.
O problema do mascate é saber se existe uma forma de passar pelas cidades todas sem repetir.
O problema do caixeiro viajante poder ser modelado como um problema de grafos.
Um {\em grafo} é uma estrutura formada por um conjunto $V$ cujos elementos são chamados de {\em vértices} e um conjunto de pares de elementos $E \subseteq \{\{v,w\} : v, w \in V\}$ chamado de {\em arestas}.
Se $\{v,w\} \in E$ então dizemos que os vértices $v$ e $w$ são {\em adjacentes}.
Um {\em caminho} em um grafo é uma sequencia de nós distintos $v_1, v_2, \dots, v_n \in V$ tal que para todo $i \in {1, \dots n-1}$ temos que $v_i$ e $v_{i+1}$ são adjacentes.
Um {\em ciclo} em um grafo é um caminho $v_1, v_2, \dots, v_n$ tal que $v_n$ é adjacente a $v_1$ .
Um {\em ciclo hamiltoniano} é um ciclo em um grafo que contém todos os vértices em $V$.
Podemos representar então as cidades como nós em um grafo $G = \langle V, E \rangle$ e as estradas como arestas.
O problema do caixeiro viajante se resume então ao de decidir se existe um ciclo hamiltonia em $G$.
Note que se conhecemos um ciclo hamiltoniano, podemos conferi-lo em tempo polinimial.
Esse ciclo é um certificado e, portanto, esse problema está em NP.
Além disso, é possível, embora não iremos fazê-lo, reduzir o problema 3-SAT ao problema dos ciclos hamiltonianos.
Portanto, esse problema é NP-completo.
\end{example}
\begin{example}
Imagine agora que você está organizando uma festa.
Cada convidado conhece outros convidados, mas não necessariamente todos.
Alguns amigos você conheceu em um mesmo contexto, eles fazem parte de uma mesma comunidade.
Nesse grupo todos conhecem todos.
Você se pergunta então qual será que a maior comunidade entre nesse conjunto de convidados.
Mais uma vez podemos modelar esse como um problema de grafos.
Os convidados são os vértices do seu grafo e uma aresta ocorre se eles se conhecem.
Uma conjunto de nós em que todos são adjacentes a todos os demais é chamado e um {\em clique}.
Dado um grafo, o {\em problema do clique} consiste em decidir se existe um clique no grafo com um certo tamanho $K$.
Se conhecemos um conjunto que resolve o problema, podemos verificá-lo em tepo polinomial.
Portanto, temos um cetificado e o problema está em NP.
É possível mostrar também que o problema do clique é NP-completo.
\end{example}
\begin{example}
Imagina que você possui um mapa e um estojo com $k$ lápis de cores diferentes.
Sua tarefa é colorir o mapa de forma que nunca dois países sejam coloridos com a mesma cor.
Novamente esse problema pode ser modelado como um problema de grafos.
Neste caso, cada país representa um nó e países que fazem fronteira são ligados por uma aresta.
O {\em problema da coloração} em um grafo é exatamente o de pintar os vértices com $k$ cores distintas de forma que vértices adjacentes não sejam pintados da mesma cor.
Uma instância desse problema ocorre quando $k = 3$, ou seja, quando temos 3 cores.
Novamente, se nos é dada uma mapeamento de cores -- que nó está pintado de que cor -- podemos verificá-lo em tempo polinomial.
Portanto, temos um certificado polinomial e o problema está em NP.
Além disso, é também mostrar que, no caso em que $k = 3$ esse problema é NP-completo.
\end{example}
\begin{example}
Suponha que você possui um conjunto de pedaços de rodapé de diferentes tamanhos e uma parede com um tamano determinado na qual você gostaria de aplicá-lo.
Qualquer pedaço desses rodapés pode ser aplicado em qualquer ordem, mas você gostaria de que ao final o comprimento total coincida exatamente com o comprimento da parede.
Podemos modelar esse problema da seguinte forma.
Temos um conjunto de número inteiros $c_1, \dots, c_n$ que representam os comprimentos dos rodapés e o comprimento da parede $l$.
Desejamos selecionar selecionar um subonjunto $S \subseteq \{1, \dots n\}$ tal que $\sum_{i \in S} c_i = l$.
Se temos o subconjunto $S$ basta somar os elementos para verificar se a solução é válida.
Isso certamente pode ser feito em tempo polinomial e, poranto, o {\em problema da soma dos subconjuntos} está em NP.
É mais dificil, mas é possível mostrar que esse problema é em NP-completo.
\end{example}
\begin{example}
Suponha que você está em uma sala cheia de itens preciosos e uma mochila.
Você sabe o valor dos itens e sabe o peso de cada um.
Sua mochila tem um limite de capacidade de peso que você também conhece.
Seu objetivo é determinar se é possível guardar na mochila uma quantidade de itens que ultrapasse um certo valor $K$, mas não estoure a capacidade $W$ da mochila.
Podemos modelar esse problema da seguinte forma.
Para cada item $i$ temos seu peso que é dado por um inteiro $w_i$ e seu valor dado por outro inteiro $v_i$.
Existe um subconjunto $S \subseteq \{1, dots, n\}$ tal que $\sum_{i \in S} w_i \leq W$ e $\sum_{i \in S} v_i \geq K$?
Mais uma vez, se nos for dado o $S$ podemos verificar se ele satisfaz as condições em tempo polinomial.
Portanto, o {\em problema da mochila} está em NP.
Além disso, é possível mostrar que este também é um problema NP-completo.
\end{example}
\subsection*{Transição de fase}
Até aqui vimos resultados teóricos sobre NP-completude.
Para completar nosso estudo mostraremos aqui uma constatação empírica.
O problema SAT, além de ter sido o primeiro problema demostradamente NP-completo, é um dos problemas mais estudados na classe NP.
Importantes competições para avaliara os melhores algoritmos e implementações de para esse problema são organizadas anualmente desde 2002.
Esses programas se tornaram tão eficientes que muitas vezes compensa traduzir um problema NP qualquer para SAT e então resolvê-lo usando um desses programas.
Aqueles que estudam o programa SAT notaram em meados dos anos 90 que as boas implementações de algoritmos para resolver o problema tem uma característica em comum.
Esses algoritmos são eficientes para decidir a satisfatibilidade de fórmulas que possuem poucas cláusulas e muitas variáveis.
Nesse caso a imensa maior parte das instâncias é satisfatível e isso é fácil de auferir computacionalmente.
Esses algoritmos são bastante bons também para decidir a satisfatibilidade de fórmulas que possuem muitas cláusulas e poucas variáveis.
Nesses caso a situação é inversa.
A maior parte das fórmulas é insatisfatível e embora auferir isso seja um pouco mais difícil, o tempo de processamento é ainda bastante baixo.
Os problemas que são realmente difíceis de processar são aqueles em que há uma proporção equilibrada de fórmulas satisfatíveis e insatisfatíveis.
A Figura \ref{fig:phase-transition} plotamos de processamento do problema 3-SAT.
O eixo $y$ desse gráfico representa o tempo médio de processamento de instâncias aleatórias desse problema.
O eixo $x$ representa a razão $\frac{L}{N}$ em que $L$ é o número de cláusulas das instâncias e $N$ o número de variáveis proposicionais.
O gráfico apresenta um pico quando essa fração é $4,3$ o que coincide com o ponto em que o número de instâncias satisfatíveis é igual ao número de instâncias insatisfatíveis.
Esse fenômeno é chamado {\em transição de fase} em analogia a fenômenos físicos com a temperatura da água que passa por um situação singular na transição entre os estados.
\begin{figure}
\label{fig:phase-transition}
\includegraphics[width=\textwidth]{phase-transition.png}
\caption{Transição de fase. A difículdade do problema 3-SAT ocorre no ponto em que há a mesma quatidade de instâncias satisfatíveis e insatisfatíveis.}
\end{figure}
\section{Relação entre as classes de complexidade de tempo}
\label{sec:hierarquia}
A discussão da seção anterior indica o pouco que conhecemos sobre a dificuldade de um problema.
A classe dos problemas NP-completos é a classe dos mais difíceis dentre os problemas NP.
Porém, não sabemos qual é relação entre a classe $P$ e a classe $NP$.
Acreditamos que essas classes sejam distintas, mas isso nunca foi provado.
A esta altura talvez seja interessante dar um passo atrás e nos perguntar uma coisa mais básica.
Conseguimos garantir que dado mais tempo somos capazes de resolver mais problemas?
A intuição que construímos no curso de Introdução à Analise de Algoritmo é de que sim.
Existem problemas para os quais existem solução quadrática, mas não existe solução linear.
O {\em Teorema da Hierarquia} foi possivelmente o primeiro resultado importante da teoria da complexidade.
\begin{theorem}{Hierarquia}
Para qualquer função $t: \mathbb{N} \to \mathbb{N}$ onde $t(n) > n$
\begin{displaymath}
TIME(t(n)) \subset TIME(O(t^3(n))
\end{displaymath}
\end{theorem}
\begin{proof}
A afirmação $TIME(t(n)) \subset TIME(t(n) log^2(t(n)))$ é trivial.
O que precisamos mostrar é que existe uma lingaguem que está em $TIME(t(n) log^2(t(n)))$, mas não está em $TIME(t(n))$.
Vamos seguir um argumento de diagonalização similar ao da prova da indecidibilidade do problema da parada.
Primeiro considere a seguinte linguagem:
\begin{displaymath}
H_t = \{ \langle M, \omega \rangle : \textrm{ M aceita $\omega$ em no máximo $t(|\omega|)$ passos }\}
\end{displaymath}
Para mostrar que lingaugem $H_t \in O(t^3(n))$ precisaríamos mostrar que é possível construir uma Máquina Universal de Turinal que simula $M$ em $O(t^3(n))$ passos.
Essa é uma demonstração construtiva não muito interessante.
Antes de passar para a próxima parte da demonstração, apenas comentaremos que é simples construir uma simulação de $M$ usando um MT com 3-fitas: uma que guarda a entrada $\omega$, uma que produz a saída e outra que processa a simulação é relativamente fácil de construir.
Como vimos na Seção \ref{} é possível então transformar essa MT com 3-fitas em uma MT simples.
Esse caminho resvole o problema em tempo proporcional a $O(t^3(n))$ que é suficiente para o que pretendemos mostrar a seguir.
Cabe aqui comentar que é possível construir uma MT universal bem mais eficiente -- $O(t(n) log^2(t(n)))$ --, mas isso não é necessário para os resultados dessa seção.
A parte interessante da demostração é provar que $H_t \notin TIME(t(\lfloor \frac{n}{2}\rfloor))$.
Suponha por absurdo o contrário.
Neste caso, seria possível construir a seguinte MT:
\begin{displaymath}
D_t(\langle M \rangle) = \left\{\begin{array}{cl}
\textrm{aceita} & \textrm{se $M_{H_t}$ não aceita $\langle M, M \rangle$}\\
\textrm{rejeita} & \textrm{se $M_{H_t}$ aceita $\langle M, M \rangle$}\\
\end{array}\right.
\end{displaymath}
Note que $D_t$ processa $\langle M, M \rangle$ no mesmo tempo $t(\lfloor \frac{2n+1}{2}\rfloor) = t(n)$ que $M_{H_t}$.
Podemos então repetir o mesmo argumento do problema da parada:
O que ocorre se passarmos a descrição $\langle D_t \rangle$ como entrada para $D_t$?
Se a entrada é aceita então $M_{H_t}$ não aceita $\langle D_t, D_t \rangle$, mas pela definião de $H_t$ isso significa que $D_t$ não aceita $\langle D_t \rangle$ o que é uma contradição.
Se a entrada não é aceita então $M_{H_t}$ aceita $\langle D_t, D_t \rangle$ e também chegamos em uma contradição.
Concluímos que $H_t \notin TIME(t(\lfloor \frac{n}{2}\rfloor))$.
Juntando as duas partes existe um problema que não está em $TIME(t(n))$, mas está em $TIME(t(2n + 1)^3)$.
\end{proof}
Vamos introduzir agora mais uma classe de complexidade.
A classe $EXPTIME$ contém todos os problemas que podem ser decididos por uma Máquina de Turing determinísitica em tempo exponencial em relacão ao tamanho da entrada.
O teorema da hierarquia nos mostra que essa classe está propriamente contida na classe $P$
\begin{corollary}
\begin{displaymath}
P \subset EXPTIME
\end{displaymath}
\end{corollary}
\begin{proof}
Partimos do fato conhecido que $P \subseteq TIME(2^n)$, ou seja, qualquer polinômio eventualemente se torna menor do que $2^n$.
Mas pelo Teorema da Hierarquia temos que $TIME(2^n) \subset TIME(2^{O(n^3)}) \subseteq EXPTIME$.
Portanto, $P \subset EXPTIME$.
\end{proof}
Vamos resumir o que sabemos até agora sobre as classes de complexidade.
Apresentamos quatro classes:
\begin{enumerate}
\item $P$: a classe dos problemas decidíveis em tempo polinomial por uma MT determinística.
\item $NP$: a classe dos problemas que possuem certificado polinomial.
\item $coNP$: a classe dos problemas que possuem desqualificador polinomial.
\item $EXPTIME$: a classe dos problemas decidívei e tempo exponencial por um MT determinística.
\end{enumerate}
Sabemos que $P \subseteq NP$ e que $P \subseteq coNP$.
Além disso, quando introduzimos as MT não determinísticas, vimos que é possível simular qualquer uma delas em uma MT determinística.
Essa simulação toma tempo exponencial e, portanto, $NP \subseteq EXPTIME$.
Não é difícil perceber que da mesma forma temos que $coNP \subseteq EXPTIME$.
Por fim, acabamos de demonstrar que $P \neq EXPTIME$.
Sabemos, portanto que existem problemas que podemos resolver em tempo exponencial, mas que não são resolvíveis em tempo polinomial.
Não sabemos, de fato esse é o maior problemas em aberto na computação (!), se $P \neq NP$.
Na verdade não sabemos praticamente mais nada sobre as relações entre essas classes do que foi aqui exposto.
\section{Complexidade de Espaço}
\label{sec:espaco}
Até aqui nos ocupamos em estudar problemas que podem ser resolvidos com Máquinas de Turing que possuem uma limitação no tempo de processamento.
Para completar nosso estudo sobre complexidade computacional, investigaremos classes de complexidade de problemas que podem ser resolvidos por MTs com espaço limitado.
No modelo das MTs, o espaço é avaliado pelo número de células da fita que foram preenchidos.
Como no caso da complexidade de tempo, mediremos a complexidade de espaço de uma MT como uma função $f: \mathbb{N} \to \mathbb{N}$ em que $n$ é o tamanho da entrada e $f(n)$ o número máximo de células preenchidas.
\begin{displaymath}
SPACE(f(n)) = \{ L : \exists MT \textrm{ det. que decide $L$ usando espaço $O(f(n))$} \}
\end{displaymath}
No caso de uma MT não-determinística, a complexidade de espaço é medida no pior caso.
Ou seja, $f(n)$ é o maior número de células preenchidas sobre qualquer um dos ramos.
\begin{displaymath}
NSPACE(f(n)) = \{ L : \exists MT \textrm{ não-det. que decide $L$ usando espaço $O(f(n))$} \}
\end{displaymath}
Nos interessa particularmente a classe $PSPACE$ é a classe de todas as linguagens decidíveis usando espaço polinomial.
\begin{displaymath}
PSPACE = \bigcup_k SPACE(n^k)
\end{displaymath}
Analogamente a classe $NPSPACE$ é a classe das linguagems decidíveis usando espaço polinomial em MTs não determinísticas.
O teorema a seguir nos ajuda a entender a relação entre essas duas classes:
\begin{theorem}[Savitch]
Para qualquer função $f: \mathbb{N} \to \mathbb{N}$ onde $f(n) > n$:
\begin{displaymath}
NPSPACE(f(n)) = SPACE(f^2(n))
\end{displaymath}
\end{theorem}
\begin{proof}
Para verificar se uma MT não-determinística $N$ aceita uma entrada $\omega$, vamos simulá-la usando uma MT determinística $M$, como fizemos na Capítulo \ref{}.
Desta vez, porém, precisamos cuidar de medir o espaço que estamos ocupando com essa simulação.
A primeira conta que precisamos fazer é calcular o número de possíveis de configurações de uma MT.
Definimos uma configuração como uma string da forma $\omega_1 q \omega_2$ em que $q$ é o estado atual e $\omega_1$ e $\omega_2$ são strings que representam o que está na fita antes e depois da cabeça de leitura.
O tamanho da string $\omega_1 \cdot \omega_2$ é no máximo $f(n)$ por definição.
O número de configurações possíveis é, portanto, no máximo $|Q|.|\Sigma|^{f(n)}$.
Os valores $|Q|$ e $|\Sigma|$ são constantes que dependem apenas da MT.
Portanto o número de configurações possíveis é $c^{f(n)}$ para uma constante $c$.
Podemos então imaginar um grafo em que os nós são as configurações e existe uma aresta entre duas configurações $C_i$ e $C_j$ se $C_i \Rightarrow C_j$.
O que precisamos testar é se existe um caminho da configuração inicial $C_0$ para alguma das possíveis configurações de aceitação.
Poderíamos resolver isso por meio de uma busca em profundidade.
Se recordarem da busca em profundidade em um grafo, ela usa uma chamada recursiva ou, equivalentemente, uma pilha.
Essa pilha deve armazenar os nós que foram visitados.
No pior caso, todos os nós são visitados até chegar em uma configuração de aceitação, portanto, seria necessário armazenar $c^{f(n)}$ nós.
A solução de Savitch, embora muito ineficiente do ponto de vista do tempo de execução, resolve o problema com um gasto muito modesto de espaço.
\begin{codebox}
\Procname{$\proc{PATH}(x, y, i)$}
\li \Comment Recebe dois nós $x$ e $y$ e um inteiro $i$
\li \Comment Verifica se existe caminho de $x$ até $y$ em $G$ de tamanho máximo $2^i$
\li \If $i = 0$
\li \Then \Return $x$ é adjacente a $y$?
\End
\li \For todos nós $z$
\li \Then \Return $\proc{PATH}(x, z, i-1)$ e $\proc{PATH}(z, y, i-1)$
\End
\li \Return falso
\end{codebox}
Esse algoritmo é recursivo e, portanto, precisa manter uma pilha de recursão.
O tamanho máximo dessa pilha é $i$.
Começamos da representação da configuração inicial $C_0$.
Para cada uma das possíveis configurações finais usamos o algoritmo acima para verificar se há um caminho até ela.
Como vimos, o tamanho máximo desse caminho é $c^{f(n)}$.
No pior caso, portanto, $2^i = c^{f(n)}$ o que daria $i = lg(c^{f(n)}) = O(f(n))$.
Portanto temos que armazenar no máximo $O(f(n))$ configurações cada qual com tamanho máximo $O(f(n))$.
Concluímos que nossa simulação ocupa espaço $O(f^2(n))$.
\end{proof}
\begin{corollary}
\begin{displaymath}
PSPACE = NPSPACE
\end{displaymath}
\end{corollary}
\begin{proof}
Segue do teorema anterior e o fato de que o quadrado de qualquer polinômio é um polinômio.
\end{proof}
Algumas relações a classe $PSPACE$ e as classes de complexidade de tempos são simples.
Primeiro note que em tempo polínomial o máximo que somos capazes de preencher é uma quantidade polinomial de células.
Portanto temos que $P \subseteq PSPACE$ e $NP \subseteq NPSPACE$, mas acabamos de ver que $PSPACE = NPSPACE$.
Concluímos então que $NP \subseteq PSPACE$.
Além disso, como vimos na prova do Teorema \ref{}, uma máquina que usa espaço limitado por uma função $f(n)$ pode ter no máximo $c^{f(n)}$ estados diferentes.
Como $c$ elevado a qualquer polinômio é uma função exponencial, temos que $PSPACE \subseteq EXPTIME$.
O diagrama abaixo resume todas as relações entre classes de complexidade que vimos:
\begin{tikzpicture}[node distance=3cm, every node/.style={sloped},]
\node (P) {$P$};
\node (NP) at (3, -1) {$NP$};
\node (coNP) at (3, 1) {$coNP$};
\node (PSPACE) at (6, 0) {$PSPACE$};
\node (EXPTIME) at (10, 0) {$EXPTIME$};
\path (P) -- (NP) node[midway] {$\subseteq$};
\path (P) -- (coNP) node[midway] {$\subseteq$};
\path (NP) -- (PSPACE) node[midway] {$\subseteq$};
\path (coNP) -- (PSPACE) node[midway] {$\subseteq$};
\path (PSPACE) -- (EXPTIME) node[midway] {$\subseteq$};
\end{tikzpicture}