Grupo de Estudos em Haskell da UFABC > Estruturas de Dados Puramente Funcionais > Persistência

Persistência

Playlists

1 Estruturas de dados persistentes

Uma propriedade que se torna evidente em estruturas de dados (EDs) funcionais é que elas são sempre persistentes

Atualizações em uma ED não destroem a versão antiga.
Elementos afetados são copiados.
Elementos não afetados são compartilhados (en: shared) entre as diversas versões da ED.

1.1 Um primeiro exemplo: Listas

Listas são onipresentes em linguages funcionais e são expressas naturalmente em cálculo-\(\lambda\). As operações que elas dão suporte são normalmente as mesmas daquelas oferecidas por pilhas (en: stacks)

nova :: Pilha a Cria uma nova pilha vazia
vazia :: Pilha a -> Bool Verdadeiro se pilha vazia
empilha :: a -> Pilha a -> Pilha a Empilha um valor
topo :: Pilha a -> a Recupera o valor no topo da pilha
desempilha :: Pilha a -> Pilha a Desempilha um valor

-- Implementação na unha!
data Pilha a = Vazia | Cons a (Pilha a)
nova :: Pilha a
nova = Vazia
vazia :: Pilha a -> Bool
vazia Vazia = True
vazia _     = False

empilha :: a -> Pilha a -> Pilha a
empilha  = Cons

topo :: Pilha a -> a
topo Vazia = error "Pilha vazia"
topo (Cons v _) = v

desempilha :: Pilha a -> Pilha a
desempilha Vazia = error "Pilha vazia"
desempilha (Cons _ p) = p

Ou, se utilizarmos as listas presentes por padrão em Haskell, teríamos:

type Pilha' a = [a]

nova' :: Pilha' a
nova' = []

vazia' :: Pilha' a -> Bool
vazia' = null

empilha' :: a -> Pilha' a -> Pilha' a
empilha' = (:)

topo' :: Pilha' a -> a
topo' = head

desempilha' :: Pilha' a -> Pilha' a
desempilha' = tail

A partir de agora, seja uma lista ou uma pilha, utilizaremos a nomenclatura tradicional de listas.

Pilhas, de fato, são uma instância do caso mais geral de sequências. Outras instâncias que veremos durante o curso incluem: filas, filas de duas extremidades e listas catenárias.

Momento cultural

Concatenar tem a mesma raiz etimológica de catenária e ambas vêm do latim catena: cadeia, corrente… Em inglês há inclusive o verbo catenate equivalente ao nosso concatenar.

1.2 Catenárias…

Falando em catenária, outra operação comum em listas é a concatenação, normalmente representada pelo operador (++).
A concatenação de listas pode ser implementada facilmente em linguagens imperativas em tempo constante (\(O(1)\)).

Porém, essa implementação imperativa é destrutiva em seus parâmetros. Após a execução de (++), nem xs nem ys podem ser usadas novamente.
- Não possui persistência.
Em uma linguagem funcional não há a possibilidade de fazer operações destrutivas, então a saída é fazer uma implementação que copia células, mantendo os valores e trocando o valor do apontador para a próxima célula.

A implementação da operação (++) fica:

(++) :: [a] -> [a] -> [a]
(++) [] ys = ys
(++) (x:xs) ys = x : (xs ++ ys)

A figura abaixo representa essa operação

Ganhamos persistência, mas agora o custo passou a ser \(O(n)\) onde \(n\), é o comprimento de xs.
- Veremos mais adiante como reduzir esse custo para \(O(1)\).
Um caso parecido ocorre quando queremos fazer a atualização de um elemento com índice \(i\) da lista. Neste caso, precisamos copiar as células da lista ligada até o elemento desejado.

O código fica:

update :: [a] -> Int -> a -> [a]
update [] _ _ = error "Tentando atualizar lista vazia"
update (_:xs) 0 v = v:xs
update (x:xs) i v = x : update xs (i - 1) v

Graficamente ys = update xs 2 7:

Apenas para reforçar: copiamos apenas o caminho até o elemento desejado.

Essa implementação se baseia fortemente no coletor de lixo (en: garbage collector). Implementar algo dessa maneira com controle de memória manual ficaria rapidamente complicadíssimo por conta dos compartilhamentos.

1.3 Exercício 1

Escreva uma função sufixos :: [a] -> [[a]] que recebe uma lista xs e devolve uma lista com todos os sufixos da lista xs em ordem decrescente de comprimento. Por exemplo:
```
sufixos [1, 2, 3, 4] =
    [[1,2,3,4],[2,3,4],[3,4],[4],[]]
```
Mostre que o resultado pode ser gerado em tempo \(O(n)\) e representado em espaço \(O(n)\).

1.4 Percorrendo listas

Percorrer listas do início em direção ao fim é fácil e eficiente.
Percorrer listas no sentido contrário é um pouco mais complicado.
Uma lista em um contexto funcional é muito parecida com uma lista ligada com encadeamento simples utilizada corriqueiramente em linguagens imperativas.

1.5 Listas duplamente encadeadas - Tentativa de implementação

Como fazer uma lista duplamente encadeada caso queiramos percorrê-la em ambas as direções?

--                             esquerda  valor direita
data Lista2 a = Vazia2 | Cons2 (Lista2 a) a (Lista2 a)

null2 :: Lista2 a -> Bool
null2 Vazia2 = True
null2 _     = False

head2 :: Lista2 a -> a
head2 Vazia2 = error "Lista vazia"
head2 (Cons2 _ x _) = x

tail2 :: Lista2 a -> Lista2 a
tail2 Vazia2 = Vazia2
tail2 (Cons2 _ _ d) = d

Parece bom! Mas e agora, como implementar a função cons2?

cons2 :: a -> Lista2 a -> Lista2 a
cons2 = undefined -- ??

O problema é que, agora, o nó seguinte da nossa lista aponta para o anterior. Modificar o nó inicial da lista causa uma alteração em cascata até o final da lista!

Toda a lista precisa ser copiada! Não há compartilhamento!
Colocar algo no fim da lista ou concatenar têm o mesmo problema.
Temos o que queríamos, mas a que custo?

1.6 Zippers

Aqui veremos o uso aplicado de Zippers, mas existem maneiras formais de se definir um zipper para uma estrutura de dados qualquer. Na verdade um zipper é definido como a derivada da ADT[^fn:1]. Mais informações também podem ser vistas na aula sobre ADTs.

Zipper é um idiom (do inglês: expressão idiomática) de linguagens funcionais muito utilizado para manipular estruturas de dados persistentes.
Zippers podem ser usados não apenas para percorrer estruturas de dados como também para auxiliar em sua modificação.

Mas afinal, o que é um zipper?

Zippers funcionam de uma maneira parecida com aquela pela qual uma formiga explora o mundo.

A localização atual da formiga é o foco do zipper.
A formiga pode se deslocar para explorar o mundo seguindo os caminhos disponíveis.
Para poder se orientar, ela deixa por cada local por onde passou uma trilha de feromônio que pode ser utilizada para retornar pelo mesmo caminho por onde ela veio.

Esta última característica permite que implementemos, por exemplo, backtracking em linguagens funcionais de maneira eficiente.
No caso específico de uma lista, a formiga/zipper, que mora em uma lista, explora um mundo unidimensional: ela só pode avançar ou retroceder.

Como implementar tal abstração?

Simples! 2 listas!

Uma contém o que ainda não foi percorrido da lista. Tudo à direita do foco.
A outra contém uma trilha de migalhas, a trilha de feromônio da nossa formiga, para que ela possa voltar por onde veio. Tudo à esquerda do foco.

type ListZipper a =  ([a], [a])

toListZipper :: [a] -> ListZipper a
toListZipper xs = ([], xs)

fromListZipper :: ListZipper a -> [a]
fromListZipper (es, ds) = reverse es ++ ds

lzFoco :: ListZipper a -> Maybe a
lzFoco (_, []) = Nothing
lzFoco (_, x:_) = Just x

lzDir :: ListZipper a -> Maybe (ListZipper a)
lzDir (_, []) = Nothing
lzDir (es, d:ds) = Just (d:es, ds)

lzEsq :: ListZipper a -> Maybe (ListZipper a)
lzEsq ([], _) = Nothing
lzEsq (e:es, ds) = Just (es, e:ds)

Tudo muito bem e muito bonito, mas além de percorrer a lista como uso isso para modificá-la?

Imagine que temos uma lista de inteiros e queremos trocar todos os números \(5\) por \(42\).
- Vamos definir, primeiramente, uma função para trocar o valor do elemento em foco.

lzTrocaFoco :: a -> ListZipper a -> Maybe (ListZipper a)
lzTrocaFoco _ (_, []) = Nothing
lzTrocaFoco y (es, _:ds) = Just (es, y:ds)

Agora podemos definir a função que troca os cincos:

trocaCincos :: [Int] -> [Int]
trocaCincos [] = []
trocaCincos xs =
  fromListZipper $ trocaZip $ toListZipper xs
  where
    trocaZip z@(_, []) = z
    trocaZip z@(_, d:_) =
      let nz = if d == 5
          then fromJust $ lzTrocaFoco 42 z
          else z in
      maybe nz trocaZip (lzDir nz)

-- Mas pra que tudo isso?
trocaCincos' :: [Int] -> [Int]
trocaCincos' xs = [if x == 5 then 42 else x | x <- xs]

1.7 Mas pra quê tudo isso?

Listas são estruturas de dados relativamente simples. Por isso a manipulação de um elemento é fácil…

… e existem mecanismos como compreensão de listas que nos ajudam a fazer o que queremos.

Pense agora em estruturas um pouco mais elaboradas, como árvores ou grafos.

O fato de estarmos lidando com uma linguagem funcional (e EDs persistentes) impede que simplesmente alteremos um valor de um nó na árvore através de um ponteiro!
Precisamos substituir o nó que queremos modificar por um novo e “consertar” todo o caminho por onde passamos para que ele inclua as novas versões dos dados.

O caminho por onde passamos é justamente o caminho armazenado no Zipper!!

1.8 Exercício 2

Estude a função trocaCincos e as funções que ela utiliza. Em seguida reimplemente a função fromListZipper :: ListZipper a -> [a]. Você não pode utilizar as funções (++) ou reverse (nem reimplementá-las!).

trocaCincos :: [Int] -> [Int]
trocaCincos [] = []
trocaCincos xs =
  fromListZipper $ trocaZip $ toListZipper xs
  where
    trocaZip z@(_, []) = z
    trocaZip z@(_, d:_) =
      let nz = if d == 5
          then fromJust $ lzTrocaFoco 42 z
          else z in
      maybe nz trocaZip (lzDir nz)

2 Experimente no Repl.it

Experimente o código dessa seção no Repl.it abaixo:

Código no Repl.it

3 Referências

3.1 Livros

[CO]
Purely Functional Data Structures
- Por Chris Okasaki

[CLRS]
Introduction to Algorithms
- Por Thomas H. Cormen & Charles E. Leiserson & Ronald L. Rives/t & /Clifford Stein

[SW]
Algorithms
- Por Robert Sedgewick & Kevin Wayne

3.2 Outras Referências

Huet, Gérard. “The zipper.” Journal of functional programming 7.5 (1997): 549-554.

4 Disclaimer

Estes slides foram preparados para os cursos de Paradigmas de Programação e Desenvolvimento Orientado a Tipos na UFABC.

Este material pode ser usado livremente desde que sejam mantidos, além deste aviso, os créditos aos autores e instituições.