Projeto de análise de arquivos de texto utilizando estruturas de dados
Dada uma base de textos, é requerida a análise semântica e sintática dos mesmos, junto a tarefas de compressão e busca. Esse projeto foi criado para avaliação em um curso de Estruturas de Dados e Algoritmos, ofertado pela Faculdade de Computação, Universidade Federal do Pará, no período 2021-1.
Seis tarefas a serem executadas neste projeto:
-
Verificar palavras comuns a todos os textos
-
Encontrar palavras que agrupam os textos em "clusters"
-
Testar outros textos nas palavras que classificam para verificar a qual dos grupos encontrados esse novo texto deve pertencer
-
Comprimir textos em um único arquivo
-
Realizar buscas no arquivo comprimido
-
Plotar gráfico comparativo de tempo para busca no arquivo comprimido e não-comprimido
Durante o curso em questão, foram apresentadas as seguintes estruturas de dados e algoritmos:
- Árvores Balanceadas
- Árvores de Busca Digital
- Lista de Prioridades
- Tabelas de Dispersão
- Grafos
- Casamento de Cadeias
- Compressão
Foi requerida a utilização desses tópicos na solução das seis tarefas citadas. É utilizada em grande parte a linguagem de programação C++, através do paradigma de Orientação a Objetos.