A indexação de texto é o ato de processar um texto a fim de extrair estatísticas consideradas importantes para representar as informações disponíveis e/ou permitir uma busca rápida em seu conteúdo.
As operações de indexação de texto podem ser realizadas não apenas em textos de linguagem natural, mas virtualmente em qualquer tipo de informação textual, como código-fonte de programas de computador, bancos de dados de DNA ou proteínas e dados textuais armazenados em sistemas de banco de dados tradicionais.
- As aplicações que envolvam indexação e pesquisa textual deverão ter as finalidades prioritárias de registro de logs e de pesquisa de textos por meio de paineis.
- As ferramentas de indexação e pesquisa textual não poderão ser acessadas diretamente por código front-end.
- Além disso, não devem ser usadas para réplica de banco (relacional, noSQL), ainda que a finalidade seja a construção de BI.
- Plataformas:
- OpenSearch: a ser utilizado em novos projetos.
- ElasticSearch: utilizado apenas em projetos já desenvolvidos. Por decisão arquitetural, não serão criados novos nós dessa plataforma.