2003-03-29

Melhor que o Google: A pesquisa por domínios conceptuais

Consideremos um agrupamento de ligações entre conceitos, sendo que as várias palavras presentes nas frases remetem, independentemente do seu tempo verbal, para o mesmo conceito. Chamemos a essa rede um «domínio conceptual» - grupo de conceitos interligados por um contexto específico. Assim, o sistema de informação possui todo o vocabulário, distinguindo se uma palavra é um verbo, nome, adjectivo, e o tempo em que se apresenta o conceito verbal (passado, futuro, etc.).

A pesquisa recorre a um repositório com todo o vocabulário, estabelecendo conexões entre os conceitos presentes ao nível da frase. Mas as conexões mais importantes serão as estabelecidas entre as frases do mesmo parágrafo, dado que o conjunto de conceitos de uma frase se vai ligar entre dois domínios, expondo um contexto específico que esperamos ser o resultado da busca que o utilizador pretende atingir. Assim, a partir da frase poderá ser generalizado um domínio conceptual.

Depois, a análise que o sistema faz das escolhas feitas pelo utilizador a partir dos resultados reforça ou recusa a validade dos domínios conceptuais. Forma-se assim uma nova conexão entre o domínio conceptual e um utilizador que mostra estar interessado num resultado específico da busca.

O sistema de busca, embora longe da inteligência que se sonha incorporar nas tecnologias, é adaptativo, sendo construído em redor do utilizador que busca, não documentos, mas informação.

Novos domínios conceptuais podem ser criados: os que se encontram na própria especificação da busca. A busca «sistema de informação» relaciona o conceito de «sistema» com o conceito de «informação», e será reforçado dinamicamente pelo conteúdo exposto ao sistema, pelo conteúdo da busca e pelo «julgamento» que o utilizador faz dos resultados.

Os processos de análise estatística de texto, que recorrem à proximidade entre palavras e à contagem de palavras num documento não deverão ser tão eficazes, já que palavras diferentes correspondem ao mesmo conceito, e conceitos diferentes são representados com a mesma palavra conforme o domínio conceptual específico.

Assim, o sistema de busca não filtra palavras, nem guarda mais do que uma instância da palavra, mas guarda conexões entre conceitos e conexões entre domínios.

Sem comentários:

Enviar um comentário