Recuperação Semântica de Informações
Instituição de pesquisa: PPGI-UFRJ
Desafio:
As tecnologias de web semântica têm atraído grande interesse da mídia. Chamada de a próxima grande evolução da web (Web 3.0) essas tecnologias possibilitariam o acesso a informação de uma forma sem precedentes. Através do uso de esquematizações semânticas dos termos (ontologias), seria possível fazer um próximo sistema de buscas na Web, que buscaria informações pelo seu significado e não apenas por palavras-chave como é usado pelo Google. Apesar da grande mobilização da mídia, buscamos comprovações científicas de que esta nova tecnologia realmente será uma ruptura na maneira pela qual buscamos por informações.
Solução:
Realizamos um minucioso estudo sobre o impacto das ontologias de domínio nos mecanismos de recuperação de informação. Esse estudo, que exigiu um grande esforço de 36 Homens-Mês, serviu como dissertação de mestrado em sistemas de informação de um de nossos colaboradores. Para realizar esse estudo foi necessária a colaboração com instituições de pesquisas nacionais (Universidade Federal do Rio de Janeiro)e internacionais (Universidade de Ciências e Saúde de Oregon). Para realizar os experimentos do estudo, construímos com tecnologias open source um mecanismo de busca, que utiliza as relações léxico-semânticas presentes em esquemas terminológicos (ontologias, tesauros, taxonomias) para fazer expansão automática dos termos da consulta.
|