Aprendizado de máquina para extração de websensors

A integração de plataformas online com diversos setores da sociedade (e.g. indústrias, universidades, governo e cidadãos em geral) tem permitido o uso da web como um grande e poderoso sensor. Nesse contexto, novas pesquisas e aplicações têm sido desenvolvidas para extração de conhecimento da web para identificação de tendências (de cunho social, político e comercial), monitoramento de desastres naturais (terremotos e inundações), predição de epidemias, análise de sentimentos e a extração inteligente de indicadores a partir de notícias sobre temas específicos (e.g. agricultura e medicina). Os modelos computacionais que permitem processar esses dados e monitorar a evolução de determinados tópicos e fenômenos na web são chamados de “websensors”. Os trabalhos existentes na área necessitam de especialistas de domínio para definir os parâmetros do modelo de um websensor, o que limita seu uso em muitas aplicações. Neste projeto, são investigados métodos de aprendizado não supervisionado, como agrupamento de dados, para apoiar a extração de websensors e ajuste de seus parâmetros de forma automática. A metodologia adotada é baseada em dois tipos de modelos: descritivos e preditivos. Em modelos descritivos, os websensors são explorados para explicar um determinado fenômeno que ocorreu no passado, bem como a extração automática de eventos e fatos relacionados ao fenômeno. Em modelos preditivos, os websensors são empregados como informação adicional para melhorar a detecção de eventos e/ou valores futuros.