Description:
O objetivo desse estudo é analisar o uso de informação latente contida na Internet, em investigações no campo das Ciências Sociais e da Educação. Não se trata de recolher dados “através da Internet”, por exemplo, por meio de questionários. Tampouco são utilizados dados pré-existentes na Internet. São estudos que analisam documentos contidos na Internet, extraindo os dados a partir de análises desses documentos. Pode-se dizer que se trata de um modelo de investigação de “traços”, “cursos” ou “restos” deixados pelos usuários da Internet. Para tanto, foram consultados artigos de pesquisas realizadas a partir desse corpus latente, centrando-se em quatro questões: o que se pode investigar, qual é o contexto em que se encontram estes dados, como selecionar as amostras, que considerações éticas devem ser consideradas? A análise do contexto distingue entre estudos sobre um conteúdo e estudos sobre interação. Também analisa as diferenças entre os sítios “voltados à notícia” e os “voltados ao documento”. São analisadas, em continuidade, os três tipos de populações e os processos de extração das amostras, incluindo a necessidade de correções a posteriori. As conclusões do estudo ressaltam de modo sucinto as possibilidades e oportunidades, assim como os limites desse tipo de investigação. This study aims to analyse the use of latent information in the Internet, as basis for the research in Educational and Social Sciences. Such work is distinguished from those that collect the data “through Internet”, e.g. with questionnaires or forms. It also differs from those using data stored in the Internet. We work with studies that analyse documents in the Internet, extracting data from the analysis of these documents. These documents were once distributed through the Web not knowing this future use as research objects. We can say that it is a research model based on trails left by Internet users. For this work we have revised the literature with research work based on this latent corpus, addressing four questions: What can be investigated with this data? In which context this data was found? How to select samples? And what ethics aspects should be considered? We have found very different kind of contents. In fact we have distinguished between studies on content and studies on interaction. Also we have found differences between websites oriented to news and oriented to knowledge. About samples, we have considered three kinds of population: closed-finite, open-infinite and The Web. We have also studies sample correction techniques. Conclusions of this work detail possibilities and opportunities as well as the limits of this research method.