Corpus do Português

Países: Estados Unidos

Foi lançado pelos pesquisadores Mark Davies, Professor of Corpus Linguistics, Brigham Young University e Michael J. Ferreira, Professor of Portuguese Philology and Linguistics Georgetown University um sítio que permite pesquisar fácil e rapidamente mais de 45 milhões de palavras em mais de 50,000 textos em português dos séculos XII ao XX.

A interface permite pesquisar palavras exatas ou frases, cadeias de pesquisa, lemas, classes gramaticais, ou qualquer combinação dos referidos elementos. Proporciona também a pesquisa de palavras vizinhas (cognatas) com um contexto de dez palavras de cada lado. O corpus também permite comparar (e ver através de diagramas) a frequência e distribuição de palavras, frases e construções gramaticais em textos de pelo menos três maneiras diferentes:

- Registo: comparações entre o falado, a ficção, o jornalístico, e o académico.
- Variedades do português: Portugal versus Brasil no século XX.
- Período histórico: comparação de séculos diferentes dos Trezentos aos Novecentos.

Realizam-se com facilidade consultas de índole semântica no corpus. Por exemplo, a diferença de significado entre duas palavras relacionadas, pode ser determinada através da comparação e contraste das palavras vizinhas (colocados). Pode-se encontrar a frequência e a distribuição de sinónimos de mais de 20,000 palavras e comparar esta frequência em registos ou países diferentes, ou inclusive ao longo dos séculos. Estas listas de palavras podem ser armazenadas e usadas em futuras consultas. Pode-se, além disso, criar as suas próprias listas de palavras com um parentesco semântico, e usá-las como parte da consulta.

Este corpus foi patrocinado pela US National Endowment for the Humanities, e está disponível gratuitamente na internet www.corpusdoportugues.org

E-mail

Imprimir

Corpus do Português

Informação relacionada

A não perder #443

A não perder #442

Imprensa Nacional apresenta edição crítica de Os Lusíadas de Luís Vaz de Camões

A não perder #441