Sapo Summerbits

Projecto OpenThesaurus

Contextualização

O projecto OpenThesaurus (http://openthesaurus.caixamagica.pt), associado ao projecto http://pt.openoffice.org, é baseado no código do projecto OpenThesaurus e visa disponibilizar um thesaurus (dicionário de sinónimos) em língua portuguesa sob uma licença Livre.

O Thesaurus é a Base de Dados que permite que no processador de texto (ex: OpenOffice.org) seja possível ter sinónimos para uma determinada palavra. Por exemplo, para a palavra "carro", o thesaurus dá alternativas como "veículo" ou "automóvel".

Este thesaurus pode ser utilizado fora do OpenOffice.org para efeitos de motores de pesquisa e outras aplicações Web.

Até ao momento, já se conseguiu disponibilizar 13.000 palavras, contudo, é necessário enriquecer esta base recorrendo a recursos de outros projectos como, por exemplo, do projecto NATURA da Universidade do Minho.

Descrição do Projecto


Este projecto, propõe-se então desenvolver mecanismos para importação e consolidação de sinónimos no OpenThesaurus bem como a implementação de ferramentas a integrar quer no OpenThesaurus quer como plugins de outras aplicações que permitam potenciar a utilização do OpenThesaurus.

O objectivo não é o aluno inserir os sinónimos manualmente, para isso seria melhor um linguista, mas:

    - investigar bases de sinónimos para pt_PT e pt_BR existentes.

    - desenvolver as ferramentas para as integrar na Base de Dados.

    - disponibilizar à comunidade.

 
Para além do ponto anterior pretende-se também (aceitam-se outras ideias):

    - Desenvolvimento de um plugin para o OpenOffice.org que permita aceder aos sinónimos de uma palavra a partir de um menu de contexto (tipicamente botão direito em cima da palavra sobre a qual se pretende consultar os sinónimos)

    - Desenvolvimento de uma ferramenta, que, a partir de um conjugador de verbos já existente, permita mapear pessoas e tempos verbais de dois ou mais verbos sinónimos. (ex: a primeira pessoa do presente do verbo 'beber' é sinónimo da primeira pessoa do presente do verbo 'ingerir')


Conhecimentos

     - LAMP

Calendarização


*Fase 1: Investigação do estado da arte actual do OpenThesaurus (7 de Agosto de 2008)

Objectivo: Documento síntese dos contactos e levantamentos efectuados.


* Fase 2: Recolha de sinónimos  e implementação de ferramentas (7 Setembro de 2008)

Objectivos: - Implementação das ferramentas de importação de sinónimos na Base de dados do OpenThesaurus.


* Fase 3: Integração e Testes (15 Outubro)

Objectivo: Disponibilização da Base de Dados final e das ferramentas implementadas na fase anterior

Dados Pessoais do orientador

    Nome: Rui Sérgio Lopes Fernandes

    Mail: rui.fernandes@caixamagica.pt

Dados da entidade organizadora

    Organização: OpenOffice.org

    O projecto pt.OpenOffice.org é o responsável nacional pela localização e disponibilização do OpenOffice em Portugal.

    Neste momento, tem a seguinte estrutura de coordenação:

        - Rui Fernandes (Coordenador) - Site

        - Paulo Vilela – Responsável pela a área de marketing e localização do OpenOffice.org.

        - João Neves - Sistema de builds

        - Flávio Moringa - servidores FTP / mirror