(incubating) | The Free and Open Productivity Suite

Sapo Summerbits

Projecto OpenThesaurus

Contextualização

O projecto OpenThesaurus (http://openthesaurus.caixamagica.pt), associado ao projecto http://pt.openoffice.org, é baseado no código do projecto OpenThesaurus e visa disponibilizar um thesaurus (dicionário de sinónimos) em língua portuguesa sob uma licença Livre.

O Thesaurus é a Base de Dados que permite que no processador de texto (ex: OpenOffice.org) seja possível ter sinónimos para uma determinada palavra. Por exemplo, para a palavra "carro", o thesaurus dá alternativas como "veículo" ou "automóvel".

Este thesaurus pode ser utilizado fora do OpenOffice.org para efeitos de motores de pesquisa e outras aplicações Web.

Até ao momento, já se conseguiu disponibilizar 13.000 palavras, contudo, é necessário enriquecer esta base recorrendo a recursos de outros projectos como, por exemplo, do projecto NATURA da Universidade do Minho.

Descrição do Projecto


Este projecto, propõe-se então desenvolver mecanismos para importação e consolidação de sinónimos no OpenThesaurus bem como a implementação de ferramentas a integrar quer no OpenThesaurus quer como plugins de outras aplicações que permitam potenciar a utilização do OpenThesaurus.

O objectivo não é o aluno inserir os sinónimos manualmente, para isso seria melhor um linguista, mas:

    - investigar bases de sinónimos para pt_PT e pt_BR existentes.

    - desenvolver as ferramentas para as integrar na Base de Dados.

    - disponibilizar à comunidade.

 
Para além do ponto anterior pretende-se também (aceitam-se outras ideias):

    - Desenvolvimento de um plugin para o OpenOffice.org que permita aceder aos sinónimos de uma palavra a partir de um menu de contexto (tipicamente botão direito em cima da palavra sobre a qual se pretende consultar os sinónimos)

    - Desenvolvimento de uma ferramenta, que, a partir de um conjugador de verbos já existente, permita mapear pessoas e tempos verbais de dois ou mais verbos sinónimos. (ex: a primeira pessoa do presente do verbo 'beber' é sinónimo da primeira pessoa do presente do verbo 'ingerir')


Conhecimentos

     - LAMP

Calendarização


*Fase 1: Investigação do estado da arte actual do OpenThesaurus (7 de Agosto de 2008)

Objectivo: Documento síntese dos contactos e levantamentos efectuados.


* Fase 2: Recolha de sinónimos  e implementação de ferramentas (7 Setembro de 2008)

Objectivos: - Implementação das ferramentas de importação de sinónimos na Base de dados do OpenThesaurus.


* Fase 3: Integração e Testes (15 Outubro)

Objectivo: Disponibilização da Base de Dados final e das ferramentas implementadas na fase anterior

Dados Pessoais do orientador

    Nome: Rui Sérgio Lopes Fernandes

    Mail: rui.fernandes@caixamagica.pt

Dados da entidade organizadora

    Organização: OpenOffice.org

    O projecto pt.OpenOffice.org é o responsável nacional pela localização e disponibilização do OpenOffice em Portugal.

    Neste momento, tem a seguinte estrutura de coordenação:

        - Rui Fernandes (Coordenador) - Site

        - Paulo Vilela – Responsável pela a área de marketing e localização do OpenOffice.org.

        - João Neves - Sistema de builds

        - Flávio Moringa - servidores FTP / mirror

Apache OpenOffice is an effort undergoing incubation at The Apache Software Foundation (ASF), sponsored by the Apache Incubator. Incubation is required of all newly accepted projects until a further review indicates that the infrastructure, communications, and decision making process have stabilized in a manner consistent with other successful ASF projects. While incubation status is not necessarily a reflection of the completeness or stability of the code, it does indicate that the project has yet to be fully endorsed by the ASF.

Copyright & License
Apache and the Apache feather logos are trademarks of The Apache Software Foundation. OpenOffice.org and the seagull logo are registered trademarks of The Apache Software Foundation. Other names appearing on the site may be trademarks of their respective owners.