Poetize: um convite aos colegas programadores, poetas e linguistas!!

17 views
Skip to first unread message

Luiz Gonzaga

unread,
Nov 24, 2011, 1:16:45 PM11/24/11
to
Saudações caros amigos!!

Gostaria de convidar todos os colegas interessados em poesia para colaborar em um novo projeto que iniciei: Poetize!

É um software que visa analisar um poema já escrito e fazer a parte "chata" de escanção (divisão silábica gramatical e poética), informar a métrica, o pé de verso / ritmo / cadência (a partir da identificação da sílaba tônica de uma palavra), etc, etc, etc...

Mesmo que você não seja um programador, você pode contribuir!!!

Se você é um poeta, linguista, entusiasta, enfim! Alguém que entenda das regras da poesia:

Precisamos FORMALIZAR esse conhecimento, até então bem "humano" pra poder ensinar o computador a como "entender" um poema. Talvez muitas dessas ambições que tenho sequer são possíveis, mas é justamente por isso que estou pedindo vossa ajuda: nem que seja pra falar "tire o cavalinho da chuva, isso não é possível!!!". Por exemplo:
  • Como falar para um computador identificar um ditongo, tritongo, hiato? Em alguns lugares que pesquisei dizem assim: "quando pronunciadas num só som vocálico...". Isso é apenas um recurso didático ou realmente é a única forma? Somente por esse "feeling" que é possível analisar? Pois vejam, como direi pro computador "se você conseguir num só som vocálico" hehehehehe. Entenderam? Há alguma regra formal onde até mesmo um ser humano surdo-mudo consegueria fazer essa análise? É justamente disso que preciso.

  • Onde encontrar e como formalizar as regras de escansão poéticas?
    • Por exemplo, uma elisão? (Mesmo dilema acima)

  • Como encontrar a sílaba tônica de uma palavra? Mesma coisa... Não posso simplesmente falar pro computador "vai pelo ouvido", pois ele não tem um hehehe. Existe na nossa lingua portuguesa alguma forma exata de fazer essa identificação?


  • Será que existe algum dicionário (gratuito, digital) que tenha também a informação das sílabas tônicas?

Se você é um programador:

  • Entra pro time!!! A casa do projeto, que é open source, é no github: http://github.com/lfilho/poetize
    • Atualmente o programa está fazendo apenas a divisão silábica gramatical (um hack sobre o algoritmo original do Tex, que não divide silabas que tenham acentos ou cedilha)
    • Não esqueça que contribuições para projetos open-source são bons pro currículo! :-D

  • O projeto está na linguagem Ruby sendo desenvolvido sob BDD. Escolhi Ruby como forma de motivar a aprender essa linguagem, então se você não a conhece ainda, não tem problema. Está no mesmo barco que eu!! =) Vamos aprendê-la juntos! Quaisquer contribuições em outras linguagens também são bem vindas, afinal a gente pode aproveitar o algoritmo e traduzí-lo.

  • Procurar / formatar algum dicionário que tenha também a informação das sílabas tônicas

  • Procurar / programar um algoritmo fonético para fazer reconhecimento das rimas

  • Escrever pseudo-código (caso não conheça Ruby mas não quer demorar muito a contribuir) e passar pra gente traduzí-lo pra Ruby.

  • Refatorar códigos já existentes

  • Escrever documentação para o projeto, facilitando a entrada de novos colaboradores e entendimento geral.


E aí, quem gostou da ideia??? Quem pode contribuir???

Abreijos


Luiz Gonzaga dos Santos Filho
My Blog / Website luiz.emp.br | View Luiz Gonzaga Filho's LinkedIn profileLinkedIn

(+55 62) 8448-0221

Gustavo Costa

unread,
Nov 24, 2011, 1:25:19 PM11/24/11
to rail...@googlegroups.com
tire o cavalinho da chuva, isso não é possível!!!

2011/11/24 Luiz Gonzaga <lfi...@gmail.com>

--
Você está recebendo esta mensagem porque se inscreveu no grupo "rails-go" dos Grupos do Google.
Para postar neste grupo, envie um e-mail para rail...@googlegroups.com.
Para cancelar a inscrição nesse grupo, envie um e-mail para rails-go+u...@googlegroups.com.
Para obter mais opções, visite esse grupo em http://groups.google.com/group/rails-go?hl=pt-BR.

Luiz Gonzaga

unread,
Nov 24, 2011, 1:28:47 PM11/24/11
to rail...@googlegroups.com
Olá, Gustavo. Obrigado pela rápida respost! :-)
Mas você poderia ser mais eloquente e fundamentar o que especificamente não é possível? Ou se realmente NADA é possível?

Valeu!


Luiz Gonzaga dos Santos Filho
My Blog / Website luiz.emp.br | View Luiz Gonzaga Filho's LinkedIn profileLinkedIn

(+55 62) 8448-0221



2011/11/24 Gustavo Costa <lgm...@gmail.com>

guilherme reis

unread,
Nov 24, 2011, 1:34:56 PM11/24/11
to rail...@googlegroups.com
Luiz,


Existe um tema que se chama Processamento de Linguagem Natural. Talvez devem haver papers que  falam sobre ditongos/hiatos/tritongos ou qualquer coisa que seja útil para este projeto.

Dei uma rápida pesquisada sobre ditongos aqui e encontrei isto:

http://www.cs.bham.ac.uk/~pxc/nlp/nlpgloss.html

diphthong  If the tongue moves significantly during the production of a vowel phone, the result is a diphthong. A diphthong sounds like a rapid, blended sequence of two separate vowels. An example in English is the vowel sound in the word kite, which is like a rapid combination of a kind of 'a sound' and a kind of 'i sound'. In the IPA a diphthong is represented by two vowel symbols. It is important to note that the two symbols represent a SINGLE phone.

http://en.wikipedia.org/wiki/International_Phonetic_Alphabet

Quem sabe se você conseguir mapear um dicionário com o padrão IPA e conseguir pegar o que tem duas vogais em sequência você consiga fazer esta distinção.


Acredito que deve haver alguma forma quando se tem algum dicionário com os fonemas já estabelecidos.

Eu insistiria na pesquisa, muito legal o projeto :)

Abs.



2011/11/24 Gustavo Costa <lgm...@gmail.com>

Luiz Gonzaga

unread,
Nov 24, 2011, 1:43:28 PM11/24/11
to rail...@googlegroups.com
Guilherme, valeu man!!

Eu já havia conhecido o IPA e parece realmente uma ótima saída. Mas ainda não achei um dicionário nesses moldes pra usar. Quanto mais em português. Acho que quem tem deve protegê-lo bem (pessoal do Houaiss, Aurélio, Priberam, Dicio.com.br, etc).

Um dicionário "open" bem legal que existe é o do Wiktionary. Eles disponibilizam regularmente o dump da base deles:
http://dumps.wikimedia.org/ptwiktionary/latest/

Mas apesar de não ter analisado a fundo ainda (3 kilometros de XML, e um XML beeeeem cheio de coisas) apenas algumas poucas palavras tem informações extras como silaba tônica, ditongo, etc...

Convido a todos a darem uma olhada e ver se têm mais sorte / competência que eu. :-)

Valeu de novo, Guilherme!


Luiz Gonzaga dos Santos Filho
My Blog / Website luiz.emp.br | View Luiz Gonzaga Filho's LinkedIn profileLinkedIn

(+55 62) 8448-0221



2011/11/24 guilherme reis <guilhe...@gmail.com>

Helio Borges Jr

unread,
Nov 24, 2011, 1:49:28 PM11/24/11
to rail...@googlegroups.com
Parafraseando um ex-professor meu:

"TUDO é possível. Basta você ter a motivação, dinheiro e tempo"


Boa sorte no projeto

2011/11/24 Gustavo Costa <lgm...@gmail.com>



--
Hélio Borges
Analista de Sistemas


Reply all
Reply to author
Forward
0 new messages