A Shocking Amount of the Web is Machine Translated

16 views
Skip to first unread message

Joel Souza

unread,
Jan 16, 2024, 10:09:52 AMJan 16
to arqhp
Um paper sobre algo que a gente já sabia mas que agora fica ainda mais evidente com LLMs:  a grande maioria do conteúdo distribuido na internet são traduções toscas de conteúdo (geralmente ruim) em inglês. Treinar modelos de IA utilizando conteúdo préviamente mal traduzido do inglês, retroalimenta a lixeira que virou a internet nos últimos 10 anos. 

Irapuan Martinez

unread,
Jan 16, 2024, 10:47:49 AMJan 16
to Lista ArqHp
Frake me. Uso ChatGPT pra dar uma esmerilhada no meu inglês “book-on-the-table”.

Desisti de buscar fluência tendo tão pouca oportunidade de praticar com falantes nativos e achava que estava abafando nos verbs.

Pior que meses atrás, achei que fosse fazer uma tatuagem. Como achei inglês manjado demais, quis latim. Traduzir pra linguagem morta não é exatamente mole e o ChatGPT me assegurou que ele falava o idioma do ex- da Kelly Key.

Mas como saber que ele estava correto? Não tem liquid paper para tatuagem. Lembro de ter lido um maromba que tatuou em chinês “coragem” e quando um chinês nativo viu, explicou que ele havia tatuado “cachorrinho”.

Tá que talvez eu não tire a camisa em frente de um estudante de latim, mas eu não conto com esta sorte. Uma vez, uma garota tinha uma clave sol tatuada no ombro. Aquilo me incomodou e precisei chegar em casa para entender (sim, era um tempo sem conectividade móvel): pesquise e a clave de sol dela havia sido tatuada espelhada. Imagino que o tatuador se confundiu na hora do stencil e quando ela viu no espelho, disse “perfeito!”.

Como descobrir se o latim do ChatGPT estava certo? Já sei, vou colocar o Bard para corrigir. 

Ambos discordaram.

E olha que em se tratando de latim, ele não está lidando com textos porcamente traduzidos como no caso do inglês.

Sobre traduções toscas, um amigo meu avisou que um certo site de sacanagem que começa com X (e não é o ex-Twitter) começou a traduzir o título dos vídeos artísticos.

Então tem muito galo fazendo duro em gatinhas barbeadas.


Joel Souza

unread,
Jan 16, 2024, 12:05:10 PMJan 16
to ar...@googlegroups.com

> Pior que meses atrás, achei que fosse fazer uma tatuagem. Como achei inglês manjado demais, quis latim. Traduzir pra linguagem morta não é exatamente mole e o ChatGPT me assegurou que ele falava o idioma do ex- da Kelly Key.


Por 10 segundos, quase tive um infarto agora. Tatuei "Memento Mori" na perna e APAREMENTE quer dizer aquilo mesmo que eu acho que significa. Pelo menos tá na wikipedia e se tá na internet , é verdade. ¯\_(ツ)_/¯

 

Irapuan Martinez

unread,
Jan 16, 2024, 12:29:49 PMJan 16
to Lista ArqHp
Em ter., 16 de jan. de 2024, 14:05, Joel Souza <joel....@gmail.com> escreveu:
Por 10 segundos, quase tive um infarto agora. Tatuei "Memento Mori" na perna e APAREMENTE quer dizer aquilo mesmo que eu acho que significa. Pelo menos tá na wikipedia e se tá na internet , é verdade. ¯\_(ツ)_/¯

Como assim? Não é “mementE mori”?

(A minha parte favorita da oração de São Francisco é aquela que fala “onde houver certeza, que eu leve a dúvida”).

Memento mori e carpa diem (“peixe cotidiano”) são manjados. Mas eu quis traduzir “gentleman is just a patient wolf”. ChatGPT e Bard se embananaram sobre se “gentleman" era “vir probus". Bard, “caballerus”. Um apontava para “macho virtuoso" e o outro, piloto equino. 

Gentleman não é nenhuma das duas coisas. Bom, passou a vontade de fazer a tatuagem. Ou de aprender línguas mortas.

Vou tentar klingon.

Joel Souza

unread,
Jan 16, 2024, 3:17:43 PMJan 16
to ar...@googlegroups.com
https://www.upwork.com/hire/latin-to-english-translators/

Eu tranquilamente pagaria um professor. Se bem que eles usariam AI pra traduzir ou talvez eles mesmos nem humanos sejam.



--
Você recebeu essa mensagem porque está inscrito no grupo "ArqHP - Arquitetura de home pages" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para arqhp+un...@googlegroups.com.
Para acessar essa discussão na Web, acesse https://groups.google.com/d/msgid/arqhp/CAFu4B9qzFJEvA0y5rHU%2B5hdSHvxkbF8zvObAtSr1HEmRqxTMmQ%40mail.gmail.com.


--
Joel Souza
Reply all
Reply to author
Forward
0 new messages