Dúvida sobre sistema de busca no DSpace 7.3

92 views
Skip to first unread message

Orlando Bichiqui Junior

unread,
Feb 24, 2023, 11:52:22 AM2/24/23
to dspace...@googlegroups.com
Boa tarde a todos.

Fizemos uma nova instalação do DSpace 7.3 para um cliente que utilizava a versão 5.5.
O cliente está organizando suas comunidades na nova versão, pois vai abandonar a versão 5.
Pois bem, o sistema de busca da versão 7.3 não está encontrando os termos procurados que existem dentro dos PDF publicados.
E o cliente diz que na versão 5 esse processo funciona. Ou seja, o sistema de busca também faz a checagem nos PDF.

Alguém já passou por algo semelhante?
Em caso afirmativo, como resolveram?

Abraços,
Orlando Bichiqui Junior
Due Tecnologia e Comunicação Ltda
(11) 98105-9828
Skype: ojunior1970

Tiago Ferreira

unread,
Feb 24, 2023, 12:18:49 PM2/24/23
to Orlando Bichiqui Junior, dspace...@googlegroups.com
Orlando, boa tarde

Creio que esteja faltando a indexação do conteúdo do documento através do Media Filter.
Você encontrará um pouco mais de informação sobre as configurações e execuções no link abaixo:


É importante criar uma rotina para execução periódica destes comandos.

Qualquer dúvida, me avise.

Abraços
 TIAGO FERREIRA
CIO
t.+55 (24) 2237-1839
c.+55 (21) 98162-0206
http://www.neki-it.com.br
Conteúdo confidencial e protegido por Lei. Se a mensagem foi recebida por engano, por favor, avise ao remetente e apague-a do computador. As opiniões expressas neste e-mail pertencem ao seu remetente e não necessariamente coincidem com as opiniões da Neki IT. 


--
Você recebeu essa mensagem porque está inscrito no grupo "DSpace Brasil" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para dspace-brasi...@googlegroups.com.
Para ver essa discussão na Web, acesse https://groups.google.com/d/msgid/dspace-brasil/CALMnAZTk_LLCtv%3DNHOfKaJn50XSsXwdjqk_rybu6k0Mu9T7TSg%40mail.gmail.com.

Orlando Bichiqui Junior

unread,
Feb 24, 2023, 1:07:21 PM2/24/23
to Tiago Ferreira, dspace...@googlegroups.com
Olá Tiago, muito obrigado.

Vou encaminhar para meu time técnico verificar.


Abraços,
Orlando Bichiqui Junior
Due Tecnologia e Comunicação Ltda
(11) 98105-9828
Skype: ojunior1970

Erivelto Henrique

unread,
Feb 27, 2023, 7:22:28 AM2/27/23
to DSpace Brasil
Estou com o mesmo problema, migrando da versão 6.3 para a 7.5 e o resultado das pesquisas na versão 7.5 é diferente da versão 6.3.
Para vocês terem uma noção,
Resultado da pesquisa de um termo na versão 6.3
Screenshot_8.png

Resultado da mesma pesquisa na versão 7.5
Screenshot_10.png

A eficiência da pesquisa na versão 7.5 é menor.

Erivelto Henrique

unread,
Feb 27, 2023, 9:41:25 AM2/27/23
to DSpace Brasil
No meu caso aqui identifiquei que o DSpace 7 não está convertendo 100% do PDF para o bitstream TXT. Ele está convertendo por volta de 70%, por isso a pesquisa fica comprometida.

Aroldo Rique Júnior

unread,
Apr 17, 2024, 3:55:35 PM4/17/24
to Tiago Ferreira, Orlando Bichiqui Junior, dspace...@googlegroups.com
O Dspace 7 trouxe duas novidades: 

1. O limite de caracteres a serem extraídos do pdf: parâmetro textextractor.max-chars localizado dentro de dspace.cfg
2. Limite de caracteres a serem indexados por documento: parâmetro discovery.solr.fulltext.charLimit localizado dentro de /config/modules/discovery.cfg

Para retirar os limites, coloquem esses parâmetros com o valor = -1.

Att,

Aroldo Rique 

Em sex., 24 de fev. de 2023 às 14:18, Tiago Ferreira <tiago.f...@neki-it.com.br> escreveu:
Reply all
Reply to author
Forward
0 new messages