Discovery – DSpace 4

Habilitando o Discovery

Original https://wiki.duraspace.org/display/DSDOC4x/Discovery

O Discovery foi adotado como a infraestrutura padrão para busca e navegação no Dspace 4, então não há tarefas manuais para habilitá-lo no Dspace. Se você quer habilitar o Discovery em versões mais antigas veja a documentação para a sua versão do Dspace.

Arquivos de configuração

A configuração é separada em 2 arquivos.

Configurações gerais: O arquivo discovery.cfg localizado na pasta [dspace-install-dir]/config/modules directory.

Configurações da interface do usuário: O arquivo discovery.xml localizado na pasta [dspace-install-dir]/config/spring/api/.

Configurações gerais do Discovery (config/modules/discovery.cfg)

O arquivo discovery.cfg está localizado na pasta [dspace-install-dir]/config/modules e contém as seguintes propriedades:

 

Propriedade:

search.server

Valor de exemplo:

search.server=[http://localhost:8080/solr/search]

Nota:

O Discovery conta com um índice Solr para armazenamento e recuperação de suas informações. Este parâmetro determina a localização do índice Solr.

Propriedade:

index.ignore

Valor de exemplo:

index.ignore=dc.description.provenance,dc.language

Nota:

O Discovery irá incluir todos os metadados do Dspace em seu índice de busca. Nos casos em que metadados específicos são confidenciais, gestores de repositórios podem incluir esses campos, adicionando-os à lista separada por vírgula.

Propriedade:

index.authority.ignore[.field]

Valor de exemplo:

index.authority.ignore=true

index.authority.ignore.dc.contributor.author=false

Nota:

Por padrão, o Discovery irá utilizar as informações de autoridade nos metadados para desambiguar homônimos. A definição dessa propriedade para false fará com que o processo de indexação não inclua informações de autoridade. A configuração pode ser diferente em um campo (<esquema>. <elemento>. <qualificador>) base, a propriedade sem o campo define o valor padrão.

Propriedade:

index.authority.ignore-prefered[.field]

Valor de exemplo:

index.authority.ignore-prefered=true

index.authority.ignore-prefered.dc.contributor.author=false

Nota:

Por padrão, o Discovery irá utilizar as informações nos metadados de autoridade para consultar a autoridade para o label preferido. A definição dessa propriedade para false fará com que o processo de indexação mesmo que os metadados não incluam a informação de autoridade (ou seja, a forma preferida é a registrada no valor de metadados). A configuração pode ser diferente em um campo (<schema>. <elemento>. <qualificador>) base, a propriedade sem um campo coloca o valor padrão. Se a autoridade é um serviço remoto, desabilitar esse recurso pode melhorar muito o desempenho.

Propriedade:

index.authority.ignore-variants[.field]

Valor de exemplo:

index.authority.ignore-variants=true

index.authority.ignore-variants.dc.contributor.author=false

Nota:

Por padrão, o Discovery irá utilizar as informações nos metadados de autoridade para consultar a autoridade para as variantes. A definição dessa propriedade para false fará com que o processo de indexação não inclua informações de autoridade. A configuração pode ser diferente em cada (<esquema>. <elemento>. <qualificador>) base, a propriedade sem um campo coloca o valor padrão. Se a autoridade é um serviço remoto, desabilitar esse recurso pode melhorar muito o desempenho.

 

Modificando a interface do usuário do Discovery ( config/spring/api/discovery.xml )

 

O arquivo discovery.xml está localizado na pasta [dspace-install-dir]/config/spring/api.

 

Resumo da Estrutura

 

Este arquivo está em formato XML, você deve estar familiarizado com XML antes de editá-lo. As configurações são organizadas em conjunto em beans, dependendo da finalidade de utilização destas propriedades.

Este objetivo pode ser derivado da classe dos beans. Aqui está um breve resumo das classes e propriedades que são usadas nos beans.

 

Classe:

DiscoveryConfigurationService

Objetivo:

Define o mapeamento entre as configurações do Discovery separadas de coleções/comunidades individuais

Padrão:

Todas as comunidades, coleções e da homepage (key = default) são mapeados para defaultConfiguration

Classe:

DiscoveryConfiguration

Objetivo:

Agrupa configurações para as facetas da barra lateral, filtros de busca, opções de busca classificar e submissões recentes

Padrão:

Há uma configuração padrao chamada defaultConfiguration

Classe:

DiscoverySearchFilter

Objetivo:

Define os campos de metadados específicos devem ser habilitados como um filtro de pesquisa

Padrão:

dc.title, dc.contributor.author, dc.creator, dc.subject.* and dc.date.issued são definidos como filtros de pesquisa

Classe:

DiscoverySearchFilterFacet

Objetivo:

Define quais campos de metadados devem ser oferecidos como opções da barra lateral de navegação. Cada uma dessas facetas também devem ser um filtros de pesquisa.

Padrão:

dc.contributor.author, dc.creator, dc.subject. * e dc.date.issued

Classe:

HierarchicalSidebarFacetConfiguration

Objetivo:

Define qual metadados campos contêm dados hierárquicos e devem ser oferecidos como uma opção de barra lateral contextual.

Classe:

DiscoverySortConfiguration

Objetivo:

Especifica as opções de classificação a que se refere a DiscoveryConfiguration

Padrão:

dc.title e dc.date.issued são definidos como alternativas para a classificação, com exceção da relevância (hard-coded)

Classe:

DiscoveryHitHighlightingConfiguration

Objetivo:

Define qual metadados campos podem conter hit highlighting & search snippets

Padrão:

dc.title, dc.contributor.author, dc.subject, dc.description.abstract & texto completo de arquivos de texto.

 

Predefinições

 

Além das descrições resumidas dos valores padrão, os detalhes seguintes ajudarão a entender melhor esses padrões. Se você não tiver feito isso, faça o download do arquivo de configuração e o reveja, juntamente com os seguintes parâmetros.

O arquivo contém uma configuração padrão que define as facetas da barra lateral, filtros de busca, de ordenação campos e submissões recentes:

 

  • Sidebar facets

  • searchFilterAuthor: agrupa os campos de metadados dc.contributor.author & dc.creator com um limite 10 facetas, classificado pela quantidade de ocorrências.

  • searchFilterSubject: agrupa todos os campos de metadados assunto (dc.subject *.) com um limite de 10 facetas, classificado pela quantidade de ocorrências.

  • searchFilterIssued: contém o campo de metadados dc.date.issued, que é identificado com o tipo “data” e classificadas por valores de data específicos.

  • Search filters

  • searchFilterTitle: contém o campo de metadados dc.title

  • searchFilterAuthor: contém os campos de metadados dc.contributor.author & dc.creator

  • searchFilterSubject: contém os campos de metadados dc.subject *.

  • searchFilterIssued: contém o campo de metadados dc.date.issued com o tipo “data”

  • Sort fields

  • sortTitle: contém o campo de metadados dc.title

  • sortDateIssued: contém o campo de metadados dc.date.issued, este sort tem o tipo data configurado.

  • defaultFilterQueries

  • A configuração padrão não contém defaultFilterQueries

  • As consultas de filtro padrão são desativados por padrão, mas há um exemplo na configuração padrão nos comentários, que permite a descoberta para retornar apenas os itens (em oposição às comunidades também / coleções).

  • Recent Submissions

  • As submissões recentes são classificadas segundo dc.date. accessioned que é uma data e um número máximo de 5 submissões recentes são exibidas.

  • Hit highlighting

  • Os campos dc.title, dc.contributor.author & dc.subject podem conter hit highlighting.

  • O dc.description.abstract & campo de texto completo são usados ​​para renderizar search snippets.

     

Muitas das propriedades contêm listas que usam referências para apontar para os elementos de configuração. Desta forma, um determinado tipo de configuração pode ser utilizada em várias configurações de detecção de modo que não há necessidade de duplicá-las.

 

Personalização da barra lateral e filtros de pesquisa

 

Esta seção explica as propriedades de filtros de pesquisa e facetas da barra lateral. Cada faceta lateral deve ocorrer na lista de referências dos filtros de pesquisa. Abaixo está um exemplo de configuração de um filtro de busca que não é utilizado como uma faceta lateral.

 

<bean id=”searchFilterTitle” class=”org.dspace.discovery.configuration.DiscoverySearchFilter”>

<property name=”indexFieldName” value=”title”/>

<property name=”metadataFields”>

<list>

<value>dc.title</value>

</list>

</property>

</bean>

 

Os atributos id & classe são obrigatórios para este tipo de bean. As propriedades que ele contém são discutidas abaixo.

  • indexFieldName (Obrigatório): Um nome de filtro de pesquisa único, os metadados serão indexadas no Solr com este nome.

  • metadatafields (Obrigatório): A lista dos campos de metadados que devem ser incluídos na faceta.

 

As facetas da barra lateral estendem o filtro de pesquisa e adicionam algumas propriedades adicionais. A seguir é apresentado um exemplo de um filtro de busca, que também é utilizado como uma faceta lateral.

 

<bean id=”searchFilterAuthor” class=”org.dspace.discovery.configuration.SidebarFacetConfiguration”>

<property name=”indexFieldName” value=”author”/>

<property name=”metadataFields”>

<list>

<value>dc.contributor.author</value>

<value>dc.creator</value>

</list>

</property>

<property name=”facetLimit” value=”10″/>

<property name=”sortOrder” value=”COUNT”/>

<property name=”type” value=”text”/>

</bean>

 

Observe que a classe foi alterada de DiscoverySearchFilter para SidebarFacetConfiguration. Isto é necessário para suportar as propriedades extras.

 

  • facetLimit (opcional): O número máximo de valores a ser mostrado. Essa propriedade é opcional, se nenhum for especificado o valor padrão “10” será usado. Se o filtro tem o tipo de data, esta propriedade não será utilizado pois as datas são agrupadas automaticamente.

  • sortOrder (opcional): A ordem de classificação para as facetas da barra lateral, que podem ser COUNT ou VALUE. O valor padrão é COUNT.

  • COUNT serão classificados pela quantidade de vezes em que aparecem no repositório

  • VALOR serão classificados em ordem alfabética

  • type (opcional): o tipo de faceta de barra lateral pode ser “data” ou “text” sendo “text” o valor padrão.

  • text: As facetas será tratado como elas são

  • date: Apenas o ano será armazenado no índice Solr. Estes anos são automaticamente exibidos em intervalos que ficam menores quando você os seleciona.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s