Obtención del ExtractingRequestHandler para trabajar en Solr

Estoy intentando que Solr trabaje con Tika para poder indexar documentos de Word y PDF en mi sitio web de Drupal.

He mirado la página de Wiki y esta page e indican agregar un requestHandler en solrconfig.xml.

Hice eso y ahora Solr lanza una excepción:

org.apache.solr.common.SolrException: Error al cargar la clase 'org.apache.solr.handler.extraction.ExtractingRequestHandler'

He hecho algunas búsquedas y he visto que otros han tenido este problema, pero no veo una solución fácil. Estoy usando Solr 3.4.0 en Windows Server 2003 . ¿Alguna idea sobre cómo resolver esto?

Como nota al margen, tengo a Drupal usando Solr para la búsqueda y eso está funcionando. Pero lo que no puedo trabajar es que Solr indexe documentos PDF y Word. Estoy seguro de que esto es una necesidad común para la mayoría de los sitios web, pero he pasado días en esto y no puedo creer que esté tan mal documentado y sea difícil de entender.

4

1 Respuestas

Si está ejecutando Solr desde el directorio de ejemplo con la configuración de jetty, debería ejecutarse tal como está sin ningún cambio.

Sin embargo, para la configuración multinúcleo, deberá copiar los archivos jar en el directorio lib .

Si verifica solrconfig en las carpetas de ejemplo, incluye los archivos jar para las bibliotecas de células y extracción de solr.

solrconfig.xml -

Descomenta esta línea para incluir todos los frascos lib -


Copia los archivos jar de estas carpetas a tu carpeta de librerías de múltiples núcleos Estos frascos se utilizan para la extracción. (Apache pdfbox, poi, fontbox, etc.)



Cuando inicie Solr, debería ver todos los tarros cargados. Debería ponerte a trabajar.

4
agregado
En mi instalación necesitaba usar y NOT
agregado el autor Cole W, fuente
genial .. genial ...
agregado el autor Jayendra, fuente
Copié el solrconfig.xml en Solr con el solrconfig.xml de Drupal para que Solr trabajara con Drupal. El de Drupal no contenía esas líneas de lib, así que ese era definitivamente el problema. ¡Gracias!
agregado el autor John81, fuente
Hola, @Jayendra, no puedo configurar estos cambios. ¿Podría explicar qué archivos necesito copiar? No tengo ninguna carpeta dist en mi instalación de solr
agregado el autor Prafful Garg, fuente