LINUCA
LINUCA - Asociación de Usuarios GNU/Linux en Cantabria
CONTENIDOS
. La Asociación
. ¡ Apúntate a socio !
. Fotos
. Los más leídos
. Autores [Actividad]
. Últimos Comentarios
. ¡Todos los titulares!
. Guía de Estilo
. Cómo publicar en Linuca
. Links cortos
. Lista de Correo
   [Mensajes antiguos]
   [Etiqueta en la Lista]
. Todas las Listas
. ¿Sugerencias?
. ¡Sindícanos!
Gràcies Bulma!
Esta página usa el código fuente de Bulma :-)
Busquedas

Ultimos kernels
(23/05/2013 05:11:27)
Debian
Última actualización
stable: 04/05/2013
testing: 22/05/2013
unstable: 22/05/2013
Micro-How to sobre htdig (6627 lecturas)
Por Jose Luis E. G.
Prometeux (http://www.linuca.org)
Creado el 06/08/2002 23:32 modificado el 06/08/2002 23:32

En este micro-howto se explica la instalación y configuración de este potente y versátil motor de búsqueda de páginas web.

Pagina1/1

Este es un pequeño resumen de instalación y configuración de htdig. Htdig es un motor de búsqueda bastante popular y muy potente, este destaca por su versatilidad y resultados. Lo primero que tendremos que hacer es bajarnos el ultimo release de htdig de www.htdig.org.

Una vez tengamos nuestro htdig pasaremos a instalarlo. Para ello descomprimimos las fuentes donde queramos y una vez dentro de las fuentes debemos hacer :

./configure

make

make install

NOTA: Podéis encontrar mas información en la pagina oficial de htdig www.htdig.org.
Ahora llego el momento de la engorrosa configuración :-) , para ello editaremos , con nuestro editor favorito , el archivo /etc/htdig/htdig.conf.
Las lineas mas importantes son estas:

database_dir: /var/lib/htdig # En esta linea se especifica el directorio donde estarán las bases de datos de información de la pagina que queremos indexar.

start_url: http://localhost/ # Y como no , en esta variable se especifica la pagina o paginas que queremos indexar y obtener información.

NOTA: htdig puede obtener información de paginas webs y de archivos en texto plano , como por ejemplo una lista de correo.

Una vez hayamos editado a nuestro antojo el /etc/htdig/htdig.conf ya estamos listos para generar las bases de datos , para ello ejecutaremos rundig -v.
NOTA: Generar las bases de datos llevaran su tiempo y su espacio , sed pacientes.

Aquí se listan los directorios en los que trabaja htdig:

/var/lib/htdig/ #Bases de datos generadas en el paso anterior

/var/www/htdig/ #Imágenes usados por htdig tales como , iconos , flechas , etc

/etc/htdig/ #Archivos de configuración de htdig

/var/www/ #Aquí encontraremos un archivo llamado search.html que es el interfaz de búsquedas para htsearch ( motor de búsquedas y consultas de htdig )

NOTA FINAL: Mas información en www.htdig.org y si quereis ver como funciona htdig , probad el motor de búsqueda interno de www.linuca.org , esta echo con htdig :-)

Imprimir
Version para
imprimir

Imprimir
Version
PDF
Comentarios
1.  Re: Micro-How to sobre htdig (15/08/2004 13:39, #2074)
  Por: IaM
El articulo esta muy bien, explica de una manera facil como instalar ese motor que parece que tiene un monton de opciones. Pero tengo una duda que todabia no he podido resolver. Quiero instalar ese robot para buscar solo archivos de un determinado tipo como gif, jpeg, doc, pdf etc. Se podria poner una lista con todas las urls que quiero mirar y decirle que me liste y me baje los links y los archivos ?. No se como hacerlo, parece que hace de todo menos lo que yo quiero :( Saludos, IaM

 
2.  no me sale (09/12/2004 23:15, #2806)
  Por: joels
no entiendo porque al dar rundig no hace nada, al principio decía que no podía crear la base de datos, podrían dar una mano ....

 
3.  Re: Micro-How to sobre htdig (27/10/2005 18:47, #4220)
  Por: El cobarde anónimo
Micro no MICRISIMO. Saludos.

 
Calificacion
***0
Votos: 16
SECCIONES
Artículo
Truco
Noticias
Breve
Enlace
Linuca
Libros
Tira ECOL
Tira Ecol
Modificado: 3/6/2011 22:48:15 | Tiempo Total: 0.003 segs | Kernel: Linux - x86_64 - 2.6.18-xen | Last Boot: 03/12/2010 01:21 CET
Powered By WEB-Bulma   Apache   Mysql   PHP   Gimp