Búsquedas de texto libre con Lucene

December 26th, 2008

Lucene es el motor de indexado y búsqueda de texto que usamos en nuestros portales de Enalquiler.com, Pretalouer.fr y Mioaffitto.it. Lo conocí a traves de Daniel Gimenez y Raul Puente cuando trabajaban en Enalquiler.com y ellos lo emplean a gran escala para Trovit, habiendo tambien otros sites importantes usandolo.

Destaca sobretodo por su rapidez en la consulta y estas son sus principales características: gran escalabilidad, posibilidad de búsqueda y actualización del indice al mismo tiempo, alto rendimiento en indexado y búsquedas, posibilidad de realizar consultas complejas y ponderadas, highlight de keywords en los resultados, consultas simultaneas a distintos indices, desarrollado en Java pero con APIs para PHP y otros lenguajes y es de código libre bajo licencia Apache.

Muy recomendable la lectura del libro Lucene in Action, sobretodo empezar con los primeros capítulos para hacese una idea de como trabajar con la librería y más adelante seguir con el resto, para cuando uno ya se ha metido a programar.

Site oficial: Apache Lucene

Desarrollo web ,

Base de datos Berkeley Native XML

December 26th, 2008

Es un sistema de base datos de XML nativo, lo que significa que de cara al desarrollador los datos no se guardan en las clásicas tablas,  si no que se hace en archivos XML con su estructura completa.

Las consultas se hacen por medio de XPath o XQuery y combinado con XSLT se consigue una rapidez aceptable en la obtención y presentación de los datos. Soporta transacciones ACID, encriptación AES, indices, acceso concurrente… y aunque originalmente esta desarrollada para Java, hay disponibles APIs para varios lenguajes entre ellos PHP.

Trabajé con ello hace ya un par de años para mi proyecto de fin de carrera y quería comentarlo brevemente aquí, ya que es poco conocido y en su día me pareció una opción interesante a estudiar, sobretodo si se hace un uso importante del XML.

Site oficial: Oracle Berkeley DB XML
PDF del uso con PHP: Building PHP Applications with Berkeley DBXML

Existe una alternativa libre que no llegué a probar, pero que en su momento parecía estar más verde que la de Berkeley: Exist Open Source Native XML Database

Desarrollo web , , ,

The begining

December 25th, 2008

Ingeniero informático desde 2006, actualmente soy analista programador y SEO de Enalquiler Rental Online SL, dentro del Grupo Intercom, para los portales de Enalquiler.com, Ventadepisos.com, Masprofesional.com, Mioaffitto.it y Pretalouer.fr.

Mi intención es que este blog sea más que nada uno técnico, con artículos y noticias entorno al desarrollo web y el posicionamiento en buscadores. Aún así, en alguna ocasión también escribiré sobre internet en general o algún otro tema.

Miscelánea