[Booby-Funkybeat-hugo]'s cahier de brouillons

Voici le nouveau support d'écriture de funkybeat qui lui permet de stocker les adresses des pages qu'il a lues, devrait, fait semblant d'avoir lues...

lundi, novembre 28, 2005

Saturday Night Clever

Le old school projet CLEVER (Clientside Eigenvector Enhanced Retrieval) développé au laboratoire Almaden d’IBM a été la première tentative d’utilisation de HITS pour créer un moteur de recherche opérationnel. Deux papiers qui fixaient les bases : Mining the Web's Link Structure et Automatic Resource list Compilation by Analyzing Hyperlink Structure and Associated Text.

mardi, novembre 01, 2005

Judy, arrêtes!

Un judy array est une struture de données de type tableau associatif (ex: hash table) très rapide pour le stockage et la recherche de valeurs en utilisant des clés integer ou string. Bien que ce soit une structure de données de type array, les Judy array peuvent avoir beaucoup d'indices non assignés. Cette structure est scalable, performante et compacte en mémoire.

Son API permet les manipulations simples (insert, retrieve, delete) et plus complexes (sort, search, count, sequencial access). D'une manière générale Judy (nom de la soeur de l'inventeur Doug Baskins) peut être déployée, quand le nombre de données à stocker en mémoire est important, à la place des structures plus courantes : arrays, sparse arrays, hash tables, B-trees, binary trees, linear lists, etc. pour les algorithmes de tri et de recherche, et les fonctions de comptage.
Le site du projet Judy : http://judy.sourceforge.net/
L'extension perl pour utilliserJudy : Tie::Judy