SMX Information Retrieval for Dummies
Posted by maximiliano | Posted in Buenas Prácticas | Posted on 26-10-2007
0
Mauricio Marin de Yahoo, nos advierte qu esto es algo más técnico que las ponencias generales del seminario. Al parecer eso me interesará más… ¿veremos algo de código?
Más que código estamos escuchando de máquinas Linux, procesadores y otras hierbas… Maxi estaría feliz acá. Ejemplifica con unos gráficos de herencia, sincronización ente máquinas, etc.
Los algoritrmos deben comprender los requerimientos y depende del comportamiento de los datos… cri cri
En relación al ancho de banda la problemática se ubica en como optimizar la carga de tráfico, es decir, cómo un mensaje se optimiza para que no ocupe tanto.
¿Cómo se comunican las máquinas entre ellas?
Segun el modelo BSP. Por ejemplo entre 4 paralelas, que en un primer nivel trabajan separadas y en un segundo nivel se comunican o sincronizan entre ellas, enviando mensajes unas a otras. Todo siempre orientado a las consulta. Este sería un comportamiento intuitivo.
Por ejemplo al enviar un libro de 6 capitulos a 6 máquinas distintas se realiza en base al paralelismo, que es básicamente el trabajo de los Brokers.
La principal regla logarítmica de la mitad y la mitad de la mitad… en base a estos recoridos están indexados los datos. Reglas logarítmicas para búsquedas eficiente.
Esto está muy cabezón, muchas maquienas, Ranker…
La política Round-robin la ejemplifica Mauricio al hacer cola para sacar fotocopias, con la condición de que se puedan sacar hasta 5 fotocopias por vez, es decir que quien tiene que sacar 5 fotocopias no le gustaría estar detrás de quien tiene que sacar 3000…
Todo esto para saber como manejar las consultas o requerimientos.
Como dice Mauricio, es problema de los computines :)






