Uno de los éxitos de Google fue el uso de robots de búsqueda automática. Michael Imbeault, canadiense, ha desarrollado un periódico de noticias científicas basado en un robot o buscador automático. Fundamentalmente busca en Google News y en Yahoo News. http://esciencenews.com. Lo lanzó hace un mes y ya tiene 5000 visitas diarias.
Este tipo de buscadores automáticos de noticias no generan nuevas noticias, por lo que han de basarse en quienes de verdad las generan (CNN.com, MSNBC.com), pero de forma automática construyen el titular, ordenan las noticias por importancia y/o interés, clasifican éstas en grupos relacionados (en función de la co-ocurrencia de palabras entre ellas), y usan técnicas estadísiticas BAYESIANAS para asignar los artículos automáticamente a categorías como Astronomía, Salud o Clima. El orden o ranking de las noticias se basa en su fecha, el número de sitios web que las citan, y otros factores relacionados cno su importancia.
Obviamente, Google News y Yahoo News no contienen todas las noticias científicas del mundo, limitándose a sitios tan famosos como Nature News, la sección de ciencia de The New York Times, páginas de noticias de universidades y centros de investigación, como la NASA, etc. Pero Michael Imbeault ha prometido extender estos sitios poco a poco hasta cubrir la «Google-Internet» (la parte de la web alcanzable mediante buscadores).
Imbeault, como no puede ser menos para una «animal» universitario, quiere aplicar técnicas de Web Semántica (Web 3.0) para obtener un mejor significado de los contenidos de los textos de las noticias. ¡Qué tenga suerte!