Archive pour la catégorie ‘Information sur Internet’

Lancement de Cuil, un moteur de recherche à très fort potentiel

Lundi 28 juillet 2008

Le très attendu moteur de recherche Cuill (prononcer « col ») a été lancé ce matin. Pour l’occasion, il perd un « l » pour devenir Cuil et s’affiche à l’adresse www.cuil.com

La première impression est très encourageante : le design est épuré et fonctionnel (le choix d’un fond noir pour la page d’accueil flatte l’oeil), le temps de réponse extrêmement bref et la présentation des résultats sur trois colonnes au format « magazine » (incluant des images) astucieuse et lisible.

Par ailleurs, Cuil propose un bloc d’exploration « à la Exalead » permettant d’affiner ses recherches en fonctions de propositions de recherches alternatives classées en catégories et sous-catégories.

Il semblerait que ces propositions s’appuient sur une analyse « sémantique » des expressions clés ou tags figurant au sein des pages : un moteur de traitement naturel du language oeuvre certainement en tâche de fond mais celui-ci semble limité à la langue anglaise et s’appuie sur une taxonomie plutôt incomplète.

Mais quid de la qualité des résultats de recherche, qui constitue le seul véritable juge de paix d’un moteur de recherche ?

Même si le Cuil annonce une taille d’index supérieure à tous les autres moteurs du marché (Google compris) avec 121 milliards de pages (!), une rapide comparaison montre que celui-ci est en réalité pour le moment moins complet que celui de Google, car renvoie systématiquement moins de pages sur des requêtes similaires.

Pour être honnête, ce test doit cependant être réalisé sur des requêtes renvoyant peu de résultats puisqu’il est impossible de vérifier que l’un ou l’autre moteur renvoie réellement les dizaines de millions de documents dont il se targue pour certaines requêtes (le nombre maximal de résultats réellement affichables étant de 1000 dans les deux cas).

A première vue, l’index paraît peu récent et comporte de nombreuses lacunes (sites importants non indexés, particulièrement en France). Pourtant, ceux qui ont pu voir en action les crawlers de Cuil savent que ceux-ci sont extrêmement efficaces (et sont passés sur leurs sites, quand bien même ceux-ci ne figurent pas encore dans l’index accessible au grand public).

Une seule explication possible donc : Cuil ne donne pas encore accès à l’intégralité de son index, à des fins probables de test de montée en charge progressive (de manière à atténuer le fameux « effet lancement », dont Cuil a d’ores et déjà fait les frais ce matin).

Attendons donc de voir Cuil donner toute sa puissance pour juger de la pertinence des résultats, qui sera à n’en pas douter impressionnante au vu des premiers pas de ce moteur généraliste qui en fait certainement le plus digne d’intérêt depuis Exalead.

La Business Intelligence à la croisée des chemins

Lundi 8 octobre 2007

SAP vient de racheter Business Objects pour un montant (4,8 milliards d’euros) qui en fait l’une des acquisitions la plus importante de l’année en matière de logiciel et sans nul doute la plus importante de l’histoire du logiciel en France.

BO était en effet jusqu’alors le seul champion français de taille mondiale dans l’univers des éditeurs de logiciel, même si quelques autres acteurs français importants restent encore indépendants, comme Cegid ou GLTrade (nous vous invitons à lire la très intéressante conversation qui s’est ouverte à ce sujet sur le site de Techcrunch).

Voici en tout cas un relais de croissance bienvenu pour SAP qui, au-delà de ses offres pour PME qui décollent lentement, aurait fini par peiner à conquérir de nouveaux clients. En effet, le marché de la Business Intelligence (BI pour les intimes) est estimé à 6 milliards d’euros au niveau mondial et progresse de 1 milliard par an !

Cependant, si la consolidation du marché du décisionnel est d’ores et déjà bien entamée, le champ d’application du concept de « Business Intelligence » ne cesse, lui, de s’étendre.

D’une part, les outils eux-mêmes évoluent. La société norvégienne Fast propose ainsi depuis peu son concept de Business Intelligence Built on Search dans lequel un index de moteur de recherche prend la place des traditionnels (et lourds) entrepôts de données. Le but affiché est de répandre l’usage de la Business Intelligence dans l’entreprise en proposant des outils simples et rapides, utilisables par tous.

D’autre part, le processus de Business Intelligence, historiquement centré sur les données internes à l’entreprises (ventes, finance, etc.) évolue de plus en plus vers le traitement de l’information externe, y compris sur Internet.

Ainsi, c’est l’une des voies que nous explorons chez Synthesio en proposant des outils innovants permettant d’analyser en temps réel l’information en provenance de plus de 50 000 sources d’actualités, avec la possibilité de croiser de nombreux critères (thématique, pays, types de sources, etc.) afin de fournir aux décideurs une vue synthétique de leur environnement .

Nous espérons bien ainsi contribuer au développement des « entreprises 2.0″, celles dont la capacité d’adaptation et d’anticipation est démultipliée par rapport aux « entreprises 1.0″ qui se contentent de réagir, souvent trop tard, aux évolutions de leurs marchés.

La « Web Intelligence » constituera-t’elle l’avenir de la « Business Intelligence » ? Affaire à suivre !

Terraminds, le moteur de recherche de Twitter

Lundi 10 septembre 2007

Twitter est le porte-drapeau d’une nouvelle génération de services qui permet de diffuser des messages courts (140 caractères, soit la taille d’un SMS) à des personnes ayant choisi de s’y abonner.

On parle dans ce cas de microblogging car le contenu, souvent peu travaillé, est bien sûr réduit à la portion congrue.

En effet, le blog tend de plus en plus à devenir un média (presque) comme les autres, avec bien souvent une ligne éditoriale, une charte graphique, un contenu propre, etc. ce qui nécessite des compétences et un investissement en temps devenu rébarbatif pour certains.

La force de Twitter réside ainsi dans sa simplicité d’utilisation et la diversité des supports permettant de « twitter » (terme désormais consacré), et ce en temps réel.

Adopté dans un premier temps par les « hyperconnectés », le phénomène du microblogging a donc rapidement décollé avec l’apparition de services concurrents comme Jaiku ou Pownce.

Si Twitter constitue un phénomène de mode dénoncé à juste titre par certains pour la vacuité de l’immense majorité des « twitts » (messages), de nouveaux usages se profilent néanmoins à l’horizon, notamment en entreprise comme l’explique Fred Cavazza.

Cependant, l’un des principaux défauts de Twitter était jusqu’à maintenant de ne disposer d’aucune fonction de recherche digne de ce nom permettant de découvrir des twitts intéressant ou tout simplement de se faire une opinion sur les usages possibles.

Terraminds pallie aujourd’hui cette lacune en proposant un moteur de recherche plein texte rapide et simplissime. A essayer donc si vous souhaitez commencer à découvrir la « microblogosphère », terme hermétique s’il en est ;)

Envie de jeter un coup d’oeil sous le capot de Google ?

Mardi 21 août 2007

Nous vous parlons régulièrement sur ce blog de l’architecture des moteurs de recherche, un sujet passionnant mais difficile à vulgariser. C’est pourtant ce que vient de réaliser le site Portfolio.com qui propose une infographie Flash très bien réalisée expliquant le mode de fonctionnement du plus célèbre d’entre eux : Google.

Si cette présentation offre un bon aperçu du fonctionnement global du moteur de recherche, les afficionados de technique se tourneront pour en savoir plus vers l’excellent site High Scalability, récemment créé, qui détaille entre autres les architectures de Google, Youtube, Flickr ou encore PlentyOfFish dont nous parlions récemment.

Le boom des WebTV

Lundi 20 août 2007

Le succès de YouTube et DailyMotion a marqué l’avènement d’une nouvelle forme de média sur Internet : la vidéo en format court (1 à 10 minutes environ), compatible avec la bande passante du réseau des réseaux, et surtout avec les modes de consommation des internautes, qu’ils soient à domicile, au travail ou en déplacement.

Les précurseurs français que sont les vloggers (vidéo bloggers) Loic le Meur et Jean-Michel Billaut avec son Billaut Show ont contribué à populariser cette formule, qui se professionnalise petit à petit au travers de véritables WebTV comme TiviPro (interviews d’entrepreneurs, dirigeants et managers) ou CapitalRisqueur.tv (présentations d’entrepreneurs et d’investisseurs).

On peut également citer Horizon Croissance qui dès 2005 expérimentait une formule d’émission complète en ligne avec des moyens professionnels (studio d’enregistrement, sélection d’invités sur des thématiques précises) ainsi que Revision3, le show du célèbre blog américain GigaOm.

Aujourd’hui, force est de constater que les moyens déployés sont encore limités (prise unique, peu ou pas de montage) ce qui limite souvent l’intérêt de la vidéo par rapport à l’audio. Toutefois, le marché mûrit comme en témoignent les formules régulières comme Intruders.tv (une initiative de Thierry Bézier qui commence à essaimer à l’international) ou WebbAlert qui empruntent aux médias traditionnels leur modèle économique, avec des publicités intersticielles.


Notre coup de coeur justement va sans aucun doute à WebbAlert, show quotidien (du lundi au jeudi) de 5 minutes en anglais lancé le 2 août. La charmante Morgan Webb y présente de manière impertinente l’actualité du web et des technologies sous forme d’une revue des blogs mondiaux influents. Un régal, à ne manquer sous aucun prétexte !

Enfin, ce panorama ne serait pas complet sans évoquer les sites proposant en ligne des synthèses (pitchs) de 5 minutes dans lequels des personnes issues ou non du monde du business proposent de partager leurs connaissances ou expériences sur un sujet. Parmi les plus connus : Vator.tv et le bien-nommé 5min.com sur lequel on trouve notamment cette inénarrable vidéo qui donne quelques conseils assez peu orthodoxes pour convaincre un VC d’investir dans une startup :)