Ngram, le moteur de recherche dans des livres.

Nalinux

It's not a bug, it's a feature.
Ngram Viewer est une application linguistique proposée par Google, permettant d’observer l’évolution de la fréquence d’un ou de plusieurs mots ou groupe de mots à travers le temps. L’outil est entré en service en 2010.

Principe de fonctionnement
L’outil Ngram de Google repose sur la base de données textuelle de Google Livres. Les textes issus de Google Livres sont classés en fréquence de séquences de mots (appelées ngrams) par années d’édition, chaque séquence de mots est alors affectée d’un « poids ».
Lorsque l'utilisateur demande une comparaison de plusieurs séquences de mots, l'outil trace alors des courbes permettant de comparer leur fréquence d'usage au cours du temps.

https://fr.wikipedia.org/wiki/Ngram_Viewer

L 'adresse :
https://books.google.com/ngrams

Supposons que je veux savoir la popularité du nom "Toutankhamon" dans les livres numérisés par Google.

Il suffit de se rendre sur books.google.com/ngrams et d'entrer le mot clé "Toutankhamon", puis de choisir la langue d'édition (français ici, ça s'écrit Tutankhamon en anglais).
ATTENTION ! Le moteur de recherche fait la différence entre majuscules et minuscules. Il peut donc être utile de cocher "case insensitive".
On note un premier pic aux alentours de 1922, qui s'explique par la découverte de sa tombe.

On peut aussi chercher plusieurs termes, en les séparant par une virgule.
Dans le 2eme exemple, j'ai cherché "water pipe, hookah", ce qui me donne 2 courbes.


De quoi s'amuser des heures quand on fait des recherches ...
 

Pièces jointes

  • Capture du 2015-06-27 21:02:09.png
    Capture du 2015-06-27 21:02:09.png
    3.8 KB · Affichages: 5
  • Capture du 2015-06-27 21:03:18.png
    Capture du 2015-06-27 21:03:18.png
    66.5 KB · Affichages: 6
  • Capture du 2015-06-27 21:14:00.png
    Capture du 2015-06-27 21:14:00.png
    62.4 KB · Affichages: 5
Dernière édition:

Nalinux

It's not a bug, it's a feature.
@madalena, comme @Sanid l'indique, c'est pas le moment ou ça se retrouve sur Internet :)
C'est dans l'année de publication des livres qui contiennent les mots clés.
C'est bien sur limité aux livres numérisés par Google jusqu’à aujourd'hui, mais le nombre est déjà énorme et ça doit donner un résultat statistique assez précis.
Je l'ai indiqué mais je préfère répéter, il est important de cocher "case insensitive" selon moi.
Sinon, même en cherchant dracula on ne trouve rien. Il faudrait chercher Dracula.
 

Nalinux

It's not a bug, it's a feature.
1 google est né fin 90'
2 il y'a rien "sur google" les sites sont sur le web. Google ne fait que pointer sur ces sites. (Je parle du moteur de recherche)
Sauf que dans ce cas précis, ça ne renvoie que aux livres dispo chez Google Books.
Alors qu'il existe d'autres bibliothèques libres d’accès telle que Openlibrary (excellent ! )par exemple.
Tout outil a ses limites ..
 
Dernière édition:

madalena

Contributeur
Contributeur
@madalena, comme @Sanid l'indique, c'est pas le moment ou ça se retrouve sur Internet :)
C'est dans l'année de publication des livres qui contiennent les mots clés.
C'est bien sur limité aux livres numérisés par Google jusqu’à aujourd'hui, mais le nombre est déjà énorme et ça doit donner un résultat statistique assez précis.
Je l'ai indiqué mais je préfère répéter, il est important de cocher "case insensitive" selon moi.
Sinon, même en cherchant dracula on ne trouve rien. Il faudrait chercher Dracula.


salam

ok! merci..c'est mieux de répéter! lool
 

farid_h

<defunct>
Contributeur
Merci @Nalinux, je vais jetter un coup d'oeil. Pour l'instant, il fait chaud ici pret de Düsseldorf. Demain, dans les 37C; je prefere laisser mon desktop eteint le jour, parce que j'ai plusieurs HDD dedans.

Je vois que t'es de nouveau averti. :(
 
Haut