skype-icon-homepage Skype : spinwave.com  téléphone 0805 69 29 89 (appel gratuit)

Content Spinning et Similarité

COMBIEN D'ARTICLES PEUT-ON GENERER A PARTIR D'UN SPIN ?

Peut-être avez-vous dejà fait appel à un prestataire qui vous aurait livré un spin et des articles produits à partir de celui-ci ? Et peut-être qu’après avoir publié une centaine de ces articles sur différents sites, de plus en plus de sites se sont mis à refuser d’en publier d’autres, détectés comme trop similaires ? Si c’est le cas, vous n’êtes pas le seul, cette mésaventure arrive systématiquement lorsqu’on fait appel à un prestataire qui ne dispose pas d’un outil spécifique pour extraire les tirages les plus éloignés, en particulier si à la base ses spins ne sont pas assez travaillés.

Profitons-en pour battre en brêche quelques idées reçues complètement fausses en ce qui concerne le content-spinning et les taux de similitude !

Les études démontrent qu’il n’est pas possible d’obtenir des milliers d’articles sur la même thématique tout en ayant un taux de similitude maximum inférieur à 10%. C’est impossible, que ce soit à partir d’un spin ou en confiant ce travail à une équipe de 50 rédacteurs qui travailleraient en parallèle.

DES CHIFFRES REALISTES

Dans notre métier, il y a beaucoup de fausses informations qui circulent, en particulier en ce qui concerne les taux de similitude. Chassons-les une bonne fois pour toutes de nos esprits : non, il n’est pas possible d’obtenir des milliers d’articles sur le même thème avec un taux de similitude maximum de 10%, que ce soit à partir d’un spin ou en rédaction classique. Même si vous faites appel à une armée de rédacteurs, ils utiliseront les mêmes mots d’un article à l’autre et au bout de quelques dizaines d’articles sur le même thème, ils finiront par se répéter.

Voici un exemple concret : sur la base d’un spin de 300 mots à phrases simples*, si on extrait 10.000 articles, on obtient un taux de similitude maximum de 26,5% entre 2 de ces 10.000 articles.

*phrases simples, doublées, triplées, quadruplées : avant de commencer à spinner, vous pouvez nous demander de créer une ou plusieurs variantes pour chaque phrase, afin de rendre le spin encore plus puissant. Ces variantes seront interchangeables, donc, puisqu’elles véhiculeront la même idée en employant des mots et des constructions de phrase différents. Exemple : si la phrase d’origine est « Il fait un temps magnifique, aujourd’hui ! » une variante de cette phrase pourrait être « Quelle belle journée, le ciel est d’un bleu si intense ! ». Même idée, mais avec des mots et une construction de phrase différents.

Comment lire ce tableau ? Dans la colonne de gauche, vous avez les taux de similitude maxi, par incréments de 1%. En fonction du taux de similitude maximum que vous souhaitez, le tableau vous indique combien d’articles on peut obtenir à partir d’un tirage de 1.000 articles, 2.000 articles, etc. jusqu’à 30.000 articles. Donc si on choisit par exemple 26% de taux de similitude maximum, on voit que l’on peut extraire 9.186 articles sous ce taux à partir d’un tirage de 30.000 articles.

A l’inverse, si on veut les 1.000 articles les plus éloignés, on regarde alors dans la dernière colonne, on repère le chiffre 1.027 et on peut voir qu’il correspond à un taux de similitude maximum de 23%.

Comme vous pouvez le voir sur ce tableau, impossible d’arriver à 10% de taux de similitude maxi avec un spin simple. Mais en se fixant un seuil de similitude de 25% on arrive tout de même à 4.782 articles. Sachant qu’en rédaction classique, un article coûte entre 10 et 30 €, 4.782 articles pour 600 € c’est très rentable,  ça nous amène à un coût unitaire de 0,12 € pour des articles d’une qualité comparable à ceux issus de la rédaction classique !

Voici maintenant les résultats obtenus sur un spin 300 mots à 2 variantes par phrase (la phrase originale + 1 variante) :

Voici maintenant les résultats obtenus sur un spin 300 mots à 3 variantes par phrase (la phrase originale + 2 variantes) :

Voici maintenant les résultats obtenus sur un spin 300 mots à 4 variantes par phrase (la phrase originale + 3 variantes) :

On voit sur ce tableau que l’on peut obtenir 11.711 articles avec un taux de similitude maxi de 16%.

Notez que si vous embauchez 100 rédacteurs et que vous leur demandez de rédiger 90 articles chacun sur le même sujet, les taux de similitude maximum seront nettement supérieurs à 15%. En faisant appel à nos services, vous contrôlez le taux de similitude maximum entre 2 articles et c’est quelque chose qui ne se fait pas en rédaction classique car les gens pensent, -à tort-, que les problèmes de similitude ne se posent pas lorsqu’on commande des articles « uniques » à un bataillon de rédacteurs. Or, en passant commande de plusieurs centaines d’articles sur le même thème auprès d’une équipe composée de plusieurs dizaines de rédacteurs, nous avons pu constater que les taux de similitude maximum oscillaient entre 18 et 37% !

Voici enfin les résultats obtenus sur un spin 300 mots à 4 variantes par phrase (la phrase originale + 3 variantes) avec l’utilisation de variables remplacées par des valeurs au moment des tirages :

On voit sur ce tableau que l’on peut obtenir plus de 51.000 articles avec un taux de similitude maxi de 15% !

Les tableaux d’analyses ci-dessus se rapportent à des cas réels mais ils n’impliquent pas que l’on obtiendra forcément les mêmes résultats d’un article à un autre, même s’il s’agit de deux articles comportant le même nombre de mots avec les mêmes options. En effet, d’une thématique à l’autre, il y a des termes que l’on ne peut pas éviter, des éléments du jargon propre à la thématique par exemple, et ces éléments peuvent brider les possibilités de variation. Mais dans l’ensemble, on peut dire que les écarts sont relativement faibles, le delta maximum que nous ayons pu observer étant de l’ordre de 20%. Donc là où l’un des tableaux ci-dessus démontre que l’on pouvait obtenir un taux de similitude de 25%, ce taux sera peut-être de 30% sur certains textes.

Les taux de similitude des articles dits « uniques », commandés auprès d’un bataillon de rédacteurs, ne sont pas forcément meilleurs qu’en faisant appel au content spinning.

TIRAGE DES ARTICLES LES PLUS ELOIGNES

Pour assurer le tirage des articles les plus éloignés nous nous appuyons sur un outil complexe et puissant, basé sur les 4 brevets déposés par Google pour calculer le taux de similitude entre 2 textes. Cet outil est déployé sur une infrastructure informatique comprenant 20 processeurs quadri-cœurs et 320 Go de RAM. Nous procédons tout d’abord à un tirage aléatoire de 30.000, 50.000, 100.000 voire 200.000 articles (cela dépend du projet et de la demande du client) et l’outil déclenche alors des comparaisons croisées entre tous ces tirages. Il en extrait les articles les moins similaires, en fonction des instructions qu’on lui donne : soit les x articles les plus éloignés, soit tous les articles ayant un taux de similitude de x % maximum. C’est à vous de choisir le mode de filtrage qui vous convient et la valeur de x.