Vous entendez parler de social data, mais qu’est-ce que c’est au juste ? La donnée présente sur les réseaux sociaux ? Pas seulement. La social data c’est un peu plus que cela. Et même beaucoup plus. Et en plus, elle est très spéciale.
Une data générée par les utilisateurs de façon active
La social data regroupe l’ensemble des données générées par les utilisateurs eux-mêmes, de façon active. Ce sont des données que l’on appelle également données UGC (User Generated Content).
La social data n’inclut pas les données générées par les utilisateurs de façon passive, comme par exemple les données de navigation suite à la visite d’un site web. La social data n’inclut pas le contenu généré par les marques ou les entreprises. En revanche, les commentaires de ces contenus sont des données générées par les utilisateurs.
Voici une liste non exhaustive et des exemples de médias basés sur des contenus générés par les utilisateurs.
- Les réseaux sociaux: Facebook, Tencent QZone, Google +, Twitter, Baidu Tieba, Sina Weibo, Tumblr, Snapchat, Yik Yak, Whisper, Ello.
- Les réseaux sociaux professionnels: Linkedin, Viadeo.
- Les plateformes vidéo: Youtube, Dailymotion, Viméo.
- Les plateformes d’images et de photos: Instagram, Pinterest, Flickr.
- Les réseaux sociaux de diaporama: Slideshare.
- Les réseaux sociaux de questions/ réponses: Quora, Ask, Yahoo Questions.
- Les encyclopédies: Wikipédia.
- Les blogs.
- Les forums: Doctissimo, Aufeminin, Jeux-video.com.
- Les commentaires d’articles de presse et de blogs.
- Les commentaires du contenu posté sur les réseaux sociaux (commentaires des vidéos Youtube, commentaires des posts Facebook).
- Les commentaires sur les sites de vente en ligne (Airbnb, Amazon, Booking, Sephora).
- Les avis consommateurs sur des plateformes d’avis consommateurs (Ciao, Foursquare, Tripadvisor, Truspilot, Yelp).
L’explosion de la social data
Si l’explosion des données numériques n’est plus à démontrer, une partie de ces données sont générées par les utilisateurs. Il est impossible de connaître précisément le nombre de données générées par les utilisateurs au total sur le web. Voici quelques chiffres qui permettent de prendre compte de l’ampleur de la croissance de la social data.
- Sur les 3,025 milliards d’internautes à travers le monde, 2,060 milliards sont actifs sur les réseaux sociaux, soit 68% des internautes et 28% de la population mondiale. Les internautes actifs passent ainsi 2 heures par jour sur les réseaux sociaux (moyenne mondiale). Les internautes français passent un peu moins de temps sur les réseaux sociaux: 1h30 par jour en moyenne (Source: Blog du modérateur).
- Facebook, le plus grand réseau social, compte 1,49 milliard d’utilisateurs actifs mensuels (dont 30 millions en France). Chaque minute, 1,8 millions de likes sont distribués. 350 millions de photos sont ajoutées chaque jour (Source: Blog du modérateur).
- Twitter compte 304 millions d’utilisateurs (dont 2,3 millions en France). 500 millions de tweets sont envoyés chaque jour (Source: Blog du modérateur).
- Sur Instagram, 70 millions de photos partagées chaque jour (Source: Blog du modérateur).
- Le nombre de blogs a été estimé à plus de 200 millions dans le monde en 2013, avec 3 millions de nouveaux blogs créés chaque mois.(Source: Blog Acti)
- Le nombre d’avis sur Tripadvisor, le plus grand site d’avis de voyage au monde, compte 250 millions d’avis et opinions de voyageurs. 160 nouvelles contributions sont déposées chaque minute (Source: Tripadvisor).
- 30 000 nouveaux messages sont postés chaque jour sur le plus gros forum français Doctissimo.
Des données non structurées
Les données générées par les utilisateurs sont principalement des données non structurées. Les données non structurées sont “des données représentées ou stockées sans format prédéfini. Les données non structurées sont typiquement constituées de texte brut, mais peuvent également contenir des dates, des nombres et des faits” (Source: Wikipédia).
La data non structurée générée existe sous de nombreuses formes: des messages courts ou longs, des textes entiers, du texte avec ou sans fautes d’orthographes, des abréviations, dans toutes les langues (même en klingon).
Tout l’enjeu de la donnée non structurée réside dans cette nature: comment redonner de la structure à cette donnée pour la rendre intelligible et utile pour générer de l’information.
A noter qu’une petite partie des données générées par les utilisateurs sur internet sont des données structurées. Par exemple: le nombre de likes d’un post sur Facebook, le nombre de commentaires sur un hôtel dans Tripadvisor, le nombre d’étoiles d’un produit sur Amazon.
Nous verrons dans les prochains épisodes de la social data à quoi elle peut servir pour générer de la connaissance client.
Laisser un commentaire
Participez-vous à la discussion?N'hésitez pas à contribuer!