https://frosthead.com

La Bibliothèque du Congrès cessera d'archiver Twitter

En 2010, personne ne s'attendait à ce que le centre du discours politique des États-Unis passe bientôt à Twitter, l'application de messagerie sociale qui offre aux utilisateurs la possibilité de «micro-bloguer» des messages de 140 caractères (bien que cela ait récemment été relevé à un niveau modéré). 280 personnages). À l'époque, Twitter envoyait à la Bibliothèque du Congrès chaque tweet public jamais envoyé, remontant même à ses premiers jours d'existence en 2006. Après 12 années consacrées à toutes les prises chaudes, querelles fast-food, racistes, retweet raciste, Russe bot et bizarre rêverie de la star de Twitter, la bibliothèque en a assez. Harper Neidig at The Hill rapporte que le COL a annoncé hier qu'après le 31 décembre, il ne collectionnerait plus que les tweets qu'il jugerait d'importance historique.

Dans un livre blanc sur le sujet, la bibliothèque cite plusieurs raisons du changement. Premièrement, le volume de tweets a considérablement augmenté depuis la signature d’un accord avec Twitter il ya sept ans, ce qui alourdit la gestion de la collection. La nature des tweets a également changé. La bibliothèque ne reçoit que les textes des tweets et ne reçoit aucune image, vidéo ou gif animé qui leur soit associé. Au fil du temps, comme cela est devenu une partie importante de la culture Twitter, la collection a perdu beaucoup de contenu et de contexte.

La bibliothèque cite également l’extension récente de la limite du nombre de caractères tweet pour expliquer le changement, expliquant que Twitter est en train de se transformer et qu’il pourrait changer davantage à l’avenir. «La bibliothèque ne collecte généralement pas de manière exhaustive. Compte tenu de l'orientation inconnue des médias sociaux lors de la planification du cadeau, la bibliothèque a fait une exception pour les tweets publics », explique la bibliothèque dans le journal. «Les médias sociaux étant désormais établis, la bibliothèque aligne davantage ses pratiques de collecte sur ses politiques de collecte.»

Actuellement, les archives de Tweets sur 12 ans ne sont pas accessibles au public et le COL n’a pas d’horaire actuel pour savoir quand elles seront disponibles. Ils disent maintenant que cela servira de cliché des 12 premières années d'une nouvelle forme de communication sociale, comme si la bibliothèque avait envoyé tous les télégraphes jamais envoyés au cours des 12 premières années de cette technologie.

Le déménagement n'était pas complètement à l'improviste. Andrew McGill de The Atlantic explique que le COL n'avait ni les ressources ni l'expérience requises pour le projet et qu'aucun ingénieur ne travaillait à plein temps sur les tweets. La bibliothèque a plus ou moins jeté des lots de tweets non traités, 500 millions produits chaque jour, dans un serveur pour être traités ultérieurement. «C’est un avertissement au moment où nous commençons à traiter des données massives - nous devons faire attention à ce que nous nous engageons», a déclaré Michael Zimmer de l’Université du Wisconsin-Milwaukee à McGill. «Lorsque les bibliothèques ne disposaient pas des ressources nécessaires pour numériser des livres, seule une entreprise de la taille de Google était en mesure d'y investir de l'argent et des corps. Et c'est peut-être là que la Bibliothèque du Congrès est bloquée. "

En 2010, le nombre de tweets représentait environ un dixième du trafic actuel, et la fonction de «retweet» était encore nouvelle et les fils de discussion n'étaient pas actifs. Au fil du temps, toutefois, les tweets intégrés aux discussions, aux photos et aux vidéos, ainsi que la nouvelle limite de caractères, ont rendu chaque tweet plus volumineux et le volume de données quotidiennes époustouflant. Selon McGill, en 2013, la bibliothèque avait déjà admis ses difficultés et déclaré qu'une seule recherche dans les archives de tweet de 2006 à 2010 prendrait 24 heures avec le système actuel du COL.

Dans l'accord initial, la bibliothèque avait accepté d'embargoner les tweets pendant six mois et de supprimer tous les tweets supprimés et les tweets privés. Les chercheurs étaient enthousiastes à l'idée d'accéder aux données, mais ont été déçus par le manque d'accès du public. Certains espèrent néanmoins que la bibliothèque finira par trouver un moyen de rendre les Tweets accessibles, ce qui pourrait être très utile aux sociologues, psychologues, politologues et autres chercheurs.

«Je ne suis pas titulaire d'un doctorat, mais je trouve ahurissant de penser à ce que nous pourrions peut-être apprendre de nous-mêmes et du monde qui nous entoure grâce à cette profusion de données», a déclaré Matt Raymond, ancien directeur des communications du LOC, lors de la conclusion du partenariat. annoncé. "Et je suis certain que nous apprendrons des choses qu'aucun de nous ne peut même concevoir."

Même si nous n'avons pas d'archives à parcourir, Twitter nous a tout de même appris beaucoup de choses. Les gens ordinaires peuvent être plus hilarants que les meilleurs humoristes. Ils peuvent aussi être abominablement stupides. Les nazis existent toujours et n'ont aucun problème à exprimer leurs pensées horribles. Les trolls vont gâcher toute conversation, même banale. Et bien sûr, la brièveté est l'âme de l'esprit. Et sans intelligence dans la même mesure.

La Bibliothèque du Congrès cessera d'archiver Twitter