Publicité
Ils disent que sur Internet, rien ne s'en va Rien n'est supprimé d'Internet, jamais. Voici comment.Ces gens essaient de tout sauvegarder sur le Web. C'est un gros travail, mais vous pouvez aider. Lire la suite .
C'est vrai, pour le contenu populaire qui est sans cesse partagé et remixé. Mais ce genre de bonbons viraux n'est que la pointe d'un très gros iceberg. Sous la surface des mèmes et des célébrités nues se cache des pétaoctets sans fin de données trop ennuyeuses pour l'immortalité. Photos de mariage, essais universitaires, vidéos maison 10 conseils simples pour donner un aspect professionnel aux vidéos personnellesQue vous enregistriez quelque chose à publier en ligne ou à capturer des souvenirs à conserver, ces conseils vous aideront à créer de meilleures vidéos. Lire la suite , anciens e-mails - la plupart de nos données sont dans cette catégorie, et elles peuvent être éphémères de manière inquiétante.
L'une des principales leçons de la physique est que la thermodynamique déteste vos tripes
. Les données informatiques ne font pas exception. La mémoire flash perd sa charge moins d'une décennie. Même dans des conditions idéales, les disques durs magnétiques ne durera pas plus d'une dizaine d'années. CD, dans des conditions idéales, durer environ dix ainsi que. La bande magnétique, la référence en matière de stockage de données à long terme pour l'industrie, cesse d'être lisible après trente à cinquante ans.Comment meurent les données numériques
Cela pose un problème, car cela nécessite un effort de stockage des données. Tout ce qui n'est pas assez intéressant pour être activement préservé d'un disque dur à l'autre, service cloud vers service cloud, cesse simplement d'exister. 99% de nos données sont simplement jetées dans des décharges et des sociétés Internet défaillantes. Même pour les données dont nous nous soucions, le pronostic n'est pas bon.
Considérez les problèmes posés par la compression des données. Afin d'économiser de l'espace de stockage et de la bande passante, nous utilisons souvent des formats de fichiers (comme .jpg et .mp4) qui compresser leur contenu Comment fonctionne la compression de fichiers?Comment fonctionne la compression de fichiers? Apprenez les bases de la compression de fichiers et la différence entre la compression avec perte et la compression sans perte. Lire la suite en quelque sorte. Les algorithmes de compression utilisés sont de deux types généraux: sans perte et avec perte.
- Formats sans perte éliminer la redondance, identifier les morceaux du fichier qui se répètent et les remplacer par des descriptions plus courtes. Cela vous permet de reconstruire le fichier d'origine parfaitement plus tard, mais ne peut compresser que les données (consultez le lien ci-dessus pour une métaphore visuelle du fonctionnement de ces algorithmes).
- Formats avec perte sont beaucoup plus puissants, mais viennent avec des compromis majeurs. Les formats avec perte fonctionnent en supprimant certaines des informations sur le fichier d'origine, afin de pouvoir encoder le fichier dans moins d'espace. Ces algorithmes ne peuvent pas reconstruire avec précision le fichier d'origine, mais ils sont réglés de telle sorte que les informations qui sont supprimées tendent à être des informations que les gens ne remarquent pas. Ces algorithmes peuvent obtenir une réduction spectaculaire de la taille du fichier avec seulement une petite baisse de la qualité visuelle et sont utilisés pour presque tous les fichiers audio, vidéo et images.
C'est généralement une bonne chose: cela nous permet de télécharger un contenu de bien meilleure qualité beaucoup plus rapidement qu'il ne serait possible si nous étions bloqués à l'aide de formats sans perte. Cependant, il y a un côté sombre aux formats avec perte, et cela ressemble à ceci:
Lorsque vous recodez un fichier dans un format avec perte, les données sont perdues. La conversion d'un format avec perte en un autre format avec perte double les dégâts. La vidéo ci-dessus a été générée par des conversions répétées entre deux formats avec perte plusieurs centaines de fois. À la fin, l'homme qui parle s'est dégradé en un cauchemar cauchemardesque de couleurs et de bruit. Ce processus est appelé décroissance de génération.
À mesure que les fichiers voyagent sur Internet, copiés et sauvegardés, remixés et réencodés, cette perte de données s'accumule et les fichiers peuvent être fortement dégradés. À mesure que nous améliorons les encodages avec perte et que les formats de fichiers moins efficaces tombent en disgrâce, les versions originales peuvent être perdues à jamais.
Espérons que les studios de cinéma se soucient suffisamment de conserver une version codée sans perte de Cool Hand Luke et Douze hommes en colère quelque part, afin que nous ayons toujours des versions de haute qualité de ces fichiers. Cependant, ce n'est certainement pas le cas de la plupart des médias. Vos photos de bébé numériques et vos vidéos personnelles se décomposeront lentement à mesure que vous les transcoderez de formats obsolètes en de nouveaux.
Il en va de même pour le contenu en ligne. Les originaux de la plupart des vidéos YouTube n'existent probablement plus. Lorsque YouTube cesse d'exister et que ces vidéos sont migrées vers une nouvelle plate-forme, toutes bénéficieront d'un succès de qualité du processus de ré-encodage. Quelques générations de plateformes de partage de vidéos sur la route, et même les vidéos qui restent suffisamment populaires pour être copiées de plateforme en plateforme seront dégradées de manière inacceptable.
Vint Cerf, Le principal évangéliste d'Internet de Google, a longuement parlé des dangers de jeter toutes ces informations aussi cavalièrement que nous. Pendant une entrevue, Cerf a décrit comment en 2005, l'historienne Doris Goodwin a écrit un livre sur Abraham Lincoln et étudié ses habitudes en visiter des bibliothèques à travers le pays, déterrer ses vieilles lettres et reconstituer les conversations incarner. Cerf note qu'aujourd'hui, "ces lettres seraient des courriels et les chances de les trouver seront infiniment petites dans 100 ans".
Ce type de dégradation des données posera un énorme problème aux futurs historiens. Le XXIe siècle pourrait bien devenir un trou béant dans les archives historiques - une ère sombre numérique.
Pouvons-nous faire mieux?
Une solution à ce problème consiste à développer un stockage d'archivage qui peut durer beaucoup plus longtemps avec moins de maintenance, afin de faciliter l'archivage des informations à très long terme. Un certain nombre de personnes intelligentes travaillent sur ce problème, et nous avons rassemblé les meilleures données disponibles sur leurs technologies.
Supposons donc que vous souhaitiez sauvegarder un fichier pour vraiment Longtemps. Comment devez-vous procéder?
~ 50 ans
Solution: bande magnétique
Si vous n'avez besoin de stocker vos données que pendant quelques décennies à la fois, votre meilleur pari est probablement une bonne bande magnétique à l'ancienne (du type utilisé par les services informatiques du monde entier). Stocké sous terre dans un environnement froid, sec et à blindage magnétique, avec un bon degré de redondance, la bande magnétique est relativement stable par rapport aux CD ou disques durs conventionnels, et seulement environ trois fois plus cher que les disques durs bas de gamme (environ 3,0 $ par gigaoctet).
~ 100 ans
Solution: disques optiques de qualité archive
Les CD conventionnels sont un moyen terrible de stocker des données: le support en aluminium ou en argent commence à s'oxyder dès que vous ouvrez l'emballage, et une faible qualité de construction peut entraîner d'autres problèmes. Ne vous attendez pas à ce qu'ils durent plus de quelques années - quelques heures, si vous les laissez accidentellement au soleil. Cependant, certains CD et DVD sont fabriqués avec un support en or et une qualité de construction beaucoup plus élevée. L'or ne s'oxyde pas, ce qui signifie que ces disques peuvent durer très longtemps. Il est difficile de savoir exactement combien de temps, car nous ne les avons pas depuis très longtemps, mais nous pouvons obtenir une bonne estimer en prenant les disques, en étant vraiment méchant avec eux, puis en essayant de récupérer les données: c'est appelé un test de vieillissement accéléré.
Sur la base de ces tests, les fabricants revendiquent une durée de vie dans la gamme 1-3 siècle. Pour une densité de données maximale, vous pouvez vous procurer des rayons bleus d'archivage pendant environ 2,5 gigaoctets par dollar, avec une durée de vie prévue de 200 ans. Les tests de vieillissement accéléré ne sont pas sûrs, mais il est probablement sûr de compter sur eux pendant un siècle environ. En prime, contrairement à la bande magnétique, ils ne nécessitent aucun équipement spécial pour lire et écrire, donc les coûts de démarrage sont minimaux.
~ 1000 ans
Solution: disques M
D'accord, oubliez ce non-sens du "siècle", soyons sérieux. Pour vous donner une idée de l'échelle de temps, il y a mille ans, Earl Eric Haakonsson a interdit berserkers en Norvège pour la première fois. Voilà ces gars gravés sur une plaque de bronze découverte au 20ème siècle:
Jusqu'à récemment, il n'existait pas de bonnes options industrielles pour ce type d'échéance. Cependant, récemment, une option intéressante a émergé, appelée «disque M». Il s’agit de DVD d’archives constitués d’une épaisse couche Composite minéral "semblable à de la pierre" conçu pour être gravé par des brûleurs spéciaux (bien qu'ils puissent être lus par un DVD normal disques). Ils sont d'une robustesse absurde et devraient survivre pendant au moins mille ans. C’est une affirmation ambitieuse, mais la société a des recherches solides (y compris une étude du département américain de la Défense) pour le confirmer.
Ces disques sont même raisonnablement bon marché, 5,7 gigaoctets par dollar, mais vous aurez également besoin d'un brûleur spécial. Si vous souhaitez sérieusement stocker un lot de données depuis longtemps, les disques M sont clairement gagnants.
~ 10 000 ans
Solution: graver des métaux extrêmement stables
C'est là que nous commençons à nous éloigner un peu des sentiers battus. À l'heure actuelle, aucun format lisible numériquement ne peut survivre près de dix mille ans. Cela signifie que toutes les données archivées pour cette durée vont être très difficile à récupérer Qu'est-ce que la récupération de données et comment ça marche?Si vous avez déjà subi une perte de données importante, vous vous êtes probablement interrogé sur la récupération de données - comment cela fonctionne-t-il? Lire la suite . À certains égards, ça va - ce n'est pas comme si les lecteurs de DVD existaient dans dix mille ans de toute façon.
Alors, comment stockez-vous les données aussi longtemps? La réponse est que les seuls matériaux qui peuvent survivre à ce genre d'échéances sont les métaux et les pierres précieuses chimiquement stables. Cette technologie a déjà été utilisée dans la pratique pour les enregistrements Voyager - disques d'or, gravés avec des informations représentant l'audio et les images, qui ont été lancés à bord de la sonde Voyager. La sonde est en sortant du système solaire afin de fournir un dossier durable de l'humanité pour les étrangers à trouver un jour.
Une approche moderne du problème est la nano-lithographie. Une entreprise appelée Norsam a adapté des techniques de lithographie développées à l'origine pour la gravure de semi-conducteurs, et peut les utiliser pour graver des motifs fins sur des surfaces comme le diamant ou le nickel. La résolution est décente (environ 165 gigaoctets par disque de 12 centimes), et c'est aussi pratiquement indestructible. Stockés en toute sécurité, ces disques devraient durer plusieurs milliers d'années et résister aux EMP, à la plupart des incendies et à l'effondrement de la civilisation humaine. Les informations sur les prix ne sont pas facilement disponibles, mais «cher» est une très bonne estimation.
L'une des premières applications de cette technologie a été la création de plaques modernes «Rosetta Stone», en titane, pour être stockées dans des endroits sûrs autour du monde, contenant environ des milliers de pages de texte, traduites entre plusieurs langues, pour fournir une référence pour les futurs historiens si certaines langues modernes sont perdu. Comme avantage secondaire, les disques ont également l'air incroyablement cool:
Plus de 100 000 ans
Soyons clairs ici: si vous magasinez pour le stockage informatique et que le titane nano-gravé est tout simplement trop éphémère pour vous, alors votre horizon de planification me terrifie. Il y a cent mille ans, les premiers hommes ont commencé à s'aventurer du continent africain vers l'Europe. Si vous vous souciez vraiment de la survie de vos données numériques aussi loin dans le futur, alors vous avez quitté le ken des simples mortels, et probablement aussi la raison et le bon sens.
Cela ne veut pas dire que vous n'avez pas d'options.
Solution: ADN fossilisé
L'un des avantages de la révolution biotechnologique est qu'il existe de nombreuses entreprises qui créer de l'ADN personnalisé pour vous sur une chaîne de paires de bases que vous fournissez, en ligne, pour une somme marginale. Chaque paire de base a quatre combinaisons possibles, qui peuvent stocker deux bits. Les données peuvent ensuite être lues en séquençant ces gènes à une date ultérieure, en utilisant une variété de techniques. Cela permet à l'ADN de servir comme une sorte de stockage de données exotiques. Maintenant, en soi, vos chaînes d'ADN personnalisées sont de courte durée et se décomposeront chimiquement à température ambiante dans quelques années. Il existe plusieurs façons de prolonger sa durée de vie.
Vous pouvez épisser vos données dans l'ADN d'un organisme à longue durée de vie, comme le pin Bristlecone du Grand Bassin (qui est connu pour vivre plus de cinq mille ans). Parce que ces arbres peuvent se reproduire, votre principale préoccupation devient alors de les protéger des nombreux incendies à grande échelle, impacts de météores et éruptions volcaniques qui vont se produire dans la avenir. Vous pourriez être en mesure d'obtenir vos données pour survivre pendant quelques dizaines de milliers d'années en plantant plusieurs forêts d'arbres d'archives dans des endroits sûrs et éloignés; mais - bien sûr - vous n'êtes pas intéressé par de si petites pommes de terre.
Afin de vraiment retirer la valeur de votre argent du stockage d'ADN, vous devez fixer chimiquement l'ADN pour le protéger contre les changements chimiques et les pannes radioactives. Les chercheurs ont trouvé un moyen de imprégné d'ADN dans du verre fondu afin de créer un «fossile synthétique» qui protégera l'ADN pendant des périodes extrêmement longues. Le processus est basé sur la fossilisation naturelle et a été développé après la révélation qu'il est souvent possible d'extraire l'ADN intact de fossiles vieux de millions d'années. Avec une bonne utilisation de codes correcteurs d'erreurs et redondance, il n'y a aucune raison pour laquelle vous ne pourriez pas conserver de nombreux gigaoctets d'informations pendant des millions d'années à un chiffre.
En termes de rentabilité: si vous êtes préoccupé par le prix, cette méthode de stockage n'est pas pour vous. Il ne s'agit en aucun cas d'un processus commercial. Vous allez dépenser au moins des centaines de milliers de dollars pour fabriquer et préserver l'ADN. Ce n'est pas une entreprise pour les faibles de cœur. C'est quand même une option, et si vous voulez vraiment vous assurer que le données les plus importantes sur Internet est toujours disponible longtemps après que l'humanité est morte et disparue, il est en votre pouvoir de le faire.
Êtes-vous préoccupé par l'âge sombre du numérique? Quelles données souhaitez-vous conserver pour les générations futures? La discussion commence dans les commentaires!
Crédits image: lecteur usb cassé Via Shutterstock, "Berzerkers», Par Wikimedia,« Cutaway », [URL cassée supprimée] par M-Disc,«Rosetta», Par la Long Now Foundation,«CD arc-en-ciel», Par Wikimedia,«Bande magnetique», Par Wikimedia,«Capsule temporelle», Par Wikimedia,«Record Voyager», Par Wikimedia,«Fossile», Par Wikimedia
Écrivain et journaliste basé dans le sud-ouest, André est assuré de rester fonctionnel jusqu'à 50 degrés Celsius et est étanche jusqu'à une profondeur de douze pieds.