Zastanawiałeś się kiedyś jak sprawdzić starą wersję strony? Gdzie znaleźć treści, które pojawiały się na niej przed zmianami, których dokonał autor? Jak policzyć ile różnych wersji dana strona miała? Jak odnaleźć informacje, które na pewno na niej były, ale teraz zniknęły? Zwłaszcza, że wyszukiwarki nie zachowują kopii stron www, czego pewnie doświadczyłeś nie raz, kiedy skierowano Cię do nieistniejących zasobów. Tutaj więc pomoże witryna, która zajmuje się archwizacją internetu! To nie mit, to prawda, jest instytucja, która podjęła się tego karkołomnego zadania. Zresztą nie jest dziś osamotniona w działaniach, ale tym razem napiszę o jednej, najpopularniejszej chyba witrynie –
Wayback Machine był pierwszą inicjatywą związaną z archiwizacją internetu. Jej realizację rozpoczęła w 1996 r. amerykańska organizacja non-profit Internet Archive, która jest zwolennikiem otwartego i darmowego Internetu. W myśl tej zasady udostępnia więc na swoim stronach ogromne kolekcje zdigitalizowanych materiałów, w skład których wchodzą: strony internetowe (o nich za chwilę), oprogramowanie i gry komputerowe, muzyka, filmy, spektakle teatralne, audiobooki, grafiki i wiele innych materiałów. Twórca Internet Archive, Brewster Kahle jest jednym z największych krytyków polityki Google, zmierzającej jego zdaniem do monopolizacji bibliotek cyfrowych i ich komercjalizacji. Dlatego tak mocno rozwija swój flagowy projekt. Swoją drogą to bardzo ciekawa osoba – twórca kontrowersyjnej wyszukiwarki Alexa.
Ale do rzeczy – jak sprawdzić kopie archiwalną jakiejkolwiek strony.
Musimy znać dokładny adres URL poszukiwanej strony, który wpisujemy w okno wyszukiwarki
Po wyszukaniu wyświetla się oś czasu, a pod nią kalendarz dotyczący wybranego roku. W kalendarzu zaznaczono dni tzw. snapshotów czyli dni, w których roboty odwiedziły stronę i zapisały jej wersję na dany dzień. Te snapshoty mogą mieć różne kolory: czerwony, pomarańczowy, zielony i niebieski. Poprawne przeglądanie umożliwiają tylko snapshoty w kolorze niebieskim. Reszta kolorów (zielony, pomarańczowy, czerwony) – informuje, że próba snapshota była nieudana – albo nie ma zapisu strony, albo jest „wybrakowany”.
Po wybraniu konkretnej daty (snaphsota pod konkretną datą z kalendarza) wyświetla się kopia archiwalna strony. Na górze ekranu zawsze znajduje się informacja o adresie URL oraz dacie zapisu.
Pamiętać trzeba o dwóch sprawach. Po pierwsze nie wszystkie strony na świecie znajdziecie w tym archiwum. Choć ilość ich jest ogromna – na dziś jest 594 bilionów zarchiwizowanych stron – bywa, że młode bądź mało znane strony nie są odwiedzane przez roboty Internet Archive. Po drugie głębokość archiwizowania stron i podstron bywa różna – czasem jest możliwość przechodzenia ze strony głównej, na inne podstrony z tego samego czasu, ale są też przypadki, że żadna inna strona oprócz głównej nie jest zarchiwizowana i wtedy możemy tylko sprawdzić, co się na tej pierwszej – głównej stronie zmieniło. Warto też pamiętać, że strony w archiwum są „klikalne” (!) – to nie są tylko ich zdjęcia.
Jeśli temat archiwów Cię zaciekawił przeczytaj też post o Znikających zasobach sieci.
update: 04.08.2021
Ufff…. nigdy nie rozumiałam takich tekstów – ale wiem, że są bardzo potrzebne. Twój do tego dobrze się czyta. Dziękuję 🙂
Hehehe… ale nie rozumiałaś, bo były zwykle skomplikowane, czy sensu ich nie widziałaś? 🙂 Linki do ciekawych rozwiązań przydają się zwykle w najmniej spodziewanym momencie, staram się dlatego zawsze podać jakiś kontekst. Jakby co, śmiało pytaj!
Bardziej z powodu skomplikowania. Ale też nie bardzo widziałam powód. Dopiero od niedawna świadomiej podchodzę do spraw związanych ze stronami www.
Dla odzyskania/wznowienia strony internetowej z Web Archive można spróbować podany link – https://pl.archiarix.com/
Hm… ale ten link wcale nie działa! 🙁
https://pl.archivarix.com/
Zmieniłem link
Jak sprawdzić w archiwum rok 2021 r z okresu od 02 stycznia do 31 maja 2021 w portalu ogloszeniowym gratka.pl czy moje ogłpszenie było wyróżnione Czy da sie sprawdzic talie serwisy ogłoszeniowe czy tylko jest robiona screeshot pierwszej strony
Pojedynczych ogłoszeń niestety w ten sposób nie da się namierzyć. W przypadku stron ogłoszeniowych jest robiony snapshots strony głównej i pierwszego poziomu menu (z tego, co widzę ;))
Dzięki, ogromna pomoc, walczę o reklamację w jednym sklepie i udało mi się w ten sposób wykazać, że kłamią – zmienili opis produktu już po tym jak go kupiłam.
Coś podobnego! Ekstra!