Archive.today - Archive.today
Скриншот archive.today | |
Тип сайта | Веб-архивирование |
---|---|
Доступно в | Многоязычный |
URL |
|
Коммерческий | Нет |
Постановка на учет | Нет |
Запущен | 2012 |
archive.today (ранее archive.is) является архив сайта в котором хранятся снимки веб-страниц.[1] Он извлекает по одной странице за раз, аналогично WebCite размером менее 50 МБ каждый, но с поддержкой JavaScript -тяжелые сайты, такие как Карты Гугл и прогрессивные веб-приложения Такие как Twitter.
Archive.today использует безголовый просмотр чтобы записать, какие встроенные ресурсы необходимо захватить, чтобы обеспечить высокое качество сувенир, и создает PNG изображение, чтобы обеспечить статическую и неинтерактивную визуализацию представления.[2]
Функции
Функциональность
Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей.[3][4][5]С самого начала Archive.Today поддерживает сканирование страниц с хеш-бэнг URL.[6]
Archive.today записывает только текст и изображения, исключая видео, xml, rtf, электронная таблица (xls или же оды ) и другие нестатический содержание. Он отслеживает историю сохраненных снимков, возвращая пользователю запрос на подтверждение перед добавлением нового снимка уже сохраненного Интернет-адреса.[7]
Страницы захватываются с шириной окна браузера 1024 пикселей. CSS конвертируется в в соответствии CSS, удаление адаптивный веб-дизайн и селекторы, такие как : hover
и : active
. Контент, созданный с использованием JavaScript в процессе сканирования появляется в замороженном состоянии.[8]HTML класс имена сохраняются внутри старый класс
атрибут.
Когда текст выбран, апплет JavaScript генерирует Фрагмент URL видно в браузере Строка URL который автоматически выделяет эту часть текста при повторном посещении.
Веб-страницы не могут быть дублированный из archive.is к web.archive.org в качестве резервное копирование второго уровня, поскольку archive.is делает исключение для Wayback Machine[Почему? ][9] и не сохраняет свои снимки в формате WARC. Обратное - от web.archive.org к archive.is-возможно,[10][циркулярная ссылка ] но копия обычно занимает больше времени, чем прямой захват. Некоторые веб-сайты удаляются из Интернет-архив объявления задним числом или заблокированы для сохранения из-за их robots.txt файл, но Archive.today не использует его.[нужна цитата ]
Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *
как подстановочный знак. Пара кавычки адресовать поиск к точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как инстинктивно оператор ограничивает его определенным интернет-доменом.[11]
После того, как веб-страница заархивирована, она не может быть удалена напрямую любым пользователем Интернета.[12]
При сохранении динамический список, в окне поиска archive.today отображается только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу).[13] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений.[нужна цитата ]
Функция поиска поддерживается Google CustomSearch. Если это не дает результатов, archive.is пытается использовать Яндекс поиск.[нужна цитата ]
Если страница уже была заархивирована, archive.is просит пользователя подтвердить архивирование новой ревизии вместо того, чтобы немедленно ее архивировать.[нужна цитата ]
При загрузке страницы список URL-адресов отдельных элементов страницы среди размеров их содержимого, HTTP-статусы и Типы MIME Показано. Этот список можно просмотреть только в процессе сканирования.[нужна цитата ]
Можно загрузить заархивированные страницы в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, когда Archive.Today изменил свой браузер с PhantomJS к Хром.[14]
С июля 2013 года archive.today поддерживает Memento Project интерфейс прикладного программирования (API).[15][16]
История
Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is.[17] В январе 2019 года он начал заменять домен archive.is на зеркало archive.today.[18]
Доступность по всему миру
Австралия
В марте 2019 года сайт был заблокирован на полгода несколькими Австралийский интернет-провайдеры после Расстрел мечети Крайстчерч в попытке ограничить распространение видеозаписи нападения.[19][20]
Китай
В соответствии с Большой пожар.org, archive.today заблокирован в Китае с марта 2016 года,[21] archive.li с сентября 2017 г.,[22] и archive.fo с июля 2018 года.[23]
Финляндия
21 июля 2015 года операторы заблокировали доступ к услуге для всех Финский IP-адреса, заявив на Twitter что они сделали это, чтобы избежать эскалации спора, который они предположительно имели с финским правительством.[24]
Россия
В Россия возможен только HTTP-доступ; HTTPS-соединения заблокированы.[25][26]
Мировой
Archive.today в настоящее время блокирует запросы от Cloudflare рекурсивный преобразователь DNS, 1.1.1.1.[27]
Кроме того, с конца 2018 года Archive.today внедрил ограничение данных ограничение, предположительно для защиты от атаки отказа в обслуживании. Отдельные пользователи могут архивировать и / или извлекать только приблизительно от 10 до 20 мегабайт данных в день. После достижения этого ограничения их веб-сервер блокирует отдельного пользователя. айпи адрес больше не отвечая.[нужна цитата ]
Смотрите также
- Цифровое сохранение
- Интернет-архив
- Ссылка гниль
- Википедия: Ссылка гниль
- Perma.cc
- Wayback Machine
- Веб-архивирование
- WebCite
Рекомендации
- ^ Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is». Гаки. В архиве с оригинала 12 апреля 2019 г.. Получено 13 июн 2015.
- ^ Брюнель, Джастин Ф .; Келли, Мэт; Weigle, Michele C .; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на возможность архивирования» (PDF). Международный журнал электронных библиотек. 17 (2): 95–117. Дои:10.1007 / s00799-015-0140-8. S2CID 8433375. В архиве (PDF) с оригинала 27 мая 2019 г.
- ^ Даскалеску, Дан (18 февраля 2013 г.). "Архивирование веб-страниц - Wiki Дэна Даскалеску (обзор)". Wiki.dandascalescu.com. Архивировано из оригинал 22 сентября 2013 г.. Получено 3 октября 2013.
- ^ Коблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate, пожалуйста, прекратите воровать наше дерьмо». Материнская плата. В архиве с оригинала 27 мая 2019 г.. Получено 22 марта 2017.
Веб-сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
- ^ "archive.is/faq". archive.is. Получено 15 февраля 2019.
- ^ «Домашняя страница Archive.is в 2012 году». Получено 30 ноября 2011.
| архив-url =
неверно сформирован: отметка времени (помощь) - ^ "Пример истории снимков на archive.is".
- ^ Сгенерированная JavaScript анимация загрузки Dailymotion видео появляясь в замороженном состоянии
- ^ . 1 июля 2020 г. https://web.archive.org/web/20200701060208/http://archive.fo/19981202230410/http://google.com/. Архивировано из оригинал 1 июля 2020 г. Отсутствует или пусто
| название =
(помощь) - ^ «Пример: страница сохранена из веб-архива в Archive.is». Архивировано из оригинал 20 мая 2013 г.. Получено 23 октября 2019.
- ^ Например, строка insite: https://en.wikipedia.org "World Cup" возвращает "World + Cup" / снимки по теме
- ^ "Некоторые часто задаваемые вопросы". archive.is блог. 24 января 2013 г. В архиве из оригинала 26 сентября 2013 г.. Получено 12 ноября 2018.
- ^ "Пример динамического списка, полученного Worldcat".
- ^ «Блог Archive.is». 17 июля 2020. В архиве из оригинала 3 октября 2020 г.
- ^ Нельсон, Майкл Л. (9 июля 2013 г.). "Archive.is поддерживает Memento". Обновления исследований и преподавания. Группа исследования веб-науки и электронных библиотек в Университет Старого Доминиона. В архиве из оригинала 27 июля 2013 г.. Получено 17 сентября 2013.
- ^ "archive.is". Информация протокола Memento. Мементо Девелопмент Групп. Архивировано из оригинал 15 сентября 2013 г.. Получено 17 сентября 2013.
- ^ «Почему вы изменили URL-адрес с« archive-today »на« archive-is »?». Блог Archive.is. 3 мая 2015. В архиве из оригинала на 1 июня 2015 г.. Получено 6 января 2019.
- ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» (Твитнуть). В архиве из оригинала 6 января 2019 г. - через Twitter.
- ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают беззаконную цензуру в Интернете». Частный доступ в Интернет. 19 марта 2019 г.. Получено 20 марта 2019.
- ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видеоролики, снятые в Крайстчерче». Gizmodo Австралия. 19 марта 2019. В архиве с оригинала 18 мая 2019 г.. Получено 20 марта 2019.
- ^ "archive.is на 100% заблокирован в Китае". Анализатор GreatFire. 12 августа 2018. В архиве с оригинала от 12 августа 2018 г.
- ^ "archive.li на 100% заблокирован в Китае". Большой анализатор огня. 12 августа 2018. В архиве с оригинала от 12 августа 2018 г.
- ^ "archive.fo на 100% заблокирован в Китае". Большой анализатор огня. 12 августа 2018. В архиве с оригинала от 12 августа 2018 г.
- ^ Лапинти, Ласси (22 июля 2015 г.). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [Доступ финнов на сайт хактивистов заблокирован]. Iltalehti (на финском). В архиве из оригинала 27 мая 2019 г.. Получено 4 марта 2016.
- ^ Елистратов, Владимир (29 января 2016 г.). «Архивная копия» Роскомнадзор заблокировал сервис архив ..., хранящий копии веб-сайтов. TJournal (на русском). В архиве с оригинала 30 августа 2017 г.. Получено 30 января 2016.CS1 maint: заархивированная копия как заголовок (связь)
- ^ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, потому что он может содержать старые страницы о наркотиках». Techdirt. В архиве из оригинала 23 марта 2019 г.. Получено 26 февраля 2016.
- ^ @archiveis (15 июля 2018 г.). "'Необходимость делать здесь не так прямолинейна. Отсутствие EDNS и значительное несоответствие (не только на AS / Country, но даже на уровне континента) того, откуда приходят DNS и связанные HTTP-запросы, вызывает столько проблем, поэтому я считаю запросы без EDNS от Cloudflare недействительными » (Твит) - через Twitter.
внешняя ссылка
- СМИ, связанные с Archive.today в Wikimedia Commons
- Официальный веб-сайт
- Блог Archive.is
- archive.today на Twitter
- «7 лучших альтернативных вариантов для использования в 2019 году»