Анализ рабочего состояния web-ресурса
Конференция: LI Студенческая международная научно-практическая конференция «Молодежный научный форум»
Секция: Технические науки
LI Студенческая международная научно-практическая конференция «Молодежный научный форум»
Анализ рабочего состояния web-ресурса
Web-ресурс информационно-телекомунникационной сети «Интернет» представляет собой массив связанных данных, имеющий уникальный адрес и воспринимаемый пользователем как единое целое, доступ к которому осуществляется по протоколу HTTP.
Web-ресурс можно представить в виде системы электронных документов (файлов данных и кода). Взаимодействие пользователя с ним происходит по принципу «клиент-сервер». Клиенты являются обычными пользователями, подключенными к Интернету посредством устройств и программного обеспечения, доступного на этих устройствах. Серверы - это компьютеры, которые хранят web-страницы, ресурсы или приложения. Когда клиентское устройство пытается получить доступ к web-странице, копия страницы загружается с сервера на клиентский компьютер для отображения в браузере пользователя.
Цель данной работы – определить работоспособность web-ресурса без доступа к хостингу, с точки зрения клиента.
Для того чтобы получить доступ к web-ресурсу необходимы следующие условия:
- Интернет-подключение: позволяет отправлять и принимать данные по сети. TCP/IP (Протокол Управления Передачей и Интернет Протокол) являются коммуникационными протоколами, которые определяют, каким образом данные должны передаваться по сети.
- DNS (Система Доменных Имён). Когда вы вводите web-адрес в своем браузере, браузер обращается к DNS, чтобы найти реальный адрес web-ресурса, прежде чем он сможет его получить.
- Файлы компонентов: ресурс состоит из нескольких различных файлов. Эти файлы бывают двух основных типов:
- файлы кода: ресурсы построены преимущественно на HTML, CSS и JavaScript.
- материалы: это собирательное название для всех других вещей, составляющих ресурс, такие как изображения, музыка, видео, документы Word и PDF.
Для примера рассмотрим web-ресурс, состоящий из web-страниц (html), файлов верстки (css), изображений (jpg, png), файлов скриптов (js) и файлов контента (pdf).
При условии корректного доступа к web-ресурсу (DNS определяет адрес сервера; сервер, где находится ресурс доступен) клиент запрашивает страницу с контентом. Первым признаком корректной работы ресурса является код состояния для всех запросов «200 ОК» (успешный запрос: если клиентом были запрошены какие-либо данные, то они находятся в заголовке и/или теле сообщения).
Код состояния HTTP – часть первой строки ответа сервера при запросах по протоколу HTTP. Он представляет собой целое число из трёх десятичных цифр. Первая цифра указывает на класс состояния. За кодом ответа обычно следует отделённая пробелом поясняющая фраза на английском языке, которая разъясняет человеку причину именно такого ответа [1].
Полученный код означает, что все запрошенные элементы корректно получены клиентом. Пользователь обращается к web-ресурсу для получения определенной информации. Разделим информацию на три категории: изображения, например, фотографии определенных объектов, текст, содержащийся непосредственно на странице и документы, например, pdf-файлы. После несанкционированного доступа к серверу, на котором находится ресурс, эти элементы могут быть удалены (пользователь не получит информацию) либо модифицированы (пользователь получит неверную информацию).
Рассмотрим варианты модификаций:
- При отсутствии файлов вёрстки CSS (угроза = 0) высока вероятность, что пользователь получит необходимую информацию. При изменении кода в файле, можно изменить цвет фона или цвет текста, и сделать текст невидимым без выделения, или вовсе переместить отображаемый текст или изображение за пределы видимости (угроза = 100). При изменении других файлов верстки, например изображений, также высока вероятность, что пользователь получит информацию.
- При отсутствии этих файлов изображений или документов (угроза 100) пользователь не получит информацию. При модификации пользователь получит недостоверную информацию.
- Текстовое содержимое страницы хранится в базе данных (далее – БД), но пользователь получает web-страницу в виде html-файла. Поэтому примем удаление и модификацию текстового содержимого в БД, как удаление и модификацию содержимого html-файла. При удалении файлов (угроза = 100) пользователь не получит информацию. При модификации пользователь получит недостоверную информацию.
Утилитой wget можно получить как коды состояний ссылок (html файл, файлы верстки, изображения, документы), так и сами файлы. Скачав эти файлы заведомо рабочего (корректно отображающегося и с верным содержимым) web-ресурса, можно получить эталонный набор файлов. Далее утилитой diff можно сравнить файлы, полученные в любой момент времени, с эталонными, при отсутствии различий можно считать, что ресурс работает корректно.