WebClub - Всероссийский Клуб Веб-разработчиков
WebClub.RU » Материалы за Апрель 2008 года

Доступ к данным

Дата публикации: 20-04-2008

Существует несколько вариантов расположения БД журнала и способов извлечения из него данных.

Источник данных

Дата публикации: 19-04-2008

Самым доступным и полным источником данных для анализа работы сайта является стандартный журнал Интернет сервера. Например, журнал сервера Apache содержит следующие поля: IP-адрес, Дата, Время, Имя запрашиваемого ресурса, Статус запроса, Страница, с которой пришел посетитель.

Из опыта создания системы анализа посещаемости коммерческого сайта (часть 1)

Дата публикации: 18-04-2008

Автор: Владимир Некрасов, заместитель генерального директора компании Intersoft Lab

Пересылка результатов обработки по FTP

Дата публикации: 17-04-2008

Итак, мы обработали клиентский запрос и в результате получили несколько переменных с интересующей нас информацией.

Определение страны по ip адресу

Дата публикации: 16-04-2008

Следующим шагом неплохо было бы определить страну клиента. Конечно, это можно сделать по домену первого уровня, взятого из имени хоста, но, во-первых, физическое расположение хоста не всегда соответствует стране, которой приписан домен (например, хост зоны .com может находиться и в России), к тому же есть такие интернациональные домены как .org, .net, .edu и т.д.

Определение имени хоста

Дата публикации: 15-04-2008

Если в httpd.conf включено определение имен хостов (HostNameLookups on), в лог записываются не ip адреса клиентов, а имена хостов. Включать определение имен хостов не рекомендуется, так как ухудшает производительность веб-сервера.

Очистка данных

Дата публикации: 14-04-2008

Легко заметить, что далеко не все полученные данные подходят для загрузки на SQL сервер. Например, дата должна быть в формате, "понятном" серверу. Не говоря уже о том, что bytes и status могут и не быть числами, тогда как в базе данных для них имеет смысл завести поля типа integer (для последующего суммирования).

Начинаем обработку лога

Дата публикации: 13-04-2008

В логе каждый клиентский запрос представлен отдельной строкой, поэтому для чтения файла лога удобно воспользоваться конструкцией Python наподобие следующей

Настройка журнализации веб-сервера

Дата публикации: 12-04-2008

Для того, чтобы иметь возможность получать интересующую информацию из логов веб-сервера, нужно сначала настроить журнализацию так, чтобы эта информация туда попадала.

Из опыта создания системы анализа посещаемости коммерческого сайта (часть 2)

Дата публикации: 11-04-2008

Автор: Олег Артемов, системный администратор компании Intersoft Lab

Подготовка данных для ClickStream Intelligence

Назад 1 2 3 Вперед
Домен продается

Популярное

Не так давно в сети появился новый сервис, под названием Dead Man Zero. Этот сервис сделал...
Рынок социальных площадок уже давно стал стабильным. Несмотря на то, что время от времени...
Artisteer 4 – единственный в своем роде продукт, позволяющий автоматизировать работу над созданием...
Апрель 2024 (1)
Октябрь 2018 (14)
Февраль 2017 (3)
Январь 2017 (1)
Август 2016 (1)
Май 2016 (2)

Карта сайта: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41

Друзья сайта



Случайная цитата

Неизвестный автор:

"ВКонтакте – место для лжи знакомым людям. Твиттер – место для выкладывания правды незнакомцам."

Опрос

Какой браузер Вы используете?

Internet Explorer
Google Chrome
Mozilla Firefox
Netscape Navigator
Maxthon Browser
Opera
Mozilla Suite
SeaMonkey
K-Meleon
Safari
Amaya
Avant Browser
SlimBrowser
Другой...