WebClub - Всероссийский Клуб Веб-разработчиков
WebClub.RU » Материалы за Апрель 2008 года

Доступ к данным

Дата публикации: 20-04-2008

Существует несколько вариантов расположения БД журнала и способов извлечения из него данных.

Источник данных

Дата публикации: 19-04-2008

Самым доступным и полным источником данных для анализа работы сайта является стандартный журнал Интернет сервера. Например, журнал сервера Apache содержит следующие поля: IP-адрес, Дата, Время, Имя запрашиваемого ресурса, Статус запроса, Страница, с которой пришел посетитель.

Из опыта создания системы анализа посещаемости коммерческого сайта (часть 1)

Дата публикации: 18-04-2008

Автор: Владимир Некрасов, заместитель генерального директора компании Intersoft Lab

Пересылка результатов обработки по FTP

Дата публикации: 17-04-2008

Итак, мы обработали клиентский запрос и в результате получили несколько переменных с интересующей нас информацией.

Определение страны по ip адресу

Дата публикации: 16-04-2008

Следующим шагом неплохо было бы определить страну клиента. Конечно, это можно сделать по домену первого уровня, взятого из имени хоста, но, во-первых, физическое расположение хоста не всегда соответствует стране, которой приписан домен (например, хост зоны .com может находиться и в России), к тому же есть такие интернациональные домены как .org, .net, .edu и т.д.

Определение имени хоста

Дата публикации: 15-04-2008

Если в httpd.conf включено определение имен хостов (HostNameLookups on), в лог записываются не ip адреса клиентов, а имена хостов. Включать определение имен хостов не рекомендуется, так как ухудшает производительность веб-сервера.

Очистка данных

Дата публикации: 14-04-2008

Легко заметить, что далеко не все полученные данные подходят для загрузки на SQL сервер. Например, дата должна быть в формате, "понятном" серверу. Не говоря уже о том, что bytes и status могут и не быть числами, тогда как в базе данных для них имеет смысл завести поля типа integer (для последующего суммирования).

Начинаем обработку лога

Дата публикации: 13-04-2008

В логе каждый клиентский запрос представлен отдельной строкой, поэтому для чтения файла лога удобно воспользоваться конструкцией Python наподобие следующей

Настройка журнализации веб-сервера

Дата публикации: 12-04-2008

Для того, чтобы иметь возможность получать интересующую информацию из логов веб-сервера, нужно сначала настроить журнализацию так, чтобы эта информация туда попадала.

Из опыта создания системы анализа посещаемости коммерческого сайта (часть 2)

Дата публикации: 11-04-2008

Автор: Олег Артемов, системный администратор компании Intersoft Lab

Подготовка данных для ClickStream Intelligence

Назад 1 2 3 Вперед

Популярное

Не так давно в сети появился новый сервис, под названием Dead Man Zero. Этот сервис сделал...
Рынок социальных площадок уже давно стал стабильным. Несмотря на то, что время от времени...
Artisteer 4 – единственный в своем роде продукт, позволяющий автоматизировать работу над созданием...
Октябрь 2018 (14)
Февраль 2017 (3)
Январь 2017 (1)
Август 2016 (1)
Май 2016 (2)
Ноябрь 2015 (1)

Карта сайта: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41

Друзья сайта



Случайная цитата

Неизвестный автор:

"Как видно, совершенство достигается не тогда, когда уже нечего прибавить, но когда уже ничего нельзя отнять."

Опрос

Какой браузер Вы используете?

Internet Explorer
Google Chrome
Mozilla Firefox
Netscape Navigator
Maxthon Browser
Opera
Mozilla Suite
SeaMonkey
K-Meleon
Safari
Amaya
Avant Browser
SlimBrowser
Другой...