Итак, с заданной периодичностью новые записи журнала сайта копируются в базу данных MS SQL, которая находится в локальной сети компании.
Имя пользователя. О нашем посетителе мы знаем только одно - его IP-адрес. Однако это ничего не говорит аналитику. Поэтому в "мигратор" был добавлен код, который запрашивает по IP-адресу имя хоста. Предположим, что оно имеет следующий вид: host123.interbusiness.it. Глядя на него можно понять, что на сайте побывал сотрудник компании interbusiness из Италии. Можно расчленить имя хоста на два поля: имя сервера и страну, что повысит наглядность и удобство использования. Однако, это очень грубый метод - сервер посетителя может находиться в домене com и при этом располагаться в любой стране.
География посетителей. Более точный способ получить код страны посетителя из его IP-адреса - выполнить запрос к одной из баз данных в Сети, хранящей зарезервированные диапазоны IP-адресов, например,
. Чтобы преобразовать в отчете код страны в название, нужно добавить в базу данных справочник стран и связать его с таблицей журнала. Для получения кода города или региона можно выполнять запрос к региональным серверам. Получение географических характеристик посетителя - это отдельная интересная тема, на которую можно найти много публикаций в Интернете. Это важнейший вид анализа для глобального бизнеса: международного или в масштабах страны.
Ссылающиеся сервера. Если сайт коммерческий и его владелец заинтересован в высоком трафике, он, наверняка, размещает в каталогах, поисковых машинах и других ресурсах Сети сведения о сайте и продаваемых на нем продуктах. Поскольку эта работа требует значительного времени, а часто и крупных инвестиций, необходимо анализировать ее эффективность, а именно: получать отчеты о количестве пользователей, зашедших на сайт по ссылкам с других сайтов и с поисковых машин. Из полной ссылки на ссылающуюся страницу можно выделить тип ссылающегося сервера: поисковая машина, News Groups, ссылающийся сайт и собственный сайт. В таблицу журнала добавляется поле "Категория ссылающегося сервера", и создается связанный с ним справочник; также добавляются поле "Ссылающийся сервер", в которое записывается имя сервера, вычлененное из ссылки.
Для каждой категории ссылающихся серверов выполняется собственный анализ. Для поисковых машин - эффективность кампании по размещению ссылок на сайт и индексации сайта. Для ссылающихся серверов - успешность рекламной компании, отклик общественности, конкурентов на мероприятия, известность брендов компании и т.д. Для новостных групп - популярность продуктов в разных сообществах пользователей. Для собственного сайта - популярность страниц и типичные маршруты посетителей.
Поисковые слова. Из строки ссылки для поисковых машин выделяются поисковые слова, которые для удобства дублируются "мигратором" в отдельное поле таблицы журнала. Это позволит проанализировать области целенаправленных интересов посетителей, а также насколько отвечают мета-теги и контент сайта этим интересам.
Маршрут движения посетителей. Если отфильтровать категорию ссылающегося сайта по значению "наш сайт", то ссылающиеся страницы станут показывать маршрут движения посетителя. Можно построить классическую реляционную иерархию "родитель-дитя" из двух полей таблицы. В каждой записи в поле "Родитель" будет расположена первая ссылка, а в поле "Дитя" - страница, на которую перешел посетитель с родительской страницы. Такую иерархию можно "раскручивать" в отчетах самыми разными способами. В частности, OLAP-система может показать наиболее популярных "Родителей", с которых посетитель приходит на страницу "Заказ продукта". Справедливости ради надо признать, что наиболее полный анализ навигации посетителей предоставляют специализированные программы или системы добычи данных (data mining). Кроме того, эта задача смыкается с CRM-анализом, что было отмечено многими поставщиками, в частности продукт WebTrends CommerceTrends компании NetIQ был интегрирован с известной CRM-системой Siebel.
Профессионалы в области Интернет-технологий, наверняка, знают множество более продвинутых способов добычи информации о посетителях сайта. Для задачи, которую решали мы, данных, перечисленных выше, оказалось вполне достаточно.
В результате этих модификаций база данных журнала превратилась в полноценную витрину данных, построенную по классической схеме "Звезда". Для различных видов отчетов были созданы специальные представления (view). Например, для получения количества уникальных посетителей создается представление, в котором содержатся описательные поля - характеристики посетителя, дата. Запросы пользователя исключаются, создается поле-счетчик как выражение Select 1 AS counter. Это обеспечивает уникальность записи об одном пользователе за одну дату.
Все подготовительные работы наш Web-мастер выполнил за несколько дней.
Пользуетесь системой webmoney или только что решили зарегистрироваться в популярной системе электронных платежей? Данная система электронных платежей имеет массу возможностей. По статистике около 80% Интернет-магазинов принимают к оплате webmoney. Деньги на вебмани можно заработать, оплатить товар или услугу, обменять и многое другое. Если вдруг у вас есть вопросы, вам поможет webmoney форум, где вы без труда сможете найти любую информацию о платёжной системе.