WebClub - Всероссийский Клуб Веб-разработчиков
WebClub.RU » Советы » Из опыта создания системы анализа посещаемости коммерческого сайта (часть 1)

Из опыта создания системы анализа посещаемости коммерческого сайта (часть 1)


Дата публикации: 18-04-2008

Автор: Владимир Некрасов, заместитель генерального директора компании Intersoft Lab

 

Интернет существенно изменил технологию ведения бизнеса многих предприятий. Сегодня большинство коммерческих организаций имеют собственные сайты, которые играют роль электронного представительства и выставочного зала и являются важным, а иногда и главным средством донесения до покупателя информации о товарах и услугах, предлагаемых предприятием. Существенная часть рекламной активности предприятий также переместилась в Интернет. Поэтому анализ посещаемости сайта (clickstream анализ) стал весьма актуальной проблемой. На рынке существует большое количество решений на эту тему, построенных по разным бизнес-моделям и основанных на различных технологиях.

Анализ журнала в режиме реального времени. Существует ряд бесплатных продуктов, таких как известные системы Analog или WebStat, реализованных, как правило, в виде Java-аплета, который читает в режиме реального времени журнал сайта и отображает на html-странице некоторое фиксированное количество отчетов. Эти решения предполагают относительно небольшой размер журнала и скромные потребности пользователей.

Аренда аналитического сервиса. Второй вариант - аналитический сервис, который предлагается на сайте третьей фирмы компаниям, предпочитающим не эксплуатировать ПО, а арендовать чужие вычислительные ресурсы. Пользователь располагает на своем сайте специальный скрипт - шпион (spider), который получает информацию от броузера посетителя и посылает ее на сайт поставщика сервиса, где информация записывается в общую базу данных. При входе на личную страницу этого сайта пользователь сервиса может выполнять параметризованные запросы и получать отчеты заданной формы. Одним из популярных примеров такого сервиса на Западе является WebTrends компании NetIQ, а в России - SplyLog, одноименной компании.

Коробочные продукты масштаба предприятия. Третий вариант - специальная система, которая продается как коробочный продукт и состоит из модулей, устанавливаемых на стороне Интернет-сервера и в локальной сети компании. Эти продукты позволяют накапливать историю работы сайта, хранить и обрабатывать значительные объемы данных.

Решения на базе OLAP-инструментов. Владельцу сайта важно знать, как меняется количество посетителей, какие страницы, среди каких групп пользователей были наиболее популярны за заданный период, то есть получать итоги посещаемости сайта в различных разрезах. Это классическая задача OLAP анализа. При наличии данных можно многократно и мгновенно выполнять подобные запросы с разнообразной фильтрацией и группировками. В терминах OLAP имя страницы, имя посетителя и период будут измерениями, а количество запросов - фактами. Пользователь получает неограниченное количество динамических отчетов, суммирующих факты в разрезе измерений.

Большинство поставщиков OLAP-продуктов предлагают свои решения для анализа посещаемости сайта. В базе данных, фиксирующей запросы посетителей сайта, скапливается огромное количество информации за длительные периоды, эта информация используется только для анализа, при этом требуется быстро получать большие выборки данных. Таким образом, налицо все признаки классического Хранилища данных, поэтому, как правило, поставщики OLAP-решений предлагают комплексы, включающие в себя средства извлечения, очистки и загрузки данных (ETL - Extract, Transformation, Loading), Хранилище данных и OLAP-инструмент для анализа данных.

Так, корпорация Oracle поставляет "коробочный" продукт масштаба предприятия Oracle9iAS Clickstream Intelligence, который построен на комплексе продуктов Oracle: СУБД Oracle9i, сервере приложений Oracle9i Application Server (Oracle 9iAS), Oracle Warehouse Builder 2.1.1, а в качестве клиентского средства предлагается OLAP-клиент Oracle Discoverer. Этот продукт позволяет одновременно анализировать данные нескольких сайтов предприятия.

Microsoft предлагает решение "Clickstream analytics for the Microsoft business intelligence platform", которое является не продуктом, а концепцией, рекомендуемой пользователям. Это решение включает в себя Интернет сервер Microsoft Commerce Server, СУБД MS SQL для построения Хранилища данных, OLAP-сервер MS Analysis Services для создания многомерных витрин данных. В качестве клиентского средства предлагается Excel с встроенным в него OLAP-компонентом PivotTable или комплект COM-компонент Office Web Components.

SAS Institute поставляет продукт, именуемый IntelliVisor, который собирает данные в Хранилище данных и анализирует активность посетителей сайта.

В этой статье рассказывается об опыте создания системы анализа посещаемости сайта (clickstream анализа) на основе OLAP-клиента Контур Стандарт компании Intersoft Lab. Система была создана для анализа работы нового сайта, предназначенного для продвижения коммерческого продукта и реализованного на ОС Linux и сервере Apache. Для большей наглядности в статье приводятся сгенерированные данные.

Домен продается

Популярное

Не так давно в сети появился новый сервис, под названием Dead Man Zero. Этот сервис сделал...
Рынок социальных площадок уже давно стал стабильным. Несмотря на то, что время от времени...
Artisteer 4 – единственный в своем роде продукт, позволяющий автоматизировать работу над созданием...
Апрель 2024 (1)
Октябрь 2018 (14)
Февраль 2017 (3)
Январь 2017 (1)
Август 2016 (1)
Май 2016 (2)

Карта сайта: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41

Друзья сайта



Случайная цитата

Неизвестный автор:

"Интернет – пункт приёма, обмена и сбыта краденого остроумия."

Опрос

Какими социальными сетями Вы пользуетесь?

Vkontakte.ru
Одноклассники
Мой Мир - mail.ru
Google Plus
Facebook
ЖЖ
Другие
Не пользуюсь