Home
Scholarly Works
Clustering and semi‐supervised classification for...
Journal article

Clustering and semi‐supervised classification for clickstream data via mixture models

Abstract

Abstract Finite mixture models have been used for unsupervised learning for some time, and their use within the semisupervised paradigm is becoming more commonplace. Clickstream data are one of the various emerging data types that demand particular attention because there is a notable paucity of statistical learning approaches currently available. A mixture of first‐order continuous‐time Markov models is introduced for unsupervised and semisupervised learning of clickstream data. This approach assumes continuous time, which distinguishes it from existing mixture model‐based approaches; practically, this allows account to be taken of the amount of time each user spends on each webpage. The approach is evaluated and compared with the discrete‐time approach, using simulated and real data. Résumé Les modèles de mélange fini sont couramment utilisés pour l'apprentissage non supervisé et leur application dans le paradigme semi‐supervisé gagne en popularité. Les données de flux de clics (Clickstream) représentent un type émergent de données qui requiert une attention particulière en raison du manque notable d'approches d'apprentissage statistique disponibles actuellement. Dans cette étude, les auteurs introduisent un mélange de modèles de Markov à temps continu du premier ordre pour l'apprentissage non supervisé et semi‐supervisé des données de flux de clics. Cette approche se distingue des approches existantes basées sur des modèles de mélange, car elle prend en compte le temps continu que chaque utilisateur passe sur chaque page web. Enfin, les auteurs évaluent et comparent cette approche à l'approche à temps discret en utilisant des données simulées et réelles.

Authors

Gallaugher MPB; McNicholas PD

Journal

Canadian Journal of Statistics, Vol. 52, No. 3, pp. 678–695

Publisher

Wiley

Publication Date

September 1, 2024

DOI

10.1002/cjs.11795

ISSN

0319-5724

Labels

Contact the Experts team