这些模式使得理解用户行为或类似的事情成为可能。Web 挖掘是提取重要且有用的模式,但隐式存储在万维网服务上相对较大的数据集中。在网络挖掘中,用户访问网络上的数据并以日志的形式收集数据。所以,网络挖掘也称为日志挖掘。 网络使用挖掘的阶段 实施网络使用挖掘以获取信息源有3个阶段/阶段:网络挖掘中使用了多种类型的技术,即网络内容挖掘、。 预处理阶段 该预处理 阶段是启动网络使用挖掘整个过程的初始阶段。这个阶段对于进行数据标准化、剔除挖掘过程中不需要的部分数据非常重要。
这个预处理阶段又分为几个阶段即 数据
清理,该阶段的作用是使用挖掘过程从数 意大利电话号码数据 据中清理不相关的日志文件,例如多媒体数据以及CSS 和 Javascript脚本。 用户识别,即充当用户识别过程的阶段。实际上,多个用户可以使用同一台计算机(主机)。 会话识别是用户访问页面后开始的阶段,也必须将其划分为某些会话,以便为每个访问该页面的用户创建一个会话。 路径完成,即完成可能不完整的路径的阶段,因为它存储在日志文件中。
交易识别即识别一定数量的会话以显示用
户所进行的交易过程的阶段。 模式发现 印度电话列表 阶段 Web 使用挖掘 的第二阶段是搜索应用程序用户的访问模式。这个阶段是最重要的阶段,真正决定了网络使用挖掘过程的输出。这个阶段也有几种算法和技术,即 Statistical Analysis(统计分析),这是最广泛使用的从用户访问模式中获取信息或知识的技术。统计分析可以以各种分析形式呈现,其中各种变量成为分析参数。可以生成的分析示例是从每天的访问时间看出的用户访问模式。