玉林网站信息发布推广公司【发布猫云媒体】

玉林网站信息发布推广公司【发布猫云媒体】

可将特殊规则匹配算法设为具有***优先级,一旦符合某条规则后就采用 特殊规则匹配算法的结论。在不符合任何规则的前提下,为svm算法、bayes算法、随机森林 算法赋予不同的权重Wl、W2、W3。若一个互联网网站的最终文本集用svm算法被分为A类 另IJ,用bayes算法和随机森林算法均被分为B类别。若WDW2+W3,则该互联网网站被分为 A类别;若W1〈W2+W3,则该互联网网站被分为B类别;若W1=W2+W3,则交由人工判定。

并不用于限定本申请。对于本领域的技术人员来 说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同 替换、改进等,均应包含在本申请的保护范围之内。

Hide Dependent

1. 一种互联网数据分析系统,其特征是,包括: 数据预处理模块,从互联网的网页信息中提取其主要内容,过滤而得到每个网页对应 的文本;对获取的文本首先由分词器得到多个分词,再经过特征值降维仅保留突出该文本 特征的分词; 数据分析模块,根据分析要求,从分类算法、聚类算法、关联规则算法、特殊规则算法这 四类算法中选择相应的一类对多类算法,每类算法中采用一种多种算法,对所述数据预 处理模块输出的每个网页所对应的经过降维后的分词各自独立地进行处理,并存储分析结 果。

2. 根据权利要求1所述的互联网数据分析系统,其特征是,所述分词器包括ansj分词 器、_seg j分词器、lucene分词器中的一种或多种。

3. 根据权利要求1所述的互联网数据分析系统,其特征是,所述特征值降维采用 tf-idf算法、权重计算的一种或多种。

. 根据权利要求1所述的互联网数据分析系统,其特征是,所述分类算法包括svm算 法、贝叶斯算法、随机森林算法。

5. 根据权利要求1所述的互联网数据分析系统,其特征是,所述聚类算法包括k-means 算法。

6. 根据权利要求1所述的互联网数据分析系统,其特征是,当所述数据分析模块采用 多种算法处理时,当分析结果不一致,则根据各种算法的权重判断分析结果的权重,并采纳 权重较大的分析结果。

对于{产品来说,}因此,可以直接确定推广信息观看结果为未观看。而当检测的状态为非锁屏状态时,确定终端播放的推广信息可以被用户观看到,此时,终端可以通过如下()-⑶的步骤来确定推广信息观看结果。[()、如果检测的状态为非锁屏状态,则基于推广信息标识,判断当前显示的网页页面是否为推广信息所在页面。[基于推广信息标识,判断当前显示的网页页面是否为推广信息所在页面的操作可以为:终端可以获取推广信息标识,并基于推广信息标识,确定推广信息所在页面;检测推广信息所在页面的页面标签;当页面标签为第一指定标签时,确定当前显示的网页页面不是推广信息所在页面;当页面标签为第二指定标签时,确定当前显示的网页页面是推广信息所在页面。[其中。

对于产品来说,推广信息标识可以为该推广信息的编号、该推广信息所在网络视频的名称,当然,也可以为该网络视频所在网页页面的页面标签的序号等等,本公开实施例对此不做具体限定。[另外,为了判断当前显示的网页页面是否为推广信息所在页面,当终端显示推广信息所在页面之后,终端可以将推广信息所在页面的页面标签设置为第二指定标签,当终端检测到推广信息所在页面被切换时,也即是,当前显示的网页页面是其他网页页面时,终端可以将推广信息所在页面的页面标签设置为第一指定标签,因此,终端可以基于推广信息所在页面的页面标签,确定当前显示的网页页面是否为推广信息所在页面。[再者,终端通过检测当前显示的网页页面的页面标签,判断当前显示的网络页面是否为推广信息所在页面。

[图是根据一示例性实施例示出的一种推广信息投放有效性确定装置的框图。例如,装置可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,设备,健身设备,个人数字助理等。[参照图,装置可以包括以下一个或多个组件:处理组件,存储器,电源组件,多媒体组件,音频组件,输入/输出(I/)的接口,传感器组件,以及通信组件。[处理组件通常控制装置的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件可以包括一个或多个处理器来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件可以包括一个或多个模块,便于处理组件和其他组件之间的交互。例如,处理部件可以包括多媒体模块。