终端可以通过如下()-⑶的步骤来确定推广信息观看结果

左贡县高权重网站公司推广

文章来源:发布猫发布时间:2019-04-08 20:54:59

产品品牌   发布猫   产品型号   -  
生产城市   山东   发货城市   全国  
供货总量   1   最小起订   1  
产品单价   1   计量单位    

产品详情

左贡县高权重网站公司推广

所述分类(classi fica tion)算法主要是通过对已知类别的文本进行训练,得 出训练模型,从而根据模型对待处理的数据进行分类。分类算法适用于在已经规定了类别 的前提下,对数据进行分类。常见的分类算法有svm算法、贝叶斯(bayes)算法、随机森立 (ramdom forest)算法等。

所述聚类(clustering)算法又称为无监督学习算法,主要通过tf-idf (term frequency - inverse document frequency、词步页-反文档步页率)、idf (inverse document frequency、反文档频率)等算法将文本中的分词转换为向量,通过比较文本中对应向量的 距离与设定阈值的大小,从而对这些文本进行分类。聚类算法适用于在类别未知的前提下, 对数据进行分类。常见的聚类算法有k-means算法等。

所述关联规则(Association Rules)算法主要是从大量数据中获取数据之间的关 联关系。关联规则算法适用于从海量数据中寻求各数据之间的关联性。例如,美国沃尔玛 超市发现尿布与啤酒被同时采购的概率很高,经分析发现年轻爸爸在采购尿布 的同时往往为自己采购啤酒。

所述特殊规则匹配(rules matching)算法主要是通过大量经验的积累,总结出在 出现某种规则的前提下,该文本一定属于某个类别的一种特殊的算法。特殊规则匹配算法 可与上述三类算法相结合使用。

以上四类算法均有多种已存在的实现方式,在此不做赘述。

第1步,对采集下来的大量互联网的网页数据中进行文本预处理,即过滤掉无用 信息,获取网页主要内容,并将获取到的内容保存为文本。然后,选用分词器对文本进行分 词,得到包含文本和此时分词的中间文本集。如果是针对中文分词,所述分词器例如采用 ansj分词器、_seg j分词器、lucene分词器中的一种多种。最后,选用特征值降维算法 从中间文本集中过滤掉无用的分词,仅保留权重较高、可以比较明显表示出该文本类别特 征的分词,得到包含文本和此时分词的最终文本集。所述特征值降维例如采用tf-idf算 法、权重计算等方法。

第2步,由于类别已定为至少两种,因而适于采用分类算法和/或特殊规则匹配算 法。对于分类算法而言构建模型,对于特殊规则匹配算法而言归纳规则。

因此,可以直接确定推广信息观看结果为未观看。而当检测的状态为非锁屏状态时,确定终端播放的推广信息可以被用户观看到,此时,终端可以通过如下()-⑶的步骤来确定推广信息观看结果。[()、如果检测的状态为非锁屏状态,则基于推广信息标识,判断当前显示的网页页面是否为推广信息所在页面。[基于推广信息标识,判断当前显示的网页页面是否为推广信息所在页面的操作可以为:终端可以获取推广信息标识,并基于推广信息标识,确定推广信息所在页面;检测推广信息所在页面的页面标签;当页面标签为第一指定标签时,确定当前显示的网页页面不是推广信息所在页面;当页面标签为第二指定标签时,确定当前显示的网页页面是推广信息所在页面。[其中。

[如果当前显示的网页页面是推广信息所在页面,当推广信息的播放窗口在当前显示的网页页面的可视窗口时,确定推广信息观看结果为已观看,否则,确定推广信息观看结果为未观看,因此,确定当前显示的网页页面是推广信息所在页面之后,不能直接确定推广信息观看结果,需要确定当前显示的网页页面的可视窗口中是否包含推广信息的播放窗口。而判断当前显示的网页页面的可视窗口中是否包含推广信息的播放窗口的操作可以为:获取第一窗口尺寸和第二窗口尺寸,第一窗口尺寸是推广信息的播放窗口当前显示的尺寸,第二窗口尺寸为当前显示的网页页面的可视窗口的尺寸;将第一窗口尺寸除以第二窗口尺寸,得到推广信息可视比例;将推广信息可视比例与第一比例阈值进行比较。

推广信息观看结果为未观看的次数;待定统计次数为该推广信息的播放次数中,推广信息观看结果为待定的次数。而该推广信息的播放次数是每当终端播放该推广信息时,终端会向发送播放消息,当接收到该播放消息时,可以增加中记录的播放次数得到。[其中,[其中,基于接收到的推广信息标识和推广信息观看结果,确定推广信息的已观看统计次数、未观看统计次数和待定统计次数的操作可以为:基于接收到的推广信息标识和推广信息观看结果,从存储的推广信息标识、推广信息观看结果与统计次数之间的对应关系中,获取对应的统计次数;增加获取的统计次数;基于推广信息标识,从增加统计次数之后的推广信息标识、推广信息观看结果与统计次数之间的对应关系中。