首先将所有在历次舆情中出现在相关账号中用户的数据信息进行有效划分,操作步骤如下:
步骤一:获得数据样本X={x1,x2,…,xn};
步骤二:计算xi到其k邻域xki的距离d(xi,xki);计算全部样本点到k邻域的平均值
步骤三:计算数据的密度的公式如式……
步骤四:得到数据的判定函数如式……
步骤五:重复步骤二到步骤四,直到把异常信息全部删除掉。
网友们都要疯了,这尼玛得罪谁也别得罪学霸,否则连人家说的话都看不懂。
继续下翻,网友们终于松了一口气。
因为第34个PPT截图的标题是“以鹰眼观察为例”。
然而,网友高兴的太早了,因为除了周默列出的密密麻麻的ID号以及谁都看不懂的数据外,唯一能看懂的只有几行字。
步骤一:建立对象矩阵X和聚类数N;
步骤二:高度重叠对象作为聚类中心;
步骤三:利用k均值算法计算相似度。以“鹰眼观察”关注的其他用户信息生成关系图如图所示。其中计算对象相似度的公式如式……
步骤四:用各个类的平均向量更新聚类中心,再把每一个对象分别和这n个聚集中心的距离做比较,把相近的分为一类;
步骤五:不断的重复步骤三到步骤四,直到满足终止条件为止。
P62.结论
根据计算,所有关联账号均关注“湖畔居士”而湖畔居士却没有关注对方;
同好账号均互相关注;
同好账号关注对象中有90%的账号为共同关注账号;
湖畔居士率先发起含有关键词动态,此后3分钟内评论区出现的ID账号中有95%会在同好账号评论区出现,且时间在同好账号发布包含共同话题动态后的五分钟内。
同好账号在每一次舆情中的关键词与话题重合率100%;
同好账号均互相关注;
同好账号日常发言次数为零;
同好账号均习惯性集中在某一时间点变成活跃用户且话题重合率100%;;
同好账号关注对象均出现相似特征(因时间紧张不能有效排除被蒙蔽网友ID,故本文制作概述,不做详细表述)
P63.一种基于抽象代数半群法分析文字表达风格的数学模型及一种基于进化算法的神经网络搜索爬虫应用。
又是一大段没人能看懂的文字和公式……
P86.结论
周默毫不客气的将30个同好账号在网络上所有的留言进行的分析,最终分成了6个群组。
虽然没有明确说出这些账号为6人分别操作,但语言风格相似度80%、常见错别字重合度98%的结论已经尽在不言中。
最后,周默留下一行红色如血的文字。
别再惹我!
网络上一片哑然。
谁还敢惹你松语文学Www.songyuwenxue.coM免费小说阅读