他们从哪里获得这些网站过去的客

在这个用巨大的取代我们的链接索引的多年项目进行了大约个月后我的任务是解决我们如何知道我们的链接索引是否良好这个开放式问题我一直在思考这个问题自从年发表那篇文章以来我就知道除了一个以真正的网络随机样本开始的系统之外我不会继续使用任何其他东西。莫兹再一次要求我尽一切努力把这件事做好他们让我继续做下去。随机有什么大不了的好的随机样本的重要性怎么强调都不为过。让我先岔开一下。假设您看到一项调查显示的美国人相信地球是平的。这将是一个可怕的统计数据。

但后来你发现这项调查是在地

球平论会议上进行的而不同意的人是会议中心的员工。这完全有道理。问题是接受调查的人样本并不是随机抽取的美国人相反它是有偏 希腊 WhatsApp 号码 见的因为它是在地平论大会上采集的。现在想象一下网络上同样的情况。假设一家机构想要进行测试以确定哪个链接索引更好因此他们会查看数百个网站进行比较。户那么他们可能偏向于搜索引擎优化友好的网站而不是反映整个网络。点击流数据那么他们就会偏向于流行的网站和页面这又不能反映整个网络从不好的样本开始肯定会得到不好的结果。但情况变得更糟。像这样的索引报告我们的总统计数据索引中的链接数量或域数量。

WhatsApp 号码数据

然而这可能会产生

极大的误导。想象一下一家餐厅声称拥有世界上最多的葡萄酒选择拥有超过瓶葡萄酒。他们可以这么说但如果他们实际上有个相同类型的葡萄酒或者只有赤霞珠或者半瓶那就没有用了。当你只是抛出大数字时很容易产生误导。相反最好从世界各地随机选择葡萄酒并衡量该餐厅是否有库存以及有多少。只有这样你才能很好地衡量他们的库存。测量链 巴林 WhatsApp 号码数据 接指数也是如此这就是我的方法论背后的理论。不幸的是事实证明获得网络的随机样本非常困难。中大多数人的第一直觉是在我们自己的索引中随机抽取样本。当然我们不能这会使样本偏向我们自己的指数所以我们放弃了这个想法。

Leave a comment

Your email address will not be published. Required fields are marked *