<kbd id='ywbldo'></kbd><address id='ctqsac'><style id='wkdzyb'></style></address><button id='aiedap'></button>

          当前所在位置:百度优化 > 注册送68元体验金优化新闻 > 优化最新动态 > > > 详细页面

          你怎么知道你的数据是准确的?一个案例研究使用的搜索量,点击率,和排名

          发布日期:2013-8-27 22:31:50 转载请写上本文链接地址:(www.bolin.org.cn

          大数据和分析,被称为“下一件大事,”它确实可以用容易爆炸的强烈的情况下,高质量的数据可用的今天。在入境行销世界,我们已获得的反向链接和锚文本,流量和点击流数据,通过搜索量和点击率(CTR),社交媒体,以及更多。在这个庞大的数据值,如果我们能打开它。
          但是,有一个问题:现实世界的数据是混乱的,和处理是一个很棘手的问题。我们怎么知道我们的数据是准确的,或者我们可以信任我们的最后的结论?如果我们想利用这些数据来找到一个更好的方法来做营销,我们要小心的准确性。
          没有硬性规定,当涉及到数据分析。有一些最佳做法,但即使这些能有点阴暗。做最重要的事情是把上侦探帽,潜入数据。更熟悉你的数据,更容易发现的东西似乎是奇怪的。更可能的是,你的结果将质量问题需要改进。
          在本文中,我们将使用一个数据集从谷歌注册送68元体验金管理员工具的关键词搜索引荐作为一个案例研究。这是一段数据:
          我们也把我们所有的关键词分析代码在GitHub上所以你可以在你自己的注册送68元体验金的数据运行分析。
          这篇文章的其余部分讨论了六个最佳做法和建议,为确保你的数据和结果准确。享受!

          1。从分析单独的数据,进行了分析和可重复性
          它是单独的数据和过程,分析了数据的最佳实践。这也使得它可以在不同的数据重复分析,不管是你自己还是别人。因为这个原因,大多数科学家不使用Excel数据因为它将数据与分析,使得它很难重复。相反,他们经常使用的一种高层次的统计型的脚本语言,如R,Matlab /倍频程,SAS,或一个通用的语言,如Python。
          在莫桑比克,数据科学团队使用Python。我们的大数据的团队也使用它很大,这使得它很容易融入我们的算法和他们的产品代码。
          2。如果可能的话,检查你的数据与另一个来源
          在许多情况下,这一步是不可能的,但如果你能,这是确保你的数据的最佳方法是准确的。在莫桑比克的案例中,我们能够检查谷歌注册送68元体验金管理员工具的数据与从谷歌分析数据。
          几件重点当你比较数据包括总计数,在子类别数,或平均值。在我们的例子中,我们检查的总搜索访问和现场检查的访问次数为几个不同的关键词。
          3。下来和肮脏的数据
          这是最有趣的部分,我们可以用数据和做一些探索性数据分析。一个好的开始是通过在原始数据中跳了出来,看到什么。在谷歌注册送68元体验金管理员工具数据的情况下,我发现他们并不总是给搜索量的长尾情况下只有很少的搜索。相反,数据具有“<10”或“-”来代替数字,将需要小心处理,因为它们会导致遗漏值。
          这时也要带上你的侦探帽开始询问数据问题。我们看了一些关键词如“搜索”和“页面权威”品牌,有的像“作者排名”和“图式测试工具”,不。在检查了所有的资料,我问我自己,“嗯,我不知道是否有任何差异,通过点击之间的品牌和非品牌关键词率,或在平均搜索的位置?”
          通常由这一点,我都要开始回答困难的问题,但我试图抵制诱惑,跳出困境直到我跑几更完整的检测。单因素分析是帮助你走得太远之前,检查自己,一个伟大的工具,特别是因为大多数软件包也提供了一种简单的方法,往往会产生第一个有趣的结果。这个想法是让每一个画面变“看起来像“通过绘制直方图计算像是。
          上面的图显示在我们的数据单变量分析的一个例子。在每一个面板,我们绘制一在我们的数据的四个变量的分布:印象,平均位置,点击,和CTR。我们还包括在标题每个分布平均。马上,我们可以看到一些有趣的比较。
          第一,我国几乎所有的关键词是“不到100的搜索/月长尾巴”。然而,我们大部分的交通也由几大批量的关键词(> 1000次/月)。平均位置集中在10的预期(因为结果从第一页发送很少的流量)。这也是我们的数据很好的检查。如果我们看到了关键词在排名低于10 #发送流量显着量,我们应该进一步调查。最后,在右下角,点击率是有趣的。大多数的关键字点击率不到40%,但是我们有更高的点击率有高量的关键词。
          现在,我常常觉得与数据非常舒适并能跳。在这一点上,我发现问特定问题的回答往往是更大的问题的最有效的办法,但每个人都不同,所以你需要找出最适合你的。在谷歌注册送68元体验金管理员工具数据的情况下,我对品牌与非品牌关键词影响好奇。
          检验这一方法是分段的数据然后重复单因素分析每段。这是印象的情节:

          我们可以看到,总的来说,品牌关键词有较高的搜索量,那么非品牌词(380和160,分别)。它会更有趣,如果我们看看平均位置和CTR:
          我们看到,在品牌和非之间的平均位置和CTR的巨大差别品牌的话。我们大部分的交通从品牌的话是在前两个或三个位置,与非品牌查询发送流量在10强。该中心还与一些品牌关键词有很高的点击率明显不同(60% +)。
          我们也不知道如何CTR与搜索位置的变化。我们希望下关键词排名将有一个较低的点击率。我们可以在数据看到这个了吗?
          事实上,点击率迅速下降后排名五。有一个有趣的凸点在15位置,但这是一个数据稀疏的地区,这可能不是一个真正的信号。
          4。单元测试代码(才有意义)
          这是一个软件开发的最佳实践,但可以有点粘在数据科学世界和经常需要你的判断。单元测试的一切都是为了赶上许多问题的好方法,但它真的会减慢你的速度的。使用单元测试代码,您认为将再次使用它是一个好主意,有特定的项目以外的总的目的,或有足够复杂的逻辑,它会很容易得到错误。它往往是不值得写测试代码快速检查一个想法。
          在谷歌注册送68元体验金管理员工具数据的情况下,我们决定测试过程中读取数据并填补由于逻辑有点复杂的缺失值,但没有测试我们的代码生成的情节是相对简单的。我们用一个小的,合成的数据集来编写测试因为它易于管理?纯凑饫锏囊恍┪颐堑牟馐。
          5。记录下你的过程
          这一步很烦人,但你会感谢你自己几个月后,当你需要的时候再。文档也传达你的想法的人可以检查并验证您的逻辑。
          在我们的例子中,这个博客的文件中,我们提供了一些额外的文件,代码中的自述。
          6。从其他人那里获取反馈
          同行评审是一个学术世界的基石,和其他人的观点是几乎总是有利于提高你的分析。不要犹豫去问你的团队的反。淮蟛糠值氖奔,他们会很乐意给它!

          你有任何其他有用的测试技巧?一直为你和你的团队?我想在下面的评论中听到你的想法!

               满网排名烦,一把辛酸泪。都云优化难,谁解其中味!杜琶烦,优化难》