在这个初始版本中,没有丰富的摘要或其他垂直内容(新闻/图片/视频),但我希望在下一个版本中添加这些内容。 到目前为止,一切都很好…. 但是汤姆……这些点击可靠吗?! 这是我首先想到的。mTurk 测试人员或其他测试人员(同事、Twitter 用户或任何其他人)真的会积极地进行测试吗?mTurk 用户难道不会直接点击顶部链接来收取费用吗? 对于 mTurk,您会发现大多数工作人员确实会留意(不是全部,但大多数),因为您必须批准他们的工作,而他们的“批准率”是一个可以阻止他们获得更多工作的标准。
然而这对我来说还不够好—
—我希望数据是确定的,所以我 购买批量短信服务 进行了健全性检查测试…… 我搜索了“鲨鱼”,并将结果导入 SERP 土耳其。然后我搜索了“大白鲨”,并导入了前两个结果,并将它们放在“鲨鱼”结果的第四和第六位。我设置了 SERP 土耳其结果页面以显示搜索词是“大白鲨”,然而,结果显示的是“鲨鱼”结果,其中插入了两个更相关的结果。
它看起来是这样的
我将其推送到 Amazon Turk 并 优化网站设计和导航 收集了一些结果,以查看人们是否会像我希望的那样点击这两个相关结果。 我不会让你悬念;以下是 SERP 土耳其的结果: (点击放大) 左侧的结果显示原始点击次数(仅限每个用户的第一次点击 – 如果他们返回并点击了第二个结果,则忽略该结果),右侧的结果显示过滤掉速度快于五秒的结果。
我发现五秒是一个很好的阈值
可以过滤掉那些只是点击而没 印度手机号码 有真正查看的人(您可以查看任何您想要的时间阈值)。 您可以在两种情况下看到,超过 65% 的点击都集中在两个“最相关”的结果上。在这两种情况下,排名第一的“鲨鱼”的维基百科页面也吸引了大量点击,但它也是一个相关结果,我认为它在某种意义上模仿了真实的搜索结果(它位于第一名,它是维基百科,它不是不相关的)。
结论实验的目的是为
了证明测试用户总体上在做出决定之前会仔细检查结果。我们发现,用户确实会注意并寻找最相关的结果。 这项实验涉及 200 名 Amazon Turk 用户,我向他们每人支付 0.05 美元。经过筛选后,我使用了 174 个数据点,如上所示。加上亚马逊的费用,我的总成本仅为 11 美元!收集数据大约需要三天时间 – 但如果您很着急,可以通过提高出价来加快速度。