基于关键字的网站域名相关性研究项目



启动:基于关键字的网站相关性研究项目

项目地址: http://www.domolo.com/website/domainClouds

常有一些问题困扰着我。
比如:

和 donews最相关和相似的网站是那个?
和 baidu 最相关和相似的网站是那个?
和 alibaba 最相关和相似的网站是那个?
和 csdn 最相关和相似的网站是那个?
和 seo.org.cn最相关和相似的网站是那个?


     上次
第18次互联网统计报告中说:   
中国拥有的网站数量达到了78.84万 个,半年增加9万 个。北京市的网站总数是14.4万,广东省的网站总数是14.1万,而基于广东省的域名数是50多万个,北京市的域名总数40万个,不过 CNNIC方面分析,下半年广东省的网站总数很有可能会超过北京市的网站总数,从而成为中国网站最多的省份。截至今年6月30日,中国内地的IPv4的地 址数有8478万多个,一年增长了1600多万个,现在排在全球第三位。
     我现在已经收集了12万多个网址,正在以每天XXX个速度增加。

     我的初期想法是:研究域名,ip,关键字,pagerank 等数据得出一些更有意义的结论。

    比如: 网站友情链接ip之间的正相关型。

    等主域名达到30万个的时候,就开放所有功能.......敬请期待.