用c#写爬虫入库时,出错,关键词不大好打,直接问同事,测试了下,好像字段定义有问题 于是要检查字符串长度 我习惯性的打开zend studio,就要打php code来看字符串长度。(我就记得两行代码可以解决) 弄得旁边的同事大叫,这用不着code把? 我很汗 于是遵从他的建议,打开editplus,选中字符串右键居然有个统计,虽然我也常用editplus,但从来没用过右键。 刚看到一cuer居然不会用office,想想我今天的惯性动作,回想了以前的行为,经常会有种写也许比查或者找工具解决来得快。 看来我比较适合coder这份工作。 ps:那为什么只有北京的公司不断邀请 ...
  • 22:58
  • 浏览 (991)
  • 评论 (0)
看msn协议和有关开源的代码,文档真够少的。 用dotnet写爬虫 前段时间说不上的搜索又要上了。 合同要到期了,签? python很酷,昨天翻了下python的书,真不错。 雅虎一哥们推荐的深入浅出mysql,面面俱到,不够深入。 书都是china-pub买得,那个包装真不是一般的寒碜,一个塑料袋还是破的。两本书100多块,这包装怎么也得好点把。 买了macbook,苹果系统还真好玩。
  • 21:05
  • 浏览 (1230)
  • 评论 (2)
2008-03-10

30分钟搭建一个百万全文搜索

关键字: lucene solr
公司重心转移,不再是搜索。所以比较有空写写博。   solr是lucene的企业级扩展,很好很强大。solr的性能 http://wiki.apache.org/solr/SolrPerformanceData, 现在使用solr的网站 http://wiki.apache.org/solr/PublicServers  我习惯使用tomcat,安装参考:http://wiki.apache.org/solr/SolrTomcat,当然你也可以使用其他Contains来安装。(现在的wiki真详细,以前都靠自己摸索) 如果安装成功,浏览器地址栏输入: htt ...
imjl
搜索本博客
博客分类
我的相册
4ae9948d-bac9-4e81-8351-d05c0182de1b-thumb
robot
共 1 张
存档
最新评论