<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>旁门左道 &#187; Lucene</title>
	<atom:link href="http://log.medcl.net/item/category/dode/lucene/feed/" rel="self" type="application/rss+xml" />
	<link>http://log.medcl.net</link>
	<description>记录生活</description>
	<lastBuildDate>Tue, 29 Nov 2011 15:39:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.2</generator>
		<item>
		<title>vps优化小结</title>
		<link>http://log.medcl.net/item/2011/04/vps%e4%bc%98%e5%8c%96%e5%b0%8f%e7%bb%93/</link>
		<comments>http://log.medcl.net/item/2011/04/vps%e4%bc%98%e5%8c%96%e5%b0%8f%e7%bb%93/#comments</comments>
		<pubDate>Tue, 12 Apr 2011 12:10:40 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[vps]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=733</guid>
		<description><![CDATA[话说这vps这一年来，确实不易，一直走裸奔路线，安装之后，就没有好好管过，也米有优化什么的，除了偶尔拨500外，还会经常can't fork memory，登陆进面板连查看进程都做不了，只有一个按钮：reboot vps，哎，这几天优化了一把，效果还不错，内存下降不少，基本可以稳定接待客人了。 Tags: vps]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2011/04/vps%e4%bc%98%e5%8c%96%e5%b0%8f%e7%bb%93/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>How to make searching faster</title>
		<link>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/</link>
		<comments>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/#comments</comments>
		<pubDate>Wed, 06 Apr 2011 13:21:03 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[search]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=704</guid>
		<description><![CDATA[http://wiki.apache.org/lucene-java/ImproveSearchingSpeed Here are some things to try to speed up the seaching speed of your Lucene application. Please see ImproveIndexingSpeed for how to speed up indexing. Be sure you really need to speed things up. Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ElasticSearch WebConsole及ElasticSearch.NET客户端</title>
		<link>http://log.medcl.net/item/2010/10/elasticsearch-webconsole-and-elasticsearch-net-client/</link>
		<comments>http://log.medcl.net/item/2010/10/elasticsearch-webconsole-and-elasticsearch-net-client/#comments</comments>
		<pubDate>Sun, 17 Oct 2010 15:52:17 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[.NET]]></category>
		<category><![CDATA[Lucene]]></category>
		<category><![CDATA[搜索]]></category>
		<category><![CDATA[console]]></category>
		<category><![CDATA[elasticsearch]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=604</guid>
		<description><![CDATA[用Fiddler来查看ElasticSearch的服务器状态太让人抓狂了，抽空弄个console面板，可以很方便的设置服务器地址和更新时间，暂时只显示了一部分有用的信息。 github的地址：http://github.com/medcl/ElasticSearch-WebConsole 封装的一个.NET客户端地址，提供了连接池和thrift支持（暂时不支持Framed模式）200w记录时索引操作1-2ms、800w记录50ms，github地址： http://github.com/medcl/ElasticSearch.Net Tags: console, elasticsearch]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/10/elasticsearch-webconsole-and-elasticsearch-net-client/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[收藏]lucene知识点</title>
		<link>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/</link>
		<comments>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/#comments</comments>
		<pubDate>Wed, 14 Jul 2010 02:49:52 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=489</guid>
		<description><![CDATA[From：http://ybzshizds.javaeye.com/blog/279113 一、lucene索引的建立 1.索引文件 .fdt文件：主要保存数据源数据，存储的field的值仅为Document中具有的Store.YES属性的field .fdx文件：记录当前Document在.fdt文件中的位置，以便后面读取时方便 segments文件：通常，在一个完整的索引中，有且只有一个segments文件，该文件没有后缀，它记录了当前索引中所有的 segment的信息 .fnm文件:包含了Document中的所有field名称 .tis文件：用于存储分词后的词条(Term); .tii文件：是.tis文件的索引文件，它标明了每个.tis文件中的词条的位置 deletable文件：类似于Windows的回收站原理,所有的文档在被删除后，会首先在deletable文件中留一个记录，要真正删 除时，才将索引除去。 2.文档倒排 作用：统计词条的位置和词频信息 说明：倒排完毕后，所有的词条都被放入到了一个HashTable中，它的key是词条的Term对象，value是Posting类型的对象 lucene首先将这个HashTable转化成一个Posting类型的数组，然后对这个数组进行排序，使所有的词条按字典顺序 排列。那样，就可以将词条信息写入到.tii和.tis文件中。另外，将频率和位置信息写入.frq和.prx文件中去 3.StandardAnalyzer能将标点过滤掉 4.FSDirectory和RAMDirectory FSDirectory:指的是在文件系统中的一个路径 RAMDirectory:是内存中的一个区域 二者都可以作为索引的存储路径 5.合并索引 用户不但可以将存放于不同文件系统路径下的索引合并，还可以将内存中的索引与文件系统中的索引进行合并，以次来 保存那些存放于RAMDirectory中的索引 注意：合并内存中的索引时，一定要先将其相应的IndexWriter关闭，以保证滞留在缓存中的文档被刷到RAMDirectory中 去，这点与试用FSDirectory时一样。如果不使用close方法关闭IndexWriter，就会发现索引文件并未真正写入目 录中去。 合并索引的目的：是为了减少目录内的索引文件的数量，以使lucene能够更快地处理索引，这将大大加快lucene的检索速 度。 6.索引的优化 目的：对整个索引目录内、未合并的segment进行一个优化的合并，以保证检索时的速度 IndexWriter的optimize()方法能够对当前IndexWriter所指定的索引目录及其所使用的缓存目录下的所有的segment做优化 使所有的segment合并成一个完整的segment,即整个索引目录内只出现一种文件前缀 7.试用文档ID号来删除特定文档 逻辑删除：(相当于windows的回收站) IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.deleteDocument(0); reader.close(); 逻辑删除后恢复： IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.undeleteAll(); reader.close(); 物理删除： IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.optimize(); reader.close(); 8.lucene索引的同步问题 a. lucene的同步问题只可能发生在对索引进行文档添加、文档删除、合并segment和优化时 b. lucene有自己的锁机制可以防止非法操作的发生 [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucandra,when Lucene meet Cassandra</title>
		<link>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/</link>
		<comments>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/#comments</comments>
		<pubDate>Tue, 11 May 2010 10:18:51 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[云里雾里]]></category>
		<category><![CDATA[cassandra]]></category>
		<category><![CDATA[lucanadra]]></category>
		<category><![CDATA[nosql]]></category>
		<category><![CDATA[search]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=416</guid>
		<description><![CDATA[转自：http://blog.sematext.com/2010/02/09/lucandra-a-cassandra-based-lucene-backend/ GitHub地址：http://github.com/tjake/Lucandra/blob/master/README  关于Lucandra的介绍： Lucandra   Lucanadra线上应用：http://sparse.ly What is Cassandra? Cassandra is a scalable and easy to administer column-oriented data store, modeled after Google’s BigTable, but built by the designers of Amazon’s S3. One of the big differentiators of Cassandra is it does not rely on a global file system as Hbase and BigTable do. Rather, [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[独家]Elastic Search,偶然发现的强悍的搜索引擎</title>
		<link>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/</link>
		<comments>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/#comments</comments>
		<pubDate>Tue, 23 Mar 2010 09:59:54 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[小道消息]]></category>
		<category><![CDATA[Elastic Search]]></category>
		<category><![CDATA[json]]></category>
		<category><![CDATA[open source]]></category>
		<category><![CDATA[RESTful]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=306</guid>
		<description><![CDATA[闲逛，发现了这个好东东，分享下，绝对独家，哈哈。 elasticsearch Search Engine for the Cloud 下载地址：http://www.elasticsearch.com/download/ 示例里面的单双引号不和我的curl环境，我都改成了双引号的方式了，需要去掉json里面的回车（wordpress自动添加的...,或者下载这个文件README）。 h1. ElasticSearch h2. A Distributed RESTful Search Engine h3. "http://www.elasticsearch.com":http://www.elasticsearch.com ElasticSearch is a distributed RESTful search engine built for the cloud. Features include: * Distributed and Highly Available Search Engine. 分布式、高可用的搜索引擎 ** Each index is fully sharded with a configurable number of shards.支持sharding，并且灵活可配 ** Each shard [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

