<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>旁门左道 &#187; Lucene</title>
	<atom:link href="http://log.medcl.net/item/tag/lucene/feed/" rel="self" type="application/rss+xml" />
	<link>http://log.medcl.net</link>
	<description>记录生活</description>
	<lastBuildDate>Tue, 29 Nov 2011 15:39:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.1.2</generator>
		<item>
		<title>How to make searching faster</title>
		<link>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/</link>
		<comments>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/#comments</comments>
		<pubDate>Wed, 06 Apr 2011 13:21:03 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[search]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=704</guid>
		<description><![CDATA[http://wiki.apache.org/lucene-java/ImproveSearchingSpeed Here are some things to try to speed up the seaching speed of your Lucene application. Please see ImproveIndexingSpeed for how to speed up indexing. Be sure you really need to speed things up. Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2011/04/how-to-make-searching-faster/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ElasticSearch复杂查询DSL使用</title>
		<link>http://log.medcl.net/item/2010/09/elasticsearch-use-complex-queries-dsl/</link>
		<comments>http://log.medcl.net/item/2010/09/elasticsearch-use-complex-queries-dsl/#comments</comments>
		<pubDate>Mon, 20 Sep 2010 10:17:24 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[搜索]]></category>
		<category><![CDATA[elasticsearch]]></category>
		<category><![CDATA[es]]></category>
		<category><![CDATA[json]]></category>
		<category><![CDATA[Lucene]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=594</guid>
		<description><![CDATA[测试ES版本0.10.0,ES的Query DSL很灵活，可以实现复杂的查询，这里提供个简单的例子。 curl -XGET 'http://localhost:9200/_all/default/_search?pretty=true' -d ' { &#34;explain&#34;: true, &#34;from&#34;: 1, &#34;size&#34;: 12, &#34;fields&#34;: [ &#34;HasExperience&#34;, &#34;Name&#34; ], &#34;query&#34;: { &#34;term&#34;: { &#34;HasExperience&#34;: true, &#34;__TENANTID&#34;: &#34;100001&#34; }, &#34;range&#34;: { &#34;Age&#34;: { &#34;from&#34;: 0, &#34;to&#34;: 100, &#34;includeLower&#34;: true, &#34;includeUpper&#34;: true } } } } ' REF LINK:http://groups.google.com/a/elasticsearch.com/group/users/browse_thread/thread/549fb5ede5df6ff4/5836debd078c1b3d?lnk=gst&#038;q=lucene++query#5836debd078c1b3d http://www.elasticsearch.com/docs/elasticsearch/rest_api/query_dsl/ 附完整手册，注意大括号不要重复添加。 QUERY DSL SPEC: (better read in [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/09/elasticsearch-use-complex-queries-dsl/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[收藏]lucene知识点</title>
		<link>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/</link>
		<comments>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/#comments</comments>
		<pubDate>Wed, 14 Jul 2010 02:49:52 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=489</guid>
		<description><![CDATA[From：http://ybzshizds.javaeye.com/blog/279113 一、lucene索引的建立 1.索引文件 .fdt文件：主要保存数据源数据，存储的field的值仅为Document中具有的Store.YES属性的field .fdx文件：记录当前Document在.fdt文件中的位置，以便后面读取时方便 segments文件：通常，在一个完整的索引中，有且只有一个segments文件，该文件没有后缀，它记录了当前索引中所有的 segment的信息 .fnm文件:包含了Document中的所有field名称 .tis文件：用于存储分词后的词条(Term); .tii文件：是.tis文件的索引文件，它标明了每个.tis文件中的词条的位置 deletable文件：类似于Windows的回收站原理,所有的文档在被删除后，会首先在deletable文件中留一个记录，要真正删 除时，才将索引除去。 2.文档倒排 作用：统计词条的位置和词频信息 说明：倒排完毕后，所有的词条都被放入到了一个HashTable中，它的key是词条的Term对象，value是Posting类型的对象 lucene首先将这个HashTable转化成一个Posting类型的数组，然后对这个数组进行排序，使所有的词条按字典顺序 排列。那样，就可以将词条信息写入到.tii和.tis文件中。另外，将频率和位置信息写入.frq和.prx文件中去 3.StandardAnalyzer能将标点过滤掉 4.FSDirectory和RAMDirectory FSDirectory:指的是在文件系统中的一个路径 RAMDirectory:是内存中的一个区域 二者都可以作为索引的存储路径 5.合并索引 用户不但可以将存放于不同文件系统路径下的索引合并，还可以将内存中的索引与文件系统中的索引进行合并，以次来 保存那些存放于RAMDirectory中的索引 注意：合并内存中的索引时，一定要先将其相应的IndexWriter关闭，以保证滞留在缓存中的文档被刷到RAMDirectory中 去，这点与试用FSDirectory时一样。如果不使用close方法关闭IndexWriter，就会发现索引文件并未真正写入目 录中去。 合并索引的目的：是为了减少目录内的索引文件的数量，以使lucene能够更快地处理索引，这将大大加快lucene的检索速 度。 6.索引的优化 目的：对整个索引目录内、未合并的segment进行一个优化的合并，以保证检索时的速度 IndexWriter的optimize()方法能够对当前IndexWriter所指定的索引目录及其所使用的缓存目录下的所有的segment做优化 使所有的segment合并成一个完整的segment,即整个索引目录内只出现一种文件前缀 7.试用文档ID号来删除特定文档 逻辑删除：(相当于windows的回收站) IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.deleteDocument(0); reader.close(); 逻辑删除后恢复： IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.undeleteAll(); reader.close(); 物理删除： IndexReader reader=IndexReader(INDEX_STORE_PATH); reader.optimize(); reader.close(); 8.lucene索引的同步问题 a. lucene的同步问题只可能发生在对索引进行文档添加、文档删除、合并segment和优化时 b. lucene有自己的锁机制可以防止非法操作的发生 [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/07/collection-lucene-knowledge-points/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucandra,when Lucene meet Cassandra</title>
		<link>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/</link>
		<comments>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/#comments</comments>
		<pubDate>Tue, 11 May 2010 10:18:51 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[云里雾里]]></category>
		<category><![CDATA[cassandra]]></category>
		<category><![CDATA[lucanadra]]></category>
		<category><![CDATA[nosql]]></category>
		<category><![CDATA[search]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=416</guid>
		<description><![CDATA[转自：http://blog.sematext.com/2010/02/09/lucandra-a-cassandra-based-lucene-backend/ GitHub地址：http://github.com/tjake/Lucandra/blob/master/README  关于Lucandra的介绍： Lucandra   Lucanadra线上应用：http://sparse.ly What is Cassandra? Cassandra is a scalable and easy to administer column-oriented data store, modeled after Google’s BigTable, but built by the designers of Amazon’s S3. One of the big differentiators of Cassandra is it does not rely on a global file system as Hbase and BigTable do. Rather, [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/05/lucandra-when-lucene-meet-cassandra/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[独家]Elastic Search,偶然发现的强悍的搜索引擎</title>
		<link>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/</link>
		<comments>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/#comments</comments>
		<pubDate>Tue, 23 Mar 2010 09:59:54 +0000</pubDate>
		<dc:creator>medcl</dc:creator>
				<category><![CDATA[Lucene]]></category>
		<category><![CDATA[小道消息]]></category>
		<category><![CDATA[Elastic Search]]></category>
		<category><![CDATA[json]]></category>
		<category><![CDATA[open source]]></category>
		<category><![CDATA[RESTful]]></category>

		<guid isPermaLink="false">http://log.medcl.net/?p=306</guid>
		<description><![CDATA[闲逛，发现了这个好东东，分享下，绝对独家，哈哈。 elasticsearch Search Engine for the Cloud 下载地址：http://www.elasticsearch.com/download/ 示例里面的单双引号不和我的curl环境，我都改成了双引号的方式了，需要去掉json里面的回车（wordpress自动添加的...,或者下载这个文件README）。 h1. ElasticSearch h2. A Distributed RESTful Search Engine h3. "http://www.elasticsearch.com":http://www.elasticsearch.com ElasticSearch is a distributed RESTful search engine built for the cloud. Features include: * Distributed and Highly Available Search Engine. 分布式、高可用的搜索引擎 ** Each index is fully sharded with a configurable number of shards.支持sharding，并且灵活可配 ** Each shard [...]]]></description>
		<wfw:commentRss>http://log.medcl.net/item/2010/03/elastic-search-accidentally-discovered-the-powerful-search-engine/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

