Tag: database
RDBMS的lucene爬虫
主要介绍如何周期性尽量实时地从RDBMS爬数据然后建索引,不涉及AOP或ORM Framework的listener方式。
先决条件:
1. Lucene索引是从无到有的,一开始所有数据都是存储在RDBMS(Oracle)中。
2. 数据表有一列是updateTime或称为lastModifiedTime用来存储最后一次更新时间,并建有db索引
3. 主表必须要有主键,这个主键也用来唯一确定一个Lucene ... [阅读全文]