Lucene Analyzer中的Position Increment

带点语病地说,Position Increment 代表token之间的“间隙值”。

一般来说,这个值等于1.  

比如 Obama is a politician 分拆后,

引用
Obama      – position1

is         – position2

a          – position3

politician – position4

1,2,3,4 以1累进

如果Position Increment大于1,则代表有的词省略了。

引用
Obama      – position1

politician – position4

从1直接跳跃到4

如果Position Increment为0,则一般是因为Analyzer配上了同义词

引用

Obama      – position1

politician – position4

statesman  – position4

politician和statesman同义,它们的位置都是4

Leave a Comment

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.