1、一个string类型的字段,其他一切属性都是默认的。对这个属性进行分组查询

2、使用aggs中的terms来实现分组查询{ "aggs": { "挢旗扦渌;group_yy": { "terms": { "field": "domain" } } }}

3、看下结果,我这里都是完整的域名的,有些域名中出现了横线的被分成两个部分了。对这个字段使用之前指定的ngram分词,每个字符都分组了。好像有点明白了,这里应该也是被分词了。

4、原来默认情况下,字符串类型的字段是被分析过的。这意味着他们的值被先处理成了一个词的列表,即那些被加入到倒排索引中的词。

5、这就好办啦,给这个字符串类型的默认分析器干掉就OK啦。属性加上not_analyzed

6、造几个数据测试下看看吧搞定,一切ok!
