결국 무엇이든 해내는 사람

ElasticSearch - pattern replace란 [ 예제, 설명 ] 본문

두서없는 공부 노트/ElasticSearch

ElasticSearch - pattern replace란 [ 예제, 설명 ]

kkm8257 2021. 12. 14. 15:23
반응형
-- pattern_replace 캐릭터 필터는 정규식을 이용한 치환이다
-- 캐릭터 필터는 토크나이저가 적용되기 이전에 , 필드 내용을 치환하는 전처리 과정이다.


-- 아래의 예는 카멜 표기법으로 된 단어를 대문자가 시작되는 부분에 공백을 넣어
-- 단어별로 토큰화 하는 예제

PUT camel
{
  "settings": {
    "analysis": {
      "analyzer": {
        "camel_analyzer": {
          "char_filter": [
            "camel_filter"
          ],
          "tokenizer": "standard",
          "filter": [
            "lowercase"
          ]
        }
      },
      "char_filter": {
        "camel_filter": {
          "type": "pattern_replace",
          "pattern": "(?<=\\p{Lower})(?=\\p{Upper})",
          "replacement": " "
        }
      }
    }
  }
}


GET camel/_analyze
{
  "analyzer": "camel_analyzer",
  "text": [
    "public void FooBazBar()"
  ]
}


반응형
Comments