Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- layout
- Servlet Life Cycle
- Bean Factory란
- 안드로이드
- ElasticSearch 동의어 파일
- Spring Handler
- Servlet 멀티 스레딩
- 인텔리제이
- 안드로이드스튜디오
- ApplicationContext란
- ElasticSearch 동의어 사전
- Java
- Servlet Container란
- 자바
- spring 장점
- 계산기
- Dispathcher Servlet이란
- H2
- Spring Servlet이란
- elasticSearch
- Servlet과 Thread
- ElasticSearch Shingle
- ElasticSearch NGram
- ElasticSearch 토큰필터
- ElasticSearch EdgeNGram
- 동의어 파일
- 토큰필터
- Spring Container란
- ContextLoaderListener란
- H2 DB
Archives
- Today
- Total
결국 무엇이든 해내는 사람
ElasticSearch - (캐릭터 필터)HTML Strip 란 [ 예제, 설명 ] 본문
두서없는 공부 노트/ElasticSearch
ElasticSearch - (캐릭터 필터)HTML Strip 란 [ 예제, 설명 ]
kkm8257 2021. 12. 14. 14:45반응형
-- HTML로 된 텍스트 값의 경우 태그들을 제거하여 일반 텍스트로 만들 수 있다.
-- <> 로 된 태그 뿐만 아니라 와 같은 html 문법 용어들도 해석한다
-- 옵션은 html_strip 으로 줄 수 있다.
POST _analyze
{
"tokenizer": "keyword",
"char_filter": [
"html_strip"
],
"text": "<p>I'm so <b>happy</b>!</p>"
}
-- I'm so happy! 로 변경되었음
-- [ 주의 ]
-- 애널라이저는 최소 1개의 토크나이저를 필요로 하기 때문에 캐릭터 필터만 적용하면 오류가 발생한다.
-- 그러므로 위에서는 keyword 토크나이저를 사용
반응형
'두서없는 공부 노트 > ElasticSearch' 카테고리의 다른 글
ElasticSearch - pattern replace란 [ 예제, 설명 ] (0) | 2021.12.14 |
---|---|
ElasticSearch - 캐릭터 필터 매핑 ( char_filter ) 단어 치환 [ 예제, 설명 ] (0) | 2021.12.14 |
ElasticSearch - Custom Analyzer 만들기 ( 커스텀 애널라이저 ) [ 예제, 설명 ] (0) | 2021.12.14 |
ElasticSearch - Term Query란 [ 예제, 설명 ] (0) | 2021.12.14 |
ElasticSearch - _analyze API란 [ 예제, 설명 ] (0) | 2021.12.14 |
Comments