차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

--- search:elasticsearch [2019/02/14 19:11]
kwon37xi [Linux 설정]
+++ search:elasticsearch [2023/04/29 14:03] (현재)
kwon37xi [Linux 설정]
@@ 줄 14: / 줄 14: @@
 ===== Sharding Routing =====
+  * 만약 Search 를 명확히 특정 Shard 단위로 할 수 있다면 샤딩을 촘촘히 해도 읽기/쓰기 성능이 모두 좋지만
+  * Sharding 기준이 명확하지 않아서 여러 Shard 에 걸쳐 Search 를 해야한다면, Shard 를 늘릴 수록
+    * 읽기 성능은 저하된다.
+    * Write Primary 노드는 여러개로 분산 되므로 Write 성능은 높아진다.
 ==== Routing 강제 ====
 라우팅을 강제할 수 있다. 라우팅 옵션 없이는 인덱싱 불가.
@@ 줄 77: / 줄 81: @@
 sysctl -w vm.max_map_count=262144
 </code>
+  * [[linux:performance|Linux Performance]]
 ===== 환경변수 =====
   * ''JAVA_OPTS'' : Java 기본 옵션들
@@ 줄 87: / 줄 91: @@
 ===== 최적화 =====
+  * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-replication.html|Reading and Writing documents]]
   * ''index.refresh_interval: 시간s'' : 인덱스를 push 하는 시간이라고 보면 되는데 ''5s'' 형태로 준다. 길수록 CPU 점유율은 떨어지지만 검색에 안나오는 시간도 길어진다.
   * ''bootstrap.mlockall: true'' : Linux 등에서 ES의 메모리를 swapping 하지 않게 설정 등.
@@ 줄 93: / 줄 98: @@
     * 메모리는 31GB 혹은 32bit Pointer가 될수 있는 max 값.
     * Shard 는 최대 30GB가 될 정도 수준으로 구성.(Replica 도 계산시 단일 Shard로 쳐서)
+    * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/tune-for-search-speed.html|Tune for search speed]]
+    * [[https://qbox.io/blog/optimizing-elasticsearch-how-many-shards-per-index|Optimizing Elasticsearch: How Many Shards per Index?]]
+===== Write Performance =====
+  * Sharding 을 하지 않을 경우 모든 Write 요청이 하나의 Primary Data Node로 집중된다.
+  * Sharding 을 하면 각 Shard 별 Data Node로 분할 된다.
+  * Write Thread 는 CPU 갯수만큼 생성된다. 그리고 Queue가 200개 할당된다.
+  * Qeueue 갯수를 넘는 Write/Update 요청이 들어오면 reject 오류가 발생한다.
+  * Write Thread 를 늘리고자 한다면 Scale Up 해서 CPU 갯수를 늘린다. Queue 갯수를 늘리는 것은 미봉책이므로 하지 않는 것이 좋다.
+  * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/tune-for-indexing-speed.html|Tune for indexing speed]]
+  * [[https://www.elastic.co/kr/blog/why-am-i-seeing-bulk-rejections-in-my-elasticsearch-cluster|Why am I seeing bulk rejections in my Elasticsearch cluster?]]
+  * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-threadpool.html|Thread Pool]]
+  * [[https://www.datadoghq.com/blog/elasticsearch-performance-scaling-problems/|How to solve 5 Elasticsearch performance and scaling problems]]
+  * [[https://brunch.co.kr/@alden/36|rejected exception의 의미와 조치 방법]]
+  * ''cat threadpool''<code>
+GET /_cat/thread_pool
+</code>
+===== Memory =====
+  * **32GB** 넘기지 말 것.
+  * [[https://brunch.co.kr/@alden/35|ElasticSearch와 Heap 메모리]]
 ===== G1 GC =====
@@ 줄 99: / 줄 125: @@
   * [[https://medium.com/naukri-engineering/garbage-collection-in-elasticsearch-and-the-g1gc-16b79a447181|Garbage Collection in Elasticsearch and the G1GC – Naukri Engineering – Medium]]
   * [[https://sematext.com/blog/java-9-elasticsearch-benchmark/|Java 9 Elasticsearch Benchmark: upgrading benefits]]
+===== Disk Size =====
+  * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/tune-for-disk-usage.html|Tune for disk usage ]]
@@ 줄 119: / 줄 149: @@
   * 한 번 Version Upgrade 한 뒤 indexing을 하면 다시 Downgrade 할 수 없다. index를 백업 한 뒤에 업그레이드하라.
   * 2.x 버전에서 Tokenizer Plugin 을 사용할 때, 기본 Tokenizer type 이름과 tokenizer 이름이 다를경우 해당 토크나이저의 설정 정보가 처음에는 올바른 상태로 그리고 다시 한 번은 null 인 상태로 ''XxxTokenizerFactory'' 생성자가 한 번 더 호출되는 문제가 있다. 이에 따라 type 이름과 토크나이저 이름을 동일하게 맞춰줘야 했다. 이 경우 생성자가 인덱스당 한 번씩만 호출되었다.
 ===== 참조 =====
   * [[http://blog.trifork.com/2013/10/24/how-to-avoid-the-split-brain-problem-in-elasticsearch/|How to avoid the split-brain problem in elasticsearch]]
@@ 줄 125: / 줄 156: @@
   * [[https://www.javacodegeeks.com/2017/03/elasticsearch-java-developers-elasticsearch-java.html|Elasticsearch for Java Developers: Elasticsearch from Java | Java Code Geeks - 2017]]
   * [[https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-mapping-charfilter.html|Mapping Char Filter | Elasticsearch Reference [6.2] | Elastic]] 특수 문자등의 검색
+  * [[https://esbook.kimjmin.net/|Elastic 가이드 북 - Elastic 가이드북]]
+  * [[https://aws.amazon.com/ko/premiumsupport/knowledge-center/opensearch-latency-spikes/|Amazon OpenSearch Service의 검색 대기 시간 스파이크 문제 해결]]

권남

사용자 도구

사이트 도구

차이

문서 도구