본문 바로가기
기타

일부 문서 색인

2020. 12. 20.
반응형

일부 문서 색인

클러스터를 시작하고 실행하면 일부 데이터를 인덱싱 할 준비가 된 것입니다. Elasticsearch에 대한 다양한 수집 옵션이 있지만 결국 모두 동일한 작업을 수행합니다. JSON 문서를 Elasticsearch 인덱스에 넣습니다.

문서를 추가 할 색인, 고유 문서 ID 및 "field": "value"요청 본문에있는 하나 이상의  을 지정하는 간단한 PUT 요청을 사용하여이 작업을 직접 수행 할 수 있습니다 .

 

이 요청은 customer인덱스가 아직없는 경우 자동으로 생성하고 ID가 인 새 문서를 추가하며 필드를 1저장 및 인덱싱합니다 name.

이 문서는 새 문서이므로 응답은 작업 결과가 문서의 버전 1이 생성되었음을 보여줍니다.

 

 

새 문서는 클러스터의 모든 노드에서 즉시 사용할 수 있습니다. 문서 ID를 지정하는 GET 요청으로 검색 할 수 있습니다.

응답은 지정된 ID를 가진 문서가 발견되었음을 나타내며 인덱싱 된 원래 소스 필드를 표시합니다.

 

대량으로 문서 인덱싱

색인을 생성 할 문서가 많은 경우 대량 API를 사용하여 일괄 적으로 제출할 수 있습니다 . 대량 일괄 문서 작업을 사용하면 네트워크 왕복을 최소화하므로 개별적으로 요청을 제출하는 것보다 훨씬 빠릅니다.

최적의 배치 크기는 문서 크기 및 복잡성, 인덱싱 및 검색로드, 클러스터에서 사용할 수있는 리소스 등 여러 요인에 따라 달라집니다. 시작하기 좋은 곳은 1,000 ~ 5,000 개의 문서 배치와 5MB ~ 15MB 사이의 총 페이로드입니다. 여기에서 실험을 통해 최적의 지점을 찾을 수 있습니다.

검색 및 분석을 시작할 수있는 일부 데이터를 Elasticsearch로 가져 오려면 :

  1. accounts.json샘플 데이터 세트를 다운로드하십시오 . 이 임의로 생성 된 데이터 세트의 문서는 다음 정보가있는 사용자 계정을 나타냅니다.

반응형

'기타' 카테고리의 다른 글

집계로 결과 분석  (0) 2020.12.20
검색 시작  (0) 2020.12.20
Elasticsearch 시작 및 실행  (0) 2020.12.20
Elasticsearch 시작하기  (0) 2020.12.20
조정 노드의 요청 수준 회로 차단기  (0) 2020.12.20

댓글