본문 바로가기
기타

정보 출력 : 검색 및 분석

2020. 12. 20.
반응형

정보 출력 : 검색 및 분석

Elasticsearch를 문서 저장소로 사용하고 문서와 해당 메타 데이터를 검색 할 수 있지만, 진정한 힘은 Apache Lucene 검색 엔진 라이브러리에 구축 된 전체 검색 기능에 쉽게 액세스 할 수 있다는 것입니다.

Elasticsearch는 클러스터를 관리하고 데이터를 인덱싱 및 검색하기위한 간단하고 일관된 REST API를 제공합니다. 테스트 목적으로 명령 줄에서 직접 또는 Kibana의 개발자 콘솔을 통해 쉽게 요청을 제출할 수 있습니다. 애플리케이션에서 원하는 언어 (Java, JavaScript, Go, .NET, PHP, Perl, Python 또는 Ruby)로 Elasticsearch 클라이언트  사용할 수 있습니다 .

데이터 검색

Elasticsearch REST API는 구조화 된 쿼리, 전체 텍스트 쿼리 및 두 가지를 결합하는 복잡한 쿼리를 지원합니다. 구조화 된 쿼리는 SQL에서 생성 할 수있는 쿼리 유형과 유사합니다. 예를 들어, 색인 에서 gender및 age필드를 검색 하고 필드 employee별로 일치 항목을 정렬 할 수 hire_date있습니다. 전체 텍스트 쿼리는 쿼리 문자열과 일치하는 모든 문서를 찾아 관련성 ( 검색 용어와 얼마나 일치하는지) 별로 정렬하여 반환합니다 .

개별 용어를 검색하는 것 외에도 구문 검색, 유사성 검색 및 접두사 검색을 수행하고 자동 완성 제안을받을 수 있습니다.

검색하려는 지리 공간 또는 기타 숫자 데이터가 있습니까? Elasticsearch는 고성능 지리 및 수치 쿼리를 지원하는 최적화 된 데이터 구조에서 비 텍스트 데이터를 인덱싱합니다.

Elasticsearch의 포괄적 인 JSON 스타일 쿼리 언어 ( Query DSL )를 사용하여 이러한 모든 검색 기능에 액세스 할 수 있습니다 . 또한 SQL 스타일 쿼리  구성 하여 Elasticsearch 내에서 기본적으로 데이터를 검색하고 집계 할 수 있으며 JDBC 및 ODBC 드라이버를 사용하면 광범위한 타사 애플리케이션이 SQL을 통해 Elasticsearch와 상호 작용할 수 있습니다.

데이터 분석

Elasticsearch 집계를 사용하면 복잡한 데이터 요약을 작성하고 주요 지표, 패턴 및 추세에 대한 통찰력을 얻을 수 있습니다. "건초 더미에서 바늘"이라는 속담을 찾는 대신 집계를 사용하면 다음과 같은 질문에 답할 수 있습니다.

  • 건초 더미에 바늘이 몇 개 있습니까?
  • 바늘의 평균 길이는 얼마입니까?
  • 제조업체별로 분류 된 바늘의 중간 길이는 얼마입니까?
  • 지난 6 개월 동안 건초 더미에 몇 개의 바늘이 추가 되었습니까?

집계를 사용하여 다음과 같은보다 미묘한 질문에 답할 수도 있습니다.

  • 가장 인기있는 바늘 제조업체는 무엇입니까?
  • 비정상적이거나 비정상적인 바늘 덩어리가 있습니까?

집계는 검색에 사용되는 것과 동일한 데이터 구조를 활용하기 때문에 매우 빠릅니다. 이를 통해 실시간으로 데이터를 분석하고 시각화 할 수 있습니다. 보고서 및 대시 보드는 데이터가 변경되면 업데이트되므로 최신 정보를 기반으로 조치를 취할 수 있습니다.

또한 집계는 검색 요청과 함께 작동합니다. 단일 요청으로 동일한 데이터에 대해 문서를 검색하고 결과를 필터링하며 동시에 분석을 수행 할 수 있습니다. 그리고 집계는 특정 검색의 컨텍스트에서 계산되기 때문에 모든 크기 70 바늘의 개수를 표시하는 것이 아니라 사용자의 검색 기준과 일치하는 크기 70 바늘의 개수를 표시합니다. 모든 크기 70 붙지 않는 자수 바늘.

하지만 잠깐만 더

시계열 데이터 분석을 자동화하고 싶으십니까? 당신이 사용할 수있는 학습 시스템을 데이터에 정상적인 동작의 정확한 기준을 만들고 비정상적인 패턴을 식별하는 기능. 기계 학습을 통해 다음을 감지 할 수 있습니다.

  • 값, 개수 또는 빈도의 시간적 편차와 관련된 이상
  • 통계적 희소성
  • 인구 구성원의 비정상적인 행동

그리고 가장 좋은 부분은? 알고리즘, 모델 또는 기타 데이터 과학 관련 구성을 지정하지 않고도이를 수행 할 수 있습니다.

반응형

댓글