Elasticsearch _rollover API 사용하여, 효율적인 저장 분배
Skew란?
데이터가 전체 샤드에 골고루 분배되지 않는 상황
Rollover를 사용하여 해결하기
_rollover API는 임계치를 넘어가면 새로운 인덱스를 생성한다.
1
2
3
4
5
6
7
8
9
10
11
12
POST _aliases
{
"actions": [
{
"add": {
"index": "weblogs-000001",
"alias": "weblogs",
"is_write_index": true
}
}
]
}
위 작업을 cron, 스케줄링 도구로 실행할수 있다.
1
2
3
4
5
6
POST /weblogs/_rollover
{
"conditions": {
"max_size": "10gb"
}
}
rollover 조건은 위와 같이 설정할수 있다.