CS 공부
로드밸런싱 본문
로드 밸런싱을 사용하는 이유
요즘 시대에는 웹사이트에 많은 사람들이 접속하게 된다, 따라서 많은 사람들이 접속하게 되니 1대의 서버가 트래픽을 감당할 수 있는 시대가 지났다. 트래픽의 서버의 부화가 심할 때의 가장 먼저 하는 일은 DB 서버의 분리이다.
하지만 처음에는 DB서버의 분리만의로도 서버의 부하를 감당할 수 있었으나 이제는 DB서버의 분리만으로도 부하를 감당하기가 힘들어지게 되었다.
웹서버의 부하를 어떻게 해결해 나갈 것인지 대한 고뇌를 하게 되어 찾은 해결방법이 바로 로드밸런싱이다.
로드 밸런싱이란?
로드밸런서는 서버에 가해지는 부하를 분산해주는 장치 또는 기술을 통칭합니다.
클라이언트와 서버풀(Server Pool, 분산 네트워크를 구성하는 서버들의 그룹) 사이에 위치하며, 한 대의 서버로 부하가 집중되지 않도록 트래픽을 관리해 각각의 서버가 최적의 퍼포먼스를 보일 수 있도록 한다.
Scale up과 Scale out
Scale-up의 경우 서버 자체의 성능을 확장하는 것을 의미한다.
비유하자면 CPU가 i3인 컴퓨터를 i7으로 업그레이드하는 것과 같다.
반면 Scale-out의 경우 기존 서버와 동일하거나 낮은 성능의 서버를 두 대 이상 증설하여 운영하는 것을 의미한다. CPU가 i3인 컴퓨터를 여러 대 추가 구입해 운영하는 것에 비유할 수 있다.
Scale-out의 방식으로 서버를 증설하기로 결정했다면 여러 대의 서버로 트래픽을 균등하게 분산해주는 로드밸런싱이 반드시 필요하다.
MSA 추가 해야함
로드밸런싱 방식(알고리즘)
라운드로빈 방식(Round Robin Method)
서버에 들어온 요청을 순서대로 돌아가며 배정하는 방식
클라이언트의 요청을 순서대로 분배하기 때문에 여러 대의 서버가 동일한 스펙을 갖고 있고,
서버와의 연결(세션)이 오래 지속되지 않는 경우에 활용하기 적합
가중 라운드로빈 방식(Weighted Round Robin Method)
각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적으로 배분
주로 서버의 트래픽 처리 능력이 상이한 경우 사용되는 부하 분산 방식
예를 들어 A라는 서버가 5라는 가중치를 갖고 B라는 서버가 2라는 가중치를 갖는다면, 로드밸런서는 라운드로빈 방식으로 A 서버에 5개 B 서버에 2개의 요청을 전달합니다.
IP 해시 방식(IP Hash Method)
클라이언트의 IP 주소를 특정 서버로 매핑하여 요청을 처리하는 방식입니다.
사용자의 IP를 해싱(Hashing, 임의의 길이를 지닌 데이터를 고정된 길이의 데이터로 매핑하는 것, 또는 그러한 함수)을 이용하여 로드를 분배하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장
최소 연결 방식(Least Connection Method)
요청이 들어온 시점에 가장 적은 연결 상태를 보이는 서버에 우선적으로 트래픽을 배분한다.
자주 세션이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우에 적합한 방식
최소 리스폰타임(Least Response Time Method)
서버의 현재 연결 상태와 응답시간(Response Time, 서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려하여 트래픽을 배분한다.
가장 적은 연결 상태와 가장 짧은 응답시간을 보이는 서버에 우선적으로 로드를 배분하는 방식
부하 분산에는 L4(Transport Layer) 로드밸런서와 L7(Application) 로드밸런서가 가장 많이 활용된다.
그 이유는 L4 로드밸런서부터 포트(Port)정보를 바탕으로 로드를 분산하는 것이 가능하기 때문이다.
한 대의 서버에 각기 다른 포트 번호를 부여하여 다수의 서버 프로그램을 운영하는 경우라면 최소 L4 로드밸런서 이상을 사용해야한다.
L4 로드밸런스(클래식 로드 밸런스)
네트워크 계층(IP, IPX)이나 트랜스포트 계층(TCP, UDP)의 정보를 바탕으로 로드를 분산한다.
IP주소나 포트번호, MAC주소, 전송 프로토콜에 따라 트래픽을 나누는 것이 가능하다.
L7 로드밸런서(애플리케이션 로드 밸런스)
애플리케이션 계층(HTTP, FTP, SMTP)에서 로드를 분산하기 때문에 HTTP 헤더, 쿠키 등과 같은 사용자의 요청을 기준으로 특정 서버에 트래픽을 분산하는 것이 가능하다.
쉽게 말해 패킷의 내용을 확인하고 그 내용에 따라 로드를 특정 서버에 분배하는 것이 가능하다.
L4 로드밸런서와 L7로드밸런서의 비교
로드밸런서 장애 대비 (내용 더 추가해야함)
로드 밸런서 자체에 문제 생길 경우를 대비해 로드 밸런서를 이중화한다.
서로 health check. Main에 문제가 생기면 여분의 passive 로드밸런서를 main으로 사용한다.
- active - active: 기능에 따라 서버를 나눠서 처리. 장애가 발생해도 Down time없이 무중단 서비스 가능. 데이터 이중화와 한 서버가 장애가 나도 복원력이 뛰어나다는 장점.
- active - passive(stand by): heartbeat로 지속적으로 시스템의 상태를 주기적으로 체크하고 active 로드밸런서가 문제있으면 바로 패시브(백업용)로 운영한다. Down time 발생
참고: https://post.naver.com/viewer/postView.nhn?volumeNo=27046347&memberNo=2521903
'CS공부 > 컴퓨터네트워크' 카테고리의 다른 글
DNS 서비스 & 동작원리 (0) | 2021.08.02 |
---|---|
Blocking & Non-Blocking I/O(+동기/비동기) (0) | 2021.06.30 |
UDP란 (0) | 2021.06.26 |
HTTP & HTTPS (0) | 2021.06.26 |
대칭키 & 공개키 (0) | 2021.06.26 |