본문 바로가기

TIL(Today I Learned)

TIL-231031(Garbage Collection)

📝오늘 공부한 것

  • Garbage Collection 공부
  • 커리어톤 참여하기
  • 프로그래머스 문제풀기

📌 Garbage Collection

📍 가비지 컬렉션 (GC)

  • 메모리 관리 기법 중의 하나로, 프로그램이 동적으로 할당했던 메모리 영역 중에서 필요없게 된 영역을 해제하는 기능이다.(위키피디아)
  • Heap 메모리를 살펴보고 사용 중인 객체와 사용되지 않는 객체를 식별하고 사용되지 않는 객체를 삭제하는 프로세스이다. 사용중인 객체 또는 참조된 객체는 프로그램의 일부가 여전히 해당 객체에 대한 포인터를 유지하고 있음을 의미한다. 사용되지 않는 객체 또는 참조되지 않은 객체는 더 이상 프로그램의 어떤 부분에서도 참조되지 않으므로 메모리를 회수할 수 있다.(오라클)
  • 프로그램을 개발하다보면 유효하지 않은 메모리인 가비지가 발생하게 된다. C언어는 함수를 통해 직접 메모리를 해제해주어야 하지만, Java는 JVM의 Garbage Collector가 불필요한 메모리를 알아서 정리해주므로 개발자가 메모리를 직접 해제해주는 일이 없다.
  • Java는 프로그램 코드에서 메모리를 명시적으로 지정하여 해제하지 않는다. 가끔 명시적으로 해제하려고 해당 객체를 null로 지정하거나 System.gc( )메서드를 호출하는 개발자가 있다.
  • null로 지정하는 것은 큰 문제가 안되지만, System.gc( ) 메서드를 호출하는 것은 시스템의 성능에 매우 큰 영향을 끼치므로 절대 사용하면 안된다.
  • 장점 :
    Java에서는 Garbage Collector가 메모리 관리를 대행해주기 때문에 Java 프로세스가 한정된 메모리를 효율적으로 사용할 수 있게 하고, 개발자 입장에서 메모리 관리, 메모리 누구 문제에 대해 관리하지 않아도 되어 개발에만 집중할 수 있다.
  • 단점 :
    자동으로 처리해준다해도 메모리가 언제 해제되는지 정확하게 알수 없어 제어하기 힘들며, GC가 동작하는 동안에는 다른 동작을 멈추기 때문에 오버헤드가 발생되는 문제점이 있다.

 

📍 Minor GC / Major GC

가비지 컬렉터는 2가지를 전제로 설계되었다.

     1. 대부분의 객체는 금방 접근 불가능한 상태(Unreachable)가 된다.

     2. 오래된 객체에서 새로운 객체로의 참조는 아주 적게 존재한다.

즉, 객체는 대부분 일회성이며, 메모리에 오랫동안 남아있는 경우는 드물다는 것이다. 그렇게 때문에 객체의 생존 기간에 따라 물리적인 Heap 영역을 나누게 되었고 Young, Old 총 2가지 영역으로 설계되었다. 초기에는 Perm 영역이 존재하였지만 Java8부터 제거되었다.

 

[ Java8 에서의 Permanent ]

Permanent는 직역하면 영구적인 세대의 의미로서, 생성된 객체들의 정보의 주소값이 저장된 공간이다. 클래스로더에 의헤 load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용된다.

Java 7 까지는 힙 영역에 존재했지만 Java 8 버전 이후에는 Native Method Stack에 편입되게 된다.

https://inpa.tistory.com/entry/JAVA-%E2%98%95-%EA%B0%80%EB%B9%84%EC%A7%80-%EC%BB%AC%EB%A0%89%EC%85%98GC-%EB%8F%99%EC%9E%91-%EC%9B%90%EB%A6%AC-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%F0%9F%92%AF-%EC%B4%9D%EC%A0%95%EB%A6%AC

 

[ Young 영역 (Young Generation) ]

  • 새롭게 생성된 객체가 할당되는 영역
  • 대부분의 객체가 금방 Unreachable 상태가 되기 때문에, 많은 객체가 Young 영역에 생성되었다가 사라진다.
  • 이 영역에서 객체가 사라질 때 Minor GC가 발생한다고 한다.

 

[ Old 영역 (Old Generation) ]

  • Young 영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역
  • 대부분 Young 영역보다 크게 할당되며, 영역의 크기가 큰 만큼 GC는 적게 발생한다.
  • 이 영역에서 객체가 사라질 때 Major GC가 발생한다고 한다.

Old 영역이 Young 영역보다 크게 할당되는 이유는 Young 영역의 수명이 짧은 객체들은 큰 공간을 필요로 하지 않으며 큰 객체들은 Young 영역이 아니라 바로 Old 영역에 할당되기 때문이다.

 

[ Old 영역에 있는 객체가 Young 영역의 객체를 참조하는 경우 ]

이러한 경우를 처리하기 위하여 Old 영역에는 카드테이블이 존재한다.

카드 테이블에는 Old영역에 있는 객체가 Young 영역의 객체를 참조할 때마다 그에 대한 정보가 표시된다. 카드테이블이 도입된 이유는 Young 영역에서 가비지 컬렉션이 실행될 때 모든 Old 영역에 존재하는 객체를 검사하여 참조되지 않는 Young 영역의 객체를 식별하는 것이 비효율적이기 때문이다. 그렇게 때문에 Young 영역에서 가비지 컬렉션이 진행될 때 카드 테이블만 조회하여 GC의 대상인지 식별할 수 있도록 하고 있다.

 

https://d2.naver.com/helloworld/1329

 

📍 동작 방식

1. Stop The World

가비지 컬렉션을 실행하기 위해 JVM이 애플리케이션의 실행을 멈추는 작업이다. stop-the-world가 발생하면 GC를 실행하는 쓰레드를 제외한 나머지 쓰레드는 모두 작업을 멈춘다. GC 작업을 완료한 이후에 중단했던 작업을 다시 시작한다. 어떤 GC 알고리즘을 사용하더라도 stop-the-world는 발생한다. 대체로 GC 튜닝이란 stop-the-world 시간을 줄이는 것이다.

 

2. Mark and Sweep

1단계 : Marking

사용중인 메모리와 사용하지 않는 메모리를 식별한다.

2단계 : Sweep

Mark 단계에서 사용되지 않음으로 식별된 메모리를 해체하는 작업

https://inpa.tistory.com/entry/JAVA-%E2%98%95-%EA%B0%80%EB%B9%84%EC%A7%80-%EC%BB%AC%EB%A0%89%EC%85%98GC-%EB%8F%99%EC%9E%91-%EC%9B%90%EB%A6%AC-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%F0%9F%92%AF-%EC%B4%9D%EC%A0%95%EB%A6%AC

Stop The World를 통해 모든 작업을 중단시키면, GC는 스택의 모든 변수 또는 Reachable 객체를 스캔하면서 각각이 어떤 객체를 참고하고 있는지를 탐색하게 된다. 그리고 사용되고 있는 메모리를 식별하는데, 이러한 과정을 Mark라고 한다. 이후에 Mark가 되지 않은 객체들을 메모리에서 제거하는데, 이러한 과정을 Sweep라고 한다.

 

📍 Minor GC의 동작 방식

Young 영역은 1개의 Eden 영역과 2개의 Survivor 영역, 총 3개의 영역으로 나뉘어진다.

  • Eden 영역(1개) : 새로 생성된 객체가 할당(Allocation)되는 영역
  • Survivor 영역(2개) : 최소 1번의 GC 이상 살아남은 객체가 존재하는 영역

https://inpa.tistory.com/entry/JAVA-%E2%98%95-%EA%B0%80%EB%B9%84%EC%A7%80-%EC%BB%AC%EB%A0%89%EC%85%98GC-%EB%8F%99%EC%9E%91-%EC%9B%90%EB%A6%AC-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%F0%9F%92%AF-%EC%B4%9D%EC%A0%95%EB%A6%AC

 

처리 절차 순서

1. 새로 생성된 객체가 Eden 영역에 할당된다. 두 Survivor 공간 모두 비어있는 상태로 시작된다.

2. 객체가 계속 생성되어 Eden 영역이 꽉차게 되면 Minor GC가 실행된다.

3. Eden 영역에서 사용되지 않는 객체의 메모리는 해제된다.
    Eden 영역에서 살아남은 객체는 1개의 Survivor 영역으로 이동된다.

4. 1~2번의 과정이 반복되다가 Survivor 영역이 가득 차게 되면 Survivor 영역의 살아남은 객체를 다른 Survivor 영역으로 이동시킨다.(1개의 Survivor 영역은 반드시 빈 상태가 된다.)

5. 이러한 과정을 반복하여 계속해서 살아남은 객체(특정 연령 임계값에 도달한 객체)는 Old 영역으로 이동(Promotion)된다.

 

Survivor 영역 중 하나는 반드시 비어 있는 상태로 남아있어야 한다.

만약 두 Survivor 영역에 모두 데이터가 존재하거나, 두 영역 모두 사용량이 0이라면 시스템은 정상적인 상황이 아니라고 생각하면 된다.

 

객체의 생존 횟수를 카운트하기 위해 Minor GC에서 객체가 살아남은 횟수를 의미하는 age를 Object Header에 기록한다. 그리고 Minor GC 때 Object Header에 기록된 age를 보고 Promotion 여부를 결정한다.

https://itkjspo56.tistory.com/285

HotSpot JVM에서는 Eden 영역에 객체를 빠르게 할당(Allocation)하기 위해 bump the pointer와 TLABs(Thread-Local Allocation Buffers)라는 기술을 사용하고 있다.

bump the pointer란 Eden 영역에 마지막으로 할당된 객체의 주소를 캐싱해두는 것이다.

ump the pointer를 통해 새로운 객체를 위해 유효한 메모리를 탐색할 필요 없이 마지막 주소의 다음 주소를 사용하게 함으로써 속도를 높이고 있다. 이를 통해 새로운 객체를 할당할 때 객체의 크기가 Eden 영역에 적합한지만 판별하면 되므로 빠르게 메모리 할당을 할 수 있다.

싱글 쓰레드 환경이라면 문제가 없겠지만 멀티쓰레드 환경이라면 객체를 Eden 영역에 할당할 때 락(Lock)을 걸어 동기화를 해주어야 한다. 멀티 쓰레드 환경에서의 성능 문제를 해결하기 위해 HotSpot JVM은 추가로 TLABs(Thread-Local Allocation Buffers)라는 기술을 도입하게 되었다. TLABs(Thread-Local Allocation Buffers)란 각각의 쓰레드마다 Eden 영역에 객체를 할당하기 위한 주소를 부여함으로써 동기화 작업 없이 빠르게 메모리를 할당하도록 하는 기술이다. 각각의 쓰레드는 자신이 갖는 주소에만 객체를 할당함으로써 동기화 없이 bump the poitner를 통해 빠르게 객체를 할당하도록 하고 있다.

📍 Major GC의 동작 방식

Young 영역에서 오래 살아남은 객체는 Old 영역으로 Promotion됨을 확인할 수 있었다. 그리고 Major GC는 객체들이 계속 Promotion되어 Old 영역의 메모리가 부족해지면 발생하게 된다. Young 영역은 일반적으로 Old 영역보다 크키가 작기 때문에 GC가 보통 0.5초에서 1초 사이에 끝난다. 그렇기 때문에 Minor GC는 애플리케이션에 크게 영향을 주지 않는다. 하지만 Old 영역은 Young 영역보다 크며 Young 영역을 참조할 수도 있다. 그렇기 때문에 Major GC는 일반적으로 Minor GC보다 시간이 오래걸리며, 10배 이상의 시간을 사용한다. 참고로 Young 영역과 Old 영역을 동시하 처리하는 GC는 Full GC라고 한다.

방식으로는 Serial GC, Parallel GC, Parallel Old GC(Parallel Compacting GC), Concurrent Mark & Sweep GC(이하 CMS), G1(Garbage First) GC 등이 있다.

 

📍 Minor GC vs Major GC

https://itkjspo56.tistory.com/285

 

 

 

 

 

 

 

 

 

 

References :

https://ko.wikipedia.org/wiki/%EC%93%B0%EB%A0%88%EA%B8%B0_%EC%88%98%EC%A7%91_(%EC%BB%B4%ED%93%A8%ED%84%B0_%EA%B3%BC%ED%95%99)

https://mangkyu.tistory.com/118

https://d2.naver.com/helloworld/1329

https://www.oracle.com/webfolder/technetwork/tutorials/obe/java/gc01/index.html

https://inpa.tistory.com/entry/JAVA-%E2%98%95-%EA%B0%80%EB%B9%84%EC%A7%80-%EC%BB%AC%EB%A0%89%EC%85%98GC-%EB%8F%99%EC%9E%91-%EC%9B%90%EB%A6%AC-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%F0%9F%92%AF-%EC%B4%9D%EC%A0%95%EB%A6%AC

https://hbase.tistory.com/209

'TIL(Today I Learned)' 카테고리의 다른 글

TIL-231102(동기와 비동기)  (1) 2023.11.02
TIL-231101(HTTP Status Code)  (0) 2023.11.01
TIL-231030(HTTP Method)  (0) 2023.10.30
TIL-231028(Spring Framework)  (0) 2023.10.28
TIL-231027(WAS, WS)  (0) 2023.10.27