해당 포스트의 작성 목적
기본자료형과 참조자료형의 차이점에 대해서, 메모리에 어떻게 저장되는지에 대한 차이를 공부하다가, JVM에 대한 전반적인 이해가 필요하다는 결론에 이르렀다.
단순히 스택메모리, 힙메모리에 저장된다. 라는 단편적인 지식말고, 해당 메모리들이 JVM에서 어떻게 사용되고, 위치하는지에 대해서 알아보자.
JVM
JVM이란 Java Virtual Machine, 자바 가상 머신의 약자를 따서 줄여부르는 용어이다.
가상머신이란 : 프로그램을 실행하기 위해 물리적 머신과 유산 머신을 소프트웨어로 구현한 것이다.
JVM의 역할은 자바 애플리케이션을 클래스 로더를 통해 읽어 들여 자바API와 함께 실행하는 것이다.
JVM은 Java와 OS사이에서 중개자 역할을 수행하여 Java가 OS에 구애 받지 않고 재사용을 가능하게 해준다. 가장 중요한 메모리관리, GC를 수행한다. 그리고 JVM은 스택기반의 가상머신이다. ARM아키텍처 같은 하드웨어는 레지스터 기반으로 동작하는데 비해 JVM은 스택기반으로 동작한다.
자바프로그램 실행 과정
- 프로그램이 실행되면 JVM은 OS로부터 이 프로그램이 필요로 하는 메모리를 할당(Runtime Data Area)받는다. JVM은 이 메모리를 용도에 따라 여러 영역으로 나누어 관리한다.
- 자바 컴파일러(javac)가 자바소스코드(.java)를 읽어들여 자바 바이트코드(.class)파일로 변환
- 바이트코드란 : 0과1로 이루어진 파일을 바이너리 파일이라고 칭한다. 이때 JVM이 이해할 수 있는 바이너리파일을 바이트코드라 칭한다. 기계어 역시 0과1로 이루어져있으나, JVM이 아닌 OS가 이해할 수있는 바이너리파일이다.
- Class Loader를 통해 class파일들을 JVM으로 로딩한다.
- 로딩된 class파일들은 Excution engine을 통해 해석된다.
- 해석된 바이트코드는 RuntimeDataAreas에 배치되어 실질적인 수행이 이루어진다. 이런 실행과정에서 JVM은 필요에 따라 Thread Synchronization과 GC같은 관리작업을 수행한다.
JVM 구성
Class Loader(클래스 로더)
JVM내로 클래스파일을 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이다. Runtime시에 동적으로 클래스를 로드한다. jar파일 내 저장된 클래스들을 JVM위에 탑재하고 사용하지 않는 클래스들은 메모리에서 삭제한다. (컴파일러 역할) 자바는 동적코드, 컴파일 타임이 아니라 런타임에 참조한다. 즉 , 클래스를 처음으로 참조할 때, 해당 클래스를 로드하고 링크한다는 것이다. 그 역할을 클래스 로더가 수행한다.
- 클래스 로더 세부 동작
- 로드 : 클래스 파일을 가져와서 JVM의 메모리에 로드한다.
- 검증 : 자바 언어 명세(Java Language Specification) 및 JVM 명세에 명시된 대로 구성되어 있는지 검사한다.
- 준비 : 클래스가 필요로 하는 메모리를 할당(필드, 메서드, 인터페이스 등등)
- 분석 : 클래스의 상수 풀 내 모든 심볼릭 레퍼런스를 다이렉트 레퍼런스로 변경한다. 즉, 실제 메모리 주소 값으로 변경해 주는 작업을 의미
- 초기화 : 클래스 변수들은 적절한 값으로 초기화한다.(static 필드)
- 클래스 로더는 .class 파일을 읽어 바이트 코드를 메소드 영역(Method Area)에 저장한다.
Execution Engine(실행 엔진)
클래스를 실행시키는 역할이다. 클래스 로더가 JVM내의 런타임 데이터 영역에 바이트코드를 배치시키고, 이것은 실행엔진에 의해 실행된다. 자바 바이트코드는 기계가 바로 수행할 수 있는 언어보다는 비교적 인간이 보기 편한 형태로 기술된 것이다. 그래서 실행 엔진은 바이트코드를 실제로 JVM내부에서 기계가 실행할 수 있는 형태로 변경한다. (바이트코드를 네이티브언어로 변경함!!)
Interpreter(인터프리터)
실행 엔진은 자바 바이트코드를 명령어 단위로 읽어서 실행한다. 이 방식은 인터프리터 언어의 단점을 그대로 갖고 있다. 한 줄 씩 수행하기 때문에 느리다는 것이다.
JIT(Just-In-Time)
Interpreter의 단점을 보완하기위해 도입된 JIT컴파일러다. 인터프리터 방식으로 실행하다가, 적절한 시점에 바이트코드 전체를 컴파일하여 네이티브 코드로 변경, 이후에는 더이상 인터프리팅 하지 않고 네이티브 코드로 직접 실행하는 방식이다. 네이티브 코드는 캐시에 보관하기 때문에 한번 컴파일된 코드는 빠르게 수행된다. 물론 JIT컴파일러가 컴파일하는 과정은 인터프리팅 과정보다 훨씬 오래 걸리므로, 한번 만 실행되는 코드라면 컴파일하지 않고, 인터프리팅 하는 것이 유리하다. 다라서 JIT컴파일러를 사용하는 JVM들은 내부적으로 해당매서드가 얼마나 자주 수행되는지 체크하고, 일정 정도를 넘을 때에만 컴파일을 수행한다.
Garbage Collector
GC를 수행하는 모듈(쓰레드)이 있다.
Runtime Data Area
프로그램을 수행하기 위해 OS에서 할당 받은 메모리 공간
PC Register
Thread가 시작될 때 생성되는 공간으로 스레드마다 하나씩 존재한다.
스레드가 어떤 부분을 어떤 명령으로 실행해야할 지에 대한 기록을 하는 부분으로 현재 수행중인 JVM 명령의 주소를 갖는다.
static 변수는 Method Area의 Class Variable에 저장
기본형이 아닌 static 클래스형 변수는 레퍼런스 변수만 저장되고 실제 인스턴스는 Heap에 저장되어 있다. 그 후 이 인스턴스의 변수를 저장하기 위해 Heap에 메모리가 확보가 되고 Heap의 인스턴스가 Method Area의 어느 클래스 정보와 연결되는지 설정 하게 된다.
static 변수는 Method Area의 Class Variable에 저장
기본형이 아닌 static 클래스형 변수는 레퍼런스 변수만 저장되고 실제 인스턴스는 Heap에 저장되어 있다. 그 후 이 인스턴스의 변수를 저장하기 위해 Heap에 메모리가 확보가 되고 Heap의 인스턴스가 Method Area의 어느 클래스 정보와 연결되는지 설정 하게 된다.
- Thread
- 어떤 프로그램내에서 특히 프로세스 내에서 실행되는 흐름의 단위
- 프로세스 내의 명령어 블록을 시작점과 종료점을 가진다.
- 실행중에 멈출 수 있으며 동시에 수행 가능
- 어떠한 프로그램내에서 특히 프로세스 내에서 실행되는 흐름의 단위
- 메인스레드
- 자바 애플리케이션은 메인스레드가 main 메소드를 실행하면서 시작
- 프로세스
- OS에서는 실행 중인 하나의 애플리케이션을 프로세스라 칭한다.
- OS로부터 실행에 필요한 메모리를 할당받아 애플리케이션의 코드를 실행(=자바 애플리케이션) (여기서 할당받는 메모리가 곧 런타임 데이터 영역인듯 하다!)
- 멀티프로세스
- 서로 독립적, 하나의 프로세스에서 오류가 발생하더라도, 다른 프로세스에 영향을 끼치지 않는다.
- 멀티스레드
- 하나의 프로세스 내부에 존재하기 때문에 하나의 스레드가 예외를 던지면 프로세스 하나가 멈출수 있다. 예외처리 필수!!
JVM 스택영역
프로그램 실행과정에서 임시로 할당되었다가, 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역, 각종 형태의 변수나 임시 데이터, 스레드나 메소드의 정보를 저장한다.
메소드 호출 시마다 각각의 스택프레임( 그 메소드만들 위한 공간) 이 생성된다. 메소드 수행이 끝나면 프레임 별로 삭제를 한다. 메소드 안에서 사용되는 값들(로컬변수)을 저장한다. 또 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장한다.
Native Method Stack
컴파일된 바이트코드가 아니라, 실제 실행될수 있는 기계어로 작성된 프로그램을 실행 시키는 영역이다. Java가 아닌, 다른 언어로 작성된 코드를 위한 공간이다. Java native Inteface를 통해 바이트 코드로 전환하여 저장하게 된다. 일반 프로그램처럼 커널이 스택을 잡아 독자적으로 프로그램을 실행시키는 영역이다. 이부분을 통해 C code를 실행시켜 Kernel에 접근 할 수있다.
Method Area(=Class area = Static area)
클래스 정보를 처음 메모리 공간에 올릴 때 초기화되는 대상을 저장하기 위한 메모리 공간, 올라가게 되는 메소드의 바이트 코드는 프로그램의 흐름을 구성하는 바이트 코드이다. 자바 프로그램은 main메소드의 호출에서부터 계속된 메소드의 호출로 흐름을 이어가기 때문이다. 대부분 인스턴스의 생성도 메소드 내에서 명령하고 호출한다. 사실 상 컴파일 된 바이트코드의 대부분이 메소드 바이트코드이기 때문에 거의 모든 바이트코드가 올라간다고 봐도 상관없다. 이 공간에는 Runtime Constant Pool이라는 별도의 관리 영역도 함께 존재한다. 이는 상수 자료형을 저장해 참조하고 중복을 막는 역할을 수행한다.
- 올라가는 정보의 종류
- Field Information : 멤버변수의 이름, 데이터 타입, 접근 제어자에 대한 정보
- Method Information : 메소드의 이름, 리턴타입, 매개변수, 접근 제어자에 대한 정보
- Type Information : class인지, interface인지 여부 저장/ Type의 속성, 전체이름, super class의 전체 이름 (interface이거나 object인 경우 제외)
Heap(힙 영역)
객체를 저장하는 가상 메모리 공간이다. new연산자로 생성된 객체와 배열을 저장한다. 물론 class area영역에 올라온 클래스들만 객체로 생성할 수 있다.
- PermanentGeneration생성된 객체들의 정보의 주소값이 저장된 공간이다. Class Loader에 의해 load되는 Class, Method 등에 대한 Meta정보가 저장되는 영역이고 JVM에 의해 사용된다. Reflection을 사용해 동적으로 클래스가 로딩되는 경우에 사용된다. 내부적으로 Reflection 기능을 자주 사용하는 SpringFramework를 이용할 경우 이영역에 대한 고려가 필요하다.
-
💡Java8 이후로는 MetaSpace로 대체되었으며 더이상 heap영역이 아니다.
- New/Youn 영역
- Eden : 객체들이 최초로 생성되는 공간
- Survivor 0/1 :Eden에서 참조되는 객체들이 저장되는 공간
- Old영역
- New area에서 일정 시간 참조되고 있는, 살아남은 객체들이 저장되는 공간, Eden영역에 객체가 가득차게 되면 첫번째 GC(minorGC)가 발생한다. Eden영역에 있는 값들을 Survivor 1영역에 복사하고 이 영역을 제외한 나머지 영역의 객체를 삭제한다.
- 인스턴스는 소멸 방법과 소멸시점이 지역 변수와는 다르기에 힙이라는 별도의 영역에 할당된다. JVM은 매우 합리적으로 인스턴스를 소멸시킨다. 더이상 인스턴스 존재의 이유가 없을 때 소멸 시킨다.
포스트를 작성하면 알게된점
단순히 힙메모리와 스택메모리의 차이점 뿐 아니라, 자바가 컴파일이 되는 과정, 그리고 클래스를 읽어서 실제 메모리에 적재되기까지의 과정을 알게되었다.References
자바 메모리 관리 - 스택 & 힙가비지콜렉션 /JVM구동에 이어서Java Garbage Collection - https://d2.naver.com/helloworld/1329
- https://asfirstalways.tistory.com/159
- https://yaboong.github.io/java/2018/05/26/java-memory-management/
- 특히 단순히 스택메모리와 힙 메모리를 알아보려 했는데, 클래스정보, 스태틱 및 상수들이 올라가는 메소드영역도 알게되었고, 메소드 영역에 스태틱 변수가 저장됨으로써 GC가 접근하지 못해 메모리 릭이 발생할 수있다는 사실도 깨달았다. 특히 그림으로 보게되니, 참조자료형 객체들의 주소값을 할당한다. 라는 문구가 더 정확히 이해가 되었다.
'프로그래밍 > Java' 카테고리의 다른 글
GC Log보는 방법 (0) | 2021.05.13 |
---|---|
클래스 안의 클래스-1 (0) | 2021.05.13 |
String의 == 연산시 동작 (0) | 2021.05.13 |
equals() 와 == (0) | 2021.05.12 |
Buffer VS Cache (0) | 2021.05.12 |
Uploaded by Notion2Tistory v1.1.0